2014年10月28日,由中國工程院、美國國家工程院、EMC公司、VMware公司、浪潮集團及聯(lián)想集團共同舉辦的以云計算和大數據為主題的IT行業(yè)學(xué)術(shù)研討會(huì )——IT 2020高端論壇在京舉行,此次論壇聚焦未來(lái)數年內影響中國乃至全球行業(yè)和經(jīng)濟發(fā)展的大數據、云計算和新興IT趨勢,來(lái)自中國、美國及全球各地的學(xué)術(shù)界和產(chǎn)業(yè)界的領(lǐng)導者及專(zhuān)家學(xué)者參與了此次盛會(huì )。
IT 2020高端論壇上,在醫療行業(yè)具有權威話(huà)語(yǔ)權的中南大學(xué)湘雅醫院副院長(cháng)胡建中,為大家帶來(lái)《醫療大數據的思考與探索》的主題演講,用實(shí)際案例生動(dòng)的講述了湘雅的大數據之路,以下是演講實(shí)錄:
胡建中:各位專(zhuān)家,各位來(lái)賓,大家下午好!我叫胡建中,來(lái)自湖南中南大學(xué)湘雅醫院,我是外科大夫。我們校長(cháng)帶領(lǐng)團隊在百年湘雅基礎上,做了醫療大數據探索和思考,今天在這里,我把我的團隊做了一些工作,給各位專(zhuān)家和領(lǐng)導做一個(gè)簡(jiǎn)要的匯報。
我從以下四個(gè)方面就我們對大數據的考慮一些行動(dòng)簡(jiǎn)要匯報一下。首先談?wù)剣鴥韧庥嘘P(guān)醫療大數據的有關(guān)工作,其實(shí)走到今天,大數據目前最大的問(wèn)題,所有的這些數據經(jīng)過(guò)百年歷史走過(guò)來(lái),這些數據封閉在自己的家里,怎么樣把這些數據分別拿出來(lái)應用,這是數據財富所在。今年6月,美國FDA開(kāi)放了數據庫,供有條件的人士使用,谷歌也起動(dòng)用相關(guān)項目,對疾病預防防治,英國、德國發(fā)達國家過(guò)來(lái)也在做這樣的工作。醫療軟件公司搜集了全美范圍內專(zhuān)家,進(jìn)行癌癥機理進(jìn)行分析,希望找到治療癌癥條件。
醫療整個(gè)過(guò)程總結起來(lái),對疾病發(fā)生發(fā)展進(jìn)行預測。我們國家醫療大數據的探索,起步時(shí)間不長(cháng),沒(méi)有現成的數據。我們國家上世紀90年代醫療在自主發(fā)展情況下一步一步去做,今天為止形成這樣的狀態(tài),采用不同的數據結構,形成不同的數據模式,很難把數據拿出來(lái)共享和協(xié)同服務(wù),所以有一個(gè)條塊分割。這些系統和采用系統采用不同標準,也是不同的建設模式,在這種情況下可能導至我們廣大的病患以及健康數據隱私保護。像上午有專(zhuān)家提出來(lái),可能有大量保護沒(méi)有得到很好的機制。最重要的是,互聯(lián)網(wǎng)、可穿戴技術(shù)、大數據發(fā)展到今天,醫療數據的應用和使用,還缺乏一個(gè)大數據的思維。我們還在按照醫學(xué)走到今天,我們走的是群眾醫學(xué)的路徑,我們必須每個(gè)病癥要發(fā)生一個(gè)證據,證明這一點(diǎn),不斷地進(jìn)行推演來(lái)證明我的診斷、我的治療方式是正確的。醫生是依據整個(gè)在學(xué)習過(guò)程中間,人類(lèi)對疾病的認識所積累的經(jīng)驗,以及它本人在這個(gè)行醫的一輩子中間所積累的經(jīng)驗,來(lái)進(jìn)行綜合分析和判斷,對一個(gè)疾病進(jìn)行診斷以及拿出治療方案,然后治療過(guò)程當中,不斷地更新它的治療手段。
大數據的今天,很有可能這種技術(shù)產(chǎn)生要顛覆醫療模式,這是很多專(zhuān)家曾經(jīng)談到,我們也在進(jìn)行探索的一個(gè)工作。我們的國家已經(jīng)明確地提出來(lái)了,醫療的信息化是我們的建設重點(diǎn),我們要以認可信息、電子病例、電子健康檔案三大數據庫為基礎,提供通用平臺,提供六大項醫療衛生保障服務(wù),同時(shí)把標準體系建設、數據安全作為重點(diǎn)工作來(lái)做。湘雅和中南大學(xué)、教育部、衛計委支持下,做了大數據應用到工作當中嘗試。我們這個(gè)項目基于云計算、透明計算的技術(shù),基于跨區域、跨醫院全流程的醫療數據的數據咨詢(xún)建議,基于這樣一種目標,第一期建設希望建設輻射到湖南省,以及周邊地區。它的健康受眾和病人范圍,大概應該接近于1800萬(wàn)人口,不是所有病人,病人人口。目前,上網(wǎng)醫院有11家,第一期主要面對的服務(wù)對象是我們的病人受眾和我們的大夫、醫生,以及醫院,提供一些基于大數據的服務(wù)。
同時(shí),在這種建設的情況下,我們試圖去解決兩個(gè)對于醫學(xué)信息、醫療數據很關(guān)鍵的問(wèn)題,一個(gè)是各個(gè)醫院、各個(gè)區域之間,各個(gè)系統的數據,解決醫療過(guò)程中間電子病例文檔,自然書(shū)寫(xiě)語(yǔ)言,醫學(xué)影像這些非結構化數據,怎么樣結構化,得到我們的挖掘、利用。利用大數據服務(wù)平臺,我們能夠綜合到全流程、全數據的基礎上,我們能夠為我們的社會(huì )提供一些什么樣的服務(wù)呢?這張PPT能夠看到一些端倪,在面對個(gè)體的病人,能夠提供更加精準個(gè)性化服務(wù),對于整個(gè)人生健康狀況管理起來(lái),能夠在目前狀況下,醫療資源相對稀缺,大量人口面對得救醫狀況下,能夠更快就醫,同時(shí)醫療機構,我們的醫務(wù)人員,能夠不斷地提高它的診斷能力,提高我們的診斷標準,并且不斷地更新它的治療方案。對于我們的國家衛生行政部門(mén),它能夠更好地了解預期人口健康的狀況,以及對費用的控制,同時(shí)不言而喻的科研機構,藥品、研發(fā)部門(mén)、經(jīng)營(yíng)機構、保險機構,以及智能可穿戴供應商,都會(huì )利用這個(gè)平臺做進(jìn)一步工作,開(kāi)發(fā)他們的產(chǎn)品,做好他們的工作。
這一點(diǎn)醫療大數據能夠形成的話(huà),第一具有非常大的社會(huì )價(jià)值,我們國家有接近15億巨大人口,相對于全球醫療資源配備來(lái)說(shuō),相對優(yōu)質(zhì)醫療是稀缺的,怎么樣能夠把國家這些好的資源,能夠更好地服務(wù)于老百姓,服務(wù)于廣大人民群眾,大數據把所有的資源整合起來(lái),在這個(gè)平臺上提供優(yōu)質(zhì)、便捷、高質(zhì)量服務(wù),可能通過(guò)目前手段,解決目前看病難、看病貴的難題。同時(shí)利用大數據,有可能使醫學(xué)、科學(xué)發(fā)展,在疾病的預防、診斷治療和研究水平提高到一個(gè)更高的高度。同時(shí),像上一張片子所敘述的,醫療大數據的建設和形成,有可能拉動(dòng)整個(gè)行業(yè)發(fā)展,這些行業(yè)是圍繞醫療大數據、發(fā)掘運用大數據形成產(chǎn)業(yè)。這些大數據建設,對于整個(gè)社會(huì )經(jīng)濟和發(fā)展,不言而喻具有巨大的推動(dòng)力。
根據目前公開(kāi)的資料,我們國家到2020年健康產(chǎn)業(yè)市場(chǎng)發(fā)展8萬(wàn)億人民幣規模,到那個(gè)時(shí)候,現在我們關(guān)于在醫院病人治療費用,占到整個(gè)健康產(chǎn)業(yè)75%,當我們預計到2020年,在醫院治療費用降到35%的水平,其他65%的水平,都會(huì )在醫院之外產(chǎn)生,這是對我們整個(gè)社會(huì )經(jīng)濟科學(xué)發(fā)展,都是巨大的、潛在的市場(chǎng)和推動(dòng)力。湖南地區為例,兩萬(wàn)家基本醫療機構,我們假設有600萬(wàn)的慢性患者,1800萬(wàn)需要利用我們的數據。湖南在智能醫療、慢性病管理、醫藥研發(fā)、個(gè)性化醫療、其他網(wǎng)絡(luò )、可穿戴設備,將形成兩百億市場(chǎng),針對全國來(lái)說(shuō)更加不言而喻,我們國家現有的醫療機構的基礎上,我們能夠產(chǎn)生一個(gè)巨大的自費醫療決策支持服務(wù)的市場(chǎng)。
慢性病管理,這應該是大數據、區域醫療所面臨的一個(gè)非常有效的管理知識,能夠降低醫療的成本,能夠擴大一個(gè)更大的市場(chǎng)。目前我們國家有2.6億的慢性病病人,他們占到整個(gè)目前醫療資源70%花費。在未來(lái)可以預見(jiàn)這些內,整個(gè)互聯(lián)網(wǎng)、移動(dòng)可穿戴、醫療大數據結合,拉動(dòng)和產(chǎn)生巨大的市場(chǎng),這些市場(chǎng)工具,以糖尿病為例,可能達到2000億規模,同時(shí)運用大數據能夠加快藥物的研發(fā)。下面這張圖能夠明確地看到,在全球范圍內,真正應用于臨床藥物的開(kāi)發(fā)、研究,是一個(gè)漫長(cháng)而復雜的過(guò)程,因為我們的研究都是基于小樣本抽樣調查進(jìn)行一步一步演算和推算,大樣本原樣推送到目前的數據機構,很有可能能夠加快藥物研發(fā)的進(jìn)程,使這些投入更快地服務(wù)于人類(lèi),有益于我們健康事業(yè)的發(fā)展。
公共衛生醫療大數據應用不言而喻,公共衛生預期、公共衛生狀況、基本藥物運用、保險費用能夠及時(shí)地展現出來(lái),特別是我們展望的基于自己的基因、家族史、DNA不同,使用不同的藥物,像高血壓,像治感冒,我可能吃白加黑,可能吃泰勒,可能產(chǎn)生不同效果,需要每個(gè)個(gè)體不同情況產(chǎn)生不同的應用。
湘雅大數據目前在做的工作,平臺架構,左邊是數據采集提供商,包括醫院、醫療診所、智能可穿戴設備各個(gè)用戶(hù)或者個(gè)體怎么應用,移動(dòng)互聯(lián)網(wǎng)大數據怎么形成,端對端做起來(lái),形成這樣服務(wù)。采集端、數據形成、處理、加工,同時(shí)云平臺上會(huì )提供面對病人、醫生,以及面對所有要使用醫療數據需要者的服務(wù)。
這張PPT是使用云平臺目前很多技術(shù)進(jìn)行構造和建設。同時(shí)大數據運用了知識圖譜,兩百多種結構化的資料指南,四萬(wàn)多種疾病癥狀描述,以及接近5萬(wàn)種診斷的標準,和接近三千多種實(shí)驗室檢查的標準結果、正常結果、兩千多種手術(shù)治療方案,18000多種對于疾病藥物治療方案,到疾病治療中心。利用圖譜技術(shù),關(guān)聯(lián)計算,快速搜索方法,為智能診斷提供一些基礎。
下面這張圖是我們對于非結構化的醫學(xué)影像投入,研究、實(shí)施中心,能夠做到我們的機器能夠自動(dòng)識別,在我們的圖像中間出現得異常部分,跟我們以往的異常圖像進(jìn)行比對,得出診斷。最不能忘掉的是數據安全,上午已經(jīng)有人談到這個(gè)問(wèn)題。為什么全球、醫院,甚至美國,全球數據,保留系統中間,各個(gè)系統之間的交流,隱私數據安全擺在第一位,在座的每一位,包括站在這里的我,不希望我的健康數據變成網(wǎng)絡(luò )上公開(kāi)的東西,怎么去保護,目前能夠做,我們建設湘雅大數據同時(shí),考慮到個(gè)人隱私保護。數據到了中心以后,在云平臺上,對于個(gè)人隱私的保護,數據加密以后,對于數據系統外的安全問(wèn)題,總體來(lái)說(shuō)采用角色訪(fǎng)問(wèn)控制,安全技術(shù)運用目前市場(chǎng)上成熟的應用的技術(shù),應用到這里面來(lái)。
前期基于IT技術(shù)發(fā)展和一些理念,我們在湘雅、湖南做了一些探索,在這里有一些案例,給各位做簡(jiǎn)要報告。首先我們這些探索,在做湘雅大數據建設同時(shí),推出一些應用,首先是面對我們的病人,面對我們的醫生,我們希望利用大數據,能夠給我們的患者提供便捷的醫療服務(wù),不要像去大醫院,有長(cháng)長(cháng)的排隊、擁擠的人群、掛號多么難。我們面對病人和大夫,做了一部分工作,同時(shí)把數據歸攏了以后,進(jìn)行梳理、開(kāi)發(fā),變成中心數據以后,可以協(xié)助科研人員,能夠快速地像互聯(lián)網(wǎng)上面,搜索我所需要的資訊一樣,搜索我需要的醫學(xué)資源進(jìn)行研究。
我們利用機器學(xué)習知識圖譜這些技術(shù),讓智能診斷,也就是機器診斷,讓電腦也變成一個(gè)醫生,我們也在做一些工作。首先我展示的一款是在我的醫院開(kāi)始應用的一款簡(jiǎn)單的面對病人的APP,這款APP里面能夠智能分組,能夠用手機掛號,能夠取報告單,能夠咨詢(xún)大夫,能夠在網(wǎng)上進(jìn)行支付,同時(shí)在數據庫里面,還有與健康有關(guān)的數據庫進(jìn)行應用。如果感覺(jué)身體某一個(gè)部位的不適,可以在我的圖片上點(diǎn)擊,咽部不適、喉嚨痛,有部位定位,我的系統會(huì )自動(dòng)地告訴你,這個(gè)部位疼痛是咽部不適。我是老百姓,沒(méi)有很好的醫學(xué)知識。到醫院就診掛號,系統告訴你,你可能是咽痛,吞咽不好,是還是不是,可能犯的是咽驗。得了咽炎,要到醫院看病,系統告訴你應該看耳鼻咽喉科,這個(gè)醫院里哪個(gè)教授最能看這種病,自動(dòng)告訴你應該看這個(gè)教授,手機上能夠掛上號,醫院自動(dòng)排隊。哪天某個(gè)時(shí)間段告訴大夫,大夫在那里等著(zhù)。很明確掛號、做,提示你掛號成功,回去進(jìn)行掛號,掛號做完檢查以后,檢驗結果自動(dòng)推送到移動(dòng)終端上面來(lái)。這是利用大數據、數據繼承做的一款應用,目的為了方便病人快速就醫,減少排隊、時(shí)間浪費。
通過(guò)IT設備的溝通,能夠得到醫生咨詢(xún),中國還沒(méi)有開(kāi)始,希望慢慢通過(guò)大數據走到這個(gè)環(huán)節。我們建筑一個(gè)建筑連體28萬(wàn)平方米,里面很難走,我們利用數據功能,給患者進(jìn)入以后去導航,能夠很自動(dòng)地出發(fā),站在某個(gè)點(diǎn),到哪里去,告訴你,前面圖像是怎么樣,怎么去走路。這個(gè)系統里面能夠提供相關(guān)的、健康的知識,如果有興趣可以點(diǎn)擊看,同時(shí)獲得相關(guān)疾病知識。如果有咽痛有很多咽痛相關(guān)知識,少抽煙、喝酒,少高聲唱歌,能夠保護咽部。很多數據庫,數據中心能夠隨意搜索到病情,推送服務(wù)。
數據開(kāi)放完成以后,能給醫務(wù)人員干什么,如果做過(guò)體驗,所有數據提供到你面前,系統為你的健康狀況做評估,告訴你的健康狀態(tài)是健康狀態(tài)、亞健康狀態(tài)還是疾病狀態(tài)。我們也同樣提供患者與醫生之間的互動(dòng)咨詢(xún),和院后慢性病管理,這張PPT展示了通過(guò)移動(dòng)互聯(lián)網(wǎng)、智能可穿戴設備,數據傳上系統以后,跟大夫能夠可看見(jiàn)、可咨詢(xún)、可指示,構成了一個(gè)患者和醫生之間的閉環(huán),使互聯(lián)網(wǎng)、移動(dòng)智能設備在醫療行業(yè)的應用得以實(shí)現。這是科研,醫學(xué)科研,抽樣調查,樣本分析,大量的樣本調查以后形成大樣本調查,大數據、全數據給我們全樣本的調查研究提供這樣的可能。大數據就是把整個(gè)在這個(gè)區域范圍之內,在某個(gè)時(shí)間之內,疾病的狀態(tài)是完整地推送到你們面前。所以我們試圖在這個(gè)數據運用移動(dòng)互聯(lián)觀(guān)念,給醫生提供一個(gè)檢查檢驗方便平臺,這個(gè)平臺是高級智能的搜索,這個(gè)界面像谷歌通過(guò)互聯(lián)網(wǎng)搜索任何需要關(guān)鍵詞,搜胡建中名字,在系統里與我有關(guān)的任何條款都會(huì )集中起來(lái)。同時(shí)我們有高級搜索,你把所需要的關(guān)鍵詞盡可能限定范圍、研究熱點(diǎn),得到資料,快捷地完成研究。
同時(shí),我們能夠對患者群在醫院之間進(jìn)行協(xié)同的管理,把這些患者去管理好,同時(shí)也能夠進(jìn)行統計信息的分析,這張圖基于我們前面那么多種醫療資源的整合,我們根據指數,根據系統里各種數據整合,由機器得出可能的手段,這個(gè)診斷出來(lái)以后,會(huì )提示進(jìn)一步做哪些檢查,檢查的數據再次整合以后,得出下一個(gè)診斷。同時(shí)根據數據庫里面幾十年、上百年、上萬(wàn)個(gè)醫生的經(jīng)驗,治療的方式,給一個(gè)治療的提示。所以這一點(diǎn)是我們做的智能輔助診斷探索。這是使用界面,一個(gè)人輸進(jìn)來(lái),告訴你他的癥狀,他有什么不舒服,電腦告訴你可能是哪一類(lèi)疾病,進(jìn)一步輸癥狀,醫生檢查結果輸進(jìn)去以后,縮小范圍,進(jìn)一步告訴你有可能是什么樣的診斷,這一塊不但輔助診斷,對于年輕醫生培訓和學(xué)習是非常好的結果。
在我的講話(huà)最后,拿這樣一張圖,講述我們醫療大數據可能發(fā)生的事情。首先,我們的大數據來(lái)自于什么地方,來(lái)自于醫院,這是醫療數據最大的來(lái)源,不但有在我們今天無(wú)時(shí)無(wú)刻新產(chǎn)生的數據,還有整個(gè)醫學(xué)社會(huì )現在沉睡在各個(gè)醫院數據庫里大量的、海量的數據,這些數據能夠為我們的病人、大夫提供很多醫療服務(wù),這些服務(wù)由病人來(lái)診斷。同時(shí)可能是這些人拿著(zhù)這些數據進(jìn)行研究,同時(shí)為醫院、醫療機構管理和改善服務(wù)提供很多服務(wù),BI能夠做到這一點(diǎn)。同時(shí)我們國家行政管理部門(mén)和衛生發(fā)展,醫療行業(yè)是非常好的應用。大數據的產(chǎn)生是智能可穿戴設備和醫院之間通過(guò)移動(dòng)互聯(lián)方式連接起來(lái),構成云醫院、網(wǎng)上醫院的可能性很大。這些數據上傳數據中心,數據主動(dòng)提供給醫生面前,離開(kāi)醫院,搬到醫院之外,互聯(lián)網(wǎng)上的醫院。
互聯(lián)網(wǎng)上所有數據能夠進(jìn)入我們的平臺,互聯(lián)網(wǎng)大家貢獻結果,產(chǎn)生結果,數據中間加以分析利用,對于整個(gè)醫療事業(yè)發(fā)展提供方向。更加與醫療健康相關(guān)的企業(yè)、產(chǎn)業(yè)和市場(chǎng),會(huì )得到更好的發(fā)展,像醫療機械的這些公司,藥品研發(fā)開(kāi)發(fā)部門(mén),醫學(xué)、科學(xué)的研發(fā)機構,以及健康保險相關(guān)機構,他們能夠在這個(gè)中間得到、了解狀況,發(fā)展產(chǎn)業(yè)。
在這個(gè)外圍,波及到互聯(lián)網(wǎng)所有生活,涉及到食品安全、水的安全,就像銀行里面應該向哪部分去投,第三方開(kāi)發(fā)者提供的云平臺,能夠任意地開(kāi)發(fā)運用。同時(shí)資本市場(chǎng)的走向,在這個(gè)中間少不了網(wǎng)絡(luò )、電信、媒體的支持和幫助。這由于大數據給我們展現的未來(lái),特別是在健康方面展現的未來(lái)。我的演講到這里,謝謝大家!
關(guān)于IT 2020:
IT 2020高端論壇是由中國工程院、美國國家工程院、EMC公司、VMware公司、浪潮集團及聯(lián)想集團共同舉辦的一場(chǎng)僅面向受邀人員的世界級的高端論壇。論壇聚焦未來(lái)數年內影響中國乃至全球行業(yè)和經(jīng)濟發(fā)展的大數據、云計算和新興IT趨勢。來(lái)自中國、美國及全球各地的學(xué)術(shù)界和產(chǎn)業(yè)界的領(lǐng)導者及專(zhuān)家學(xué)者都將參與此次盛會(huì )。
本屆論壇將進(jìn)一步探索云計算和大數據的架構、應用和對主要行業(yè)的影響。屆時(shí)中國工程院和美國國家工程院的頂尖科學(xué)家、學(xué)術(shù)界的知名專(zhuān)家以及產(chǎn)業(yè)界著(zhù)名的思想領(lǐng)袖將匯聚一堂,與您共同探討宏觀(guān)IT趨勢的話(huà)題。聚焦云計算和大數據的基礎架構,兩者對中國IT策略、經(jīng)濟發(fā)展和城市可持續化發(fā)展的影響,以及大數據在中國可持續化發(fā)展進(jìn)程中至關(guān)重要的三個(gè)行業(yè)中的應用:醫療、能源變革和綜合交通。