AI新星系列報(bào)道之三|王本友:讓通用醫(yī)療人工智能惠及全球
醫(yī)療人工智能:全球科技紅利與未來(lái)醫(yī)療的希望
與通用人工智能(AGI)類(lèi)似,通用醫(yī)療人工智能(Generalist Medical AI - GMAI)致力于構(gòu)建一個(gè)通用的醫(yī)療基礎(chǔ)模型,該模型無(wú)需依賴(lài)大量任務(wù)特定數(shù)據(jù),僅需少量數(shù)據(jù)即可適配多種醫(yī)療下游任務(wù)。GMAI的應(yīng)用場(chǎng)景廣泛,涵蓋醫(yī)療咨詢(xún)、老人康養(yǎng)陪伴、家庭醫(yī)生、健康管理、醫(yī)生助理、臨床決策支持、醫(yī)療搜索引擎、輔助診斷等。
面對(duì)國(guó)家老齡化趨勢(shì)帶來(lái)的醫(yī)療壓力方面,通用醫(yī)療人工智能展現(xiàn)出巨大潛力。當(dāng)前,國(guó)內(nèi)醫(yī)務(wù)工作者負(fù)擔(dān)沉重,而民眾對(duì)醫(yī)療服務(wù)的期待與日俱增。通用醫(yī)療人工智能的應(yīng)用,有望通過(guò)智能化手段提升效率和質(zhì)量,緩解這一矛盾。
此外,GMAI的普及有望解決醫(yī)療資源分布不均問(wèn)題。通過(guò)人工智能技術(shù)輔助改善落后地區(qū)的醫(yī)療條件,有望使非洲等地區(qū)的居民也能享受到與香港、日本等地相當(dāng)?shù)尼t(yī)療服務(wù),從而促進(jìn)全球人口的醫(yī)療平權(quán)。
?
醫(yī)療大模型的初次嘗試
王教授團(tuán)隊(duì)敏銳地捕捉到醫(yī)療行業(yè)中需求和資源分配的矛盾,將目光投向醫(yī)療領(lǐng)域。王教授指出,許多領(lǐng)域的專(zhuān)家精通某一專(zhuān)業(yè),通常需要上萬(wàn)小時(shí)的實(shí)踐,這種“經(jīng)驗(yàn)積累”對(duì)于人類(lèi)來(lái)說(shuō)是有限的。但大模型卻可以通過(guò)計(jì)算能力和數(shù)據(jù)處理來(lái)“模擬”無(wú)數(shù)小時(shí)的經(jīng)驗(yàn)積累,并實(shí)現(xiàn)知識(shí)的快速迭代。
這種優(yōu)勢(shì)使得大模型在醫(yī)療等領(lǐng)域的應(yīng)用前景廣闊。它能夠快速處理和分析海量數(shù)據(jù),為醫(yī)生和患者提供更精準(zhǔn)的決策支持。2023年2月,王教授團(tuán)隊(duì)在深圳市大數(shù)據(jù)研究院和香港中文大學(xué)(深圳)的支持下,發(fā)布了全球首個(gè)垂直領(lǐng)域類(lèi)ChatGPT大模型——華佗GPT。香港中文大學(xué)(深圳)副校長(zhǎng)羅智泉院士在中華醫(yī)院信息網(wǎng)絡(luò)大會(huì)(CHINC)上正式發(fā)布這一成果,在國(guó)內(nèi)外引起強(qiáng)烈反響,標(biāo)志著醫(yī)療領(lǐng)域大模型應(yīng)用的序幕正式拉開(kāi)。
?
醫(yī)療大模型的技術(shù)探索
華佗大模型以其技術(shù)創(chuàng)新和卓越表現(xiàn)成為醫(yī)療AI領(lǐng)域的標(biāo)桿。這些技術(shù)優(yōu)勢(shì)不僅重塑了醫(yī)療AI的邊界,也為未來(lái)智能醫(yī)療的發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ)。
1、大規(guī)模醫(yī)療知識(shí)注入
由深圳市大數(shù)據(jù)研究院和香港中文大學(xué)(深圳)聯(lián)合開(kāi)發(fā)的第二代華佗GPT成功通過(guò)了2023年十月份的國(guó)家執(zhí)業(yè)藥師考試。二代華佗GPT將海量醫(yī)學(xué)數(shù)據(jù)整合到通用語(yǔ)言模型中,以提升其在醫(yī)療領(lǐng)域的專(zhuān)業(yè)性。通過(guò)統(tǒng)一數(shù)據(jù)格式和領(lǐng)域適應(yīng),模型(如HuatuoGPT-II)在中醫(yī)等復(fù)雜領(lǐng)域表現(xiàn)優(yōu)異,甚至超越ChatGPT等主流模型,展現(xiàn)了強(qiáng)大的專(zhuān)業(yè)能力和泛化性能。
2023年開(kāi)發(fā)的華佗GPT-II通過(guò)當(dāng)年10月份的國(guó)家執(zhí)業(yè)藥劑師考試
?
2、支持影像的多模態(tài)大模型
在醫(yī)療場(chǎng)景中,CT、MRI等影像理解至關(guān)重要,診斷皮膚病等情況也需要視覺(jué)能力。然而,現(xiàn)有醫(yī)療大模型普遍缺乏影像處理能力,限制了其在診斷中的應(yīng)用。華佗GPT-Vision的發(fā)布填補(bǔ)了這一空白。其具備了卓越的視覺(jué)理解能力,不僅能夠理解和分析醫(yī)療影像,還能完成自動(dòng)生成影像報(bào)告、輔助醫(yī)生發(fā)現(xiàn)潛在病癥等任務(wù)。這使得它在醫(yī)療影像處理上具備了更大的應(yīng)用潛力。
開(kāi)源版本的華佗GPT多模態(tài)醫(yī)療大模型在Huggingface平臺(tái)上的每月下載量最高值已突破20萬(wàn)次。值得一提的是,從王本友團(tuán)隊(duì)畢業(yè)的博士生陳志鴻,在斯坦福大學(xué)博士后的工作經(jīng)歷之后,于硅谷獲得一筆不菲的融資,開(kāi)啟了他在大模型醫(yī)療影像領(lǐng)域的創(chuàng)業(yè)之路,深圳播種的醫(yī)療大模型種子也在太平洋對(duì)岸的硅谷開(kāi)枝散葉。
2024年七月份,華佗GPT的多模態(tài)版本在主流的MMMU多模態(tài)評(píng)測(cè)集的健康醫(yī)療賽道(MMMU Health & Medicine)上,華佗GPT在所有35個(gè)模型中取得了總排名第二(僅次于GPT-4v),開(kāi)源模型中排名第一的優(yōu)異表現(xiàn)
?
3、慢思考長(zhǎng)推理的醫(yī)療大模型
HautuoGPT-o1首次將o1技術(shù)深度應(yīng)用于醫(yī)療場(chǎng)景,顯著提升了醫(yī)學(xué)問(wèn)題解答的準(zhǔn)確性和可靠性,同時(shí)展示了o1技術(shù)在多領(lǐng)域廣泛應(yīng)用的潛力。其獨(dú)特的“慢思考”能力,模擬了醫(yī)生在真實(shí)問(wèn)診中的思維方式,通過(guò)不斷反思和修正診斷結(jié)論,為患者提供盡可能準(zhǔn)確的診斷意見(jiàn)。此外,該模型實(shí)現(xiàn)了思維過(guò)程可視化,增強(qiáng)了模型可解釋性,幫助醫(yī)生在處理復(fù)雜病例時(shí)獲取更多診斷信息和靈感。
?HuatuoGPT-o1在發(fā)布一個(gè)月內(nèi)獲得了巨大關(guān)注量,累計(jì)近1000stars
?
醫(yī)療大模型的應(yīng)用探索
在深圳市龍崗區(qū)政府的大力支持下,王本友教授聯(lián)合龍崗區(qū)衛(wèi)健局、國(guó)家健康醫(yī)療大數(shù)據(jù)研究院(深圳)、深圳市大數(shù)據(jù)研究院,成功將華佗GPT應(yīng)用于導(dǎo)診場(chǎng)景。該應(yīng)用不涉及具體的處方或診斷,具有更好的容錯(cuò)性,有效提升了患者就醫(yī)體驗(yàn)和醫(yī)療資源利用效率。
華佗GPT通過(guò)線(xiàn)上對(duì)話(huà)形式,為患者提供個(gè)性化導(dǎo)診服務(wù),顯著降低了"掛錯(cuò)號(hào)、找錯(cuò)醫(yī)生"的發(fā)生率。其創(chuàng)新的語(yǔ)音輸入功能使老年群體也能便捷使用。
目前,華佗GPT已在龍崗區(qū)12家醫(yī)院上線(xiàn)使用,實(shí)現(xiàn)了龍崗各大區(qū)屬公立醫(yī)院區(qū)域全覆蓋。該系統(tǒng)面向龍崗區(qū)500萬(wàn)人口12家公立醫(yī)院提供院前就診綜合性服務(wù),截至目前使用人次達(dá)30萬(wàn),交互次數(shù)達(dá)52萬(wàn)余次。是全國(guó)首個(gè)實(shí)現(xiàn)的全域多家醫(yī)院大模型部署聯(lián)調(diào)應(yīng)用落地,是率先實(shí)現(xiàn)基于醫(yī)院本地知識(shí)庫(kù)與醫(yī)療大模型的深度融合,率先實(shí)現(xiàn)大模型在區(qū)域平臺(tái)快速應(yīng)用落地的典型方案。華佗GPT還被納入《深圳市龍崗區(qū)創(chuàng)建人工智能全域全時(shí)應(yīng)用示范區(qū)的行動(dòng)方案(2024—2025年)》。
?
王本友教授指出,面對(duì)人口老齡化和醫(yī)療資源緊張的雙重挑戰(zhàn),華佗GPT等AI醫(yī)療模型的應(yīng)用將有效緩解醫(yī)療壓力。通過(guò)大模型的智能調(diào)控,可實(shí)現(xiàn)醫(yī)療資源的優(yōu)化配置,提升診療效率,為患者提供更精準(zhǔn)、及時(shí)的醫(yī)療服務(wù)。這一實(shí)踐不僅推動(dòng)了醫(yī)療服務(wù)的智能化轉(zhuǎn)型,也為AI技術(shù)在醫(yī)療領(lǐng)域的深度應(yīng)用提供了寶貴經(jīng)驗(yàn)。
?
?
讓醫(yī)療大模型惠及全球80億人口
目前醫(yī)療大模型的開(kāi)發(fā)主要集中在中文和英文等主流語(yǔ)言。但在不使用這些語(yǔ)言的欠發(fā)達(dá)地區(qū),其應(yīng)用依然受限。針對(duì)這一問(wèn)題,王本友教授團(tuán)隊(duì)發(fā)布了Apollo系列多語(yǔ)言醫(yī)療大模型。Apollo通過(guò)收集不同語(yǔ)言的醫(yī)療語(yǔ)料,注入不同語(yǔ)言特定的醫(yī)療知識(shí)。值得一提的是,Apollo-2模型采用混合專(zhuān)家架構(gòu),成功將特定語(yǔ)言的醫(yī)療文化知識(shí)隔離于特定參數(shù)內(nèi),這一創(chuàng)新成果已獲得ICLR 2025的認(rèn)可并收錄于相關(guān)論文中。
王本友教授開(kāi)發(fā)的醫(yī)療大模型Apollo 2覆蓋到全球50中語(yǔ)言,可以惠及全球八十億人口
2023年8月,王教授的團(tuán)隊(duì)與沙特阿拉伯的阿卜杜拉國(guó)王科技大學(xué)(KAUST)開(kāi)啟了深度合作,攜手打造了專(zhuān)為阿拉伯語(yǔ)量身定制的大語(yǔ)言模型——AceGPT。AceGPT憑借其卓越的性能,迅速在全球范圍內(nèi)嶄露頭角,成為目前全球最頂尖的阿拉伯語(yǔ)大模型。
華佗GPT和Apollo的問(wèn)世猶如在醫(yī)療行業(yè)厚重的大門(mén)上輕輕撕開(kāi)了一道小口,透出了一絲變革的曙光。隨著技術(shù)的持續(xù)精進(jìn)與應(yīng)用場(chǎng)景的不斷拓展,通用醫(yī)療人工智能將在未來(lái)對(duì)醫(yī)療行業(yè)掀起一場(chǎng)意義深遠(yuǎn)的變革浪潮。應(yīng)用場(chǎng)景將從龍崗區(qū)起步,逐步擴(kuò)展至整個(gè)深圳,進(jìn)而輻射至全國(guó)乃至全球,成為推動(dòng)醫(yī)療行業(yè)變革的關(guān)鍵力量,為全球醫(yī)療事業(yè)的發(fā)展注入強(qiáng)大動(dòng)力。
?
通用醫(yī)療人工智能的實(shí)踐路徑
當(dāng)前,通用醫(yī)療人工智能的發(fā)展面臨兩大主要挑戰(zhàn):一是數(shù)據(jù)壁壘問(wèn)題,醫(yī)療機(jī)構(gòu)之間的數(shù)據(jù)難以共享,跨醫(yī)院、跨區(qū)域的數(shù)據(jù)流通渠道尚未建立;二是應(yīng)用場(chǎng)景對(duì)準(zhǔn)確率的高要求,尤其是在處理復(fù)雜或罕見(jiàn)病例時(shí),任何小錯(cuò)誤都可能導(dǎo)致系統(tǒng)無(wú)法在實(shí)際醫(yī)療中應(yīng)用。針對(duì)這些挑戰(zhàn),王教授提出,通過(guò)醫(yī)療教育可能是實(shí)現(xiàn)通用醫(yī)療人工智能的關(guān)鍵途徑。具體來(lái)說(shuō),可以構(gòu)建一個(gè)以AI模擬患者為核心的循環(huán)系統(tǒng)。AI首先應(yīng)扮演“患者”的角色,而不是醫(yī)生。通過(guò)讓醫(yī)生或醫(yī)學(xué)生與AI患者進(jìn)行交互診斷,積累經(jīng)驗(yàn),再用這些經(jīng)驗(yàn)來(lái)訓(xùn)練AI醫(yī)生。逐步在各個(gè)科室和醫(yī)院中建立標(biāo)準(zhǔn)化患者模型和評(píng)估體系,形成完整的數(shù)據(jù)集。同時(shí),醫(yī)療教育帶來(lái)的醫(yī)生社區(qū)可以提供大量可靠的反饋和標(biāo)注,形成一個(gè)持續(xù)優(yōu)化的數(shù)據(jù)閉環(huán)。
通過(guò)這種方式積累的高質(zhì)量醫(yī)患交互數(shù)據(jù)、評(píng)估標(biāo)準(zhǔn)和大量標(biāo)注,可以幫助訓(xùn)練更加可靠的醫(yī)療AI模型。這些模型將深度整合醫(yī)療專(zhuān)業(yè)知識(shí)和大模型的智能策略,并建立嚴(yán)格的質(zhì)量控制體系。通過(guò)密集的人工標(biāo)注和驗(yàn)證,確保大模型輸出的可靠性和可信度。這種將專(zhuān)業(yè)知識(shí)與人工智能技術(shù)相結(jié)合的策略,不僅能讓AI更好地理解復(fù)雜的醫(yī)療情況,還能在實(shí)際應(yīng)用中更加可靠和安全,為通用醫(yī)療人工智能的實(shí)用化提供一條穩(wěn)健的發(fā)展路徑。簡(jiǎn)而言之,通過(guò)讓AI先當(dāng)“患者”,幫助醫(yī)生積累經(jīng)驗(yàn),再用這些經(jīng)驗(yàn)訓(xùn)練AI醫(yī)生,逐步建立起一個(gè)高質(zhì)量的數(shù)據(jù)循環(huán)系統(tǒng),推動(dòng)醫(yī)療AI的落地和應(yīng)用。
?
青年教授簡(jiǎn)介
王本友,香港中文大學(xué)(深圳)助理教授和校長(zhǎng)青年教授。主要研究方向?yàn)榇笳Z(yǔ)言模型和自然語(yǔ)言處理(NLP)。迄今為止,他曾獲得了SIGIR 2017最佳論文提名獎(jiǎng)、NAACL 2019最佳可解釋NLP論文、NLPCC 2022最佳論文和歐盟瑪麗居里獎(jiǎng)學(xué)金,擔(dān)任了EMNLP 2023的Website Chair和NLPCC 2023的Publicity Chair。其團(tuán)隊(duì)開(kāi)發(fā)了華佗GPT大模型,華佗GPT是首個(gè)垂直大語(yǔ)言模型,也是首個(gè)通過(guò)當(dāng)年國(guó)家藥劑師考試的大模型,迄今有超過(guò)40萬(wàn)次訪(fǎng)問(wèn),已部署在龍崗區(qū)全部12家公立醫(yī)院。在HuggingFace的累計(jì)模型下載量近百萬(wàn),GitHub的star數(shù)量逾萬(wàn)次。
王本友教授的研究還得到了國(guó)內(nèi)頭部企業(yè)的支持,包括華為火花獎(jiǎng)、華為AI百校計(jì)劃、騰訊犀牛鳥(niǎo)計(jì)劃、滴滴蓋亞學(xué)者計(jì)劃等。相關(guān)研究工作得到了國(guó)內(nèi)外諸多機(jī)構(gòu)包括Meta、Google、微軟、AIlen AI、IBM、CMU、耶魯、UC Berkeley、商湯、字節(jié)、華為、阿里等使用或借鑒。
憑借在大模型領(lǐng)域的卓越貢獻(xiàn),王本友教授團(tuán)隊(duì)在全球范圍內(nèi)獲得了廣泛認(rèn)可。根據(jù)大模型權(quán)威網(wǎng)站Huggingface的排名,香港中文大學(xué)(深圳)王本友教授團(tuán)隊(duì)在全球高校中排名第14位。
