AI出現(xiàn)在診室,像醫(yī)生一樣問病史、做診斷、開檢查單。這個(gè)曾出現(xiàn)在科幻電影中的場(chǎng)景,正逐漸走進(jìn)現(xiàn)實(shí)。
今年上半年,“天樞”“觀心”“瑞智病理”等醫(yī)療領(lǐng)域大規(guī)模預(yù)訓(xùn)練語言模型(以下簡(jiǎn)稱“醫(yī)療大模型”)在全國三甲醫(yī)院密集落地。億歐智庫數(shù)據(jù)顯示,截至2025年5月,國內(nèi)累計(jì)發(fā)布醫(yī)療大模型達(dá)288個(gè),其中今年新增133個(gè)。
這些被臨床寄予厚望的技術(shù)產(chǎn)物,離成為真正的AI醫(yī)生還有多遠(yuǎn)?
醫(yī)療模型價(jià)值初顯
今年夏天,北京市房山區(qū)竇店鎮(zhèn)一家基層醫(yī)院的內(nèi)科門診來了一名患兒,半邊臉腫大,久不消退。醫(yī)生建議家長(zhǎng)帶孩子去口腔科檢查。但檢查結(jié)果顯示,口腔無異常。
焦急的患兒家長(zhǎng)再次找到醫(yī)生。醫(yī)生想起醫(yī)院不久前引入的AI兒科醫(yī)生。這款兒科醫(yī)療大模型整合了300多位知名兒科專家的臨床經(jīng)驗(yàn)及大量脫敏的病歷數(shù)據(jù),學(xué)習(xí)了3000多種兒童常見病、疑難病相關(guān)診療知識(shí)。
醫(yī)生與這名“博學(xué)”的AI兒科醫(yī)生展開了多輪“對(duì)話”。AI提示,患兒可能是腮腺炎?;贏I提醒,診斷最終被明確,患兒也得到及時(shí)治療。
2024年11月以來,多部門密集出臺(tái)AI醫(yī)療相關(guān)政策:《衛(wèi)生健康行業(yè)人工智能應(yīng)用場(chǎng)景參考指引》梳理84個(gè)細(xì)分應(yīng)用場(chǎng)景;國家醫(yī)保局將AI輔助診斷納入醫(yī)療服務(wù)價(jià)格立項(xiàng)指南;《醫(yī)藥工業(yè)數(shù)智化轉(zhuǎn)型實(shí)施方案(2025—2030年)》明確要拓展AI在輔助診療等場(chǎng)景的應(yīng)用。
一家研發(fā)醫(yī)療大模型的企業(yè)負(fù)責(zé)人表示,DeepSeek-R1等開源模型的技術(shù)突破,降低了醫(yī)療大模型的研發(fā)和應(yīng)用門檻,加速了AI醫(yī)療領(lǐng)域“百模大戰(zhàn)”的到來。
在政策支持、技術(shù)突破等多重因素下,醫(yī)療大模型迎來爆發(fā)期。億歐智庫預(yù)測(cè),2025年醫(yī)療大模型市場(chǎng)規(guī)模近20億元,預(yù)計(jì)以140%年均增速增長(zhǎng),2028年將突破百億元。
目前,除了少數(shù)醫(yī)院具備完全自主研發(fā)和部署醫(yī)療大模型的技術(shù)能力和算力條件,大部分醫(yī)院選擇與企業(yè)、高校、科研院所聯(lián)合研發(fā)。
作為醫(yī)生“助手”,醫(yī)療大模型可有效提升診斷效率。截至今年6月,AI系統(tǒng)“智醫(yī)助理”已落地全國超7.5萬家基層醫(yī)療機(jī)構(gòu),累計(jì)提供超10億次輔診建議,緩解了基層醫(yī)生壓力。數(shù)據(jù)顯示,華中科技大學(xué)同濟(jì)醫(yī)學(xué)院附屬協(xié)和醫(yī)院用AI輔助預(yù)問診,醫(yī)患有效溝通時(shí)長(zhǎng)增加50%。
在基層醫(yī)療機(jī)構(gòu),醫(yī)療大模型的應(yīng)用已顯現(xiàn)價(jià)值。有公司研發(fā)的AI助診儀,已經(jīng)在北京市海淀區(qū)20家社區(qū)衛(wèi)生服務(wù)中心試點(diǎn)應(yīng)用。該AI助診儀能為醫(yī)生提供問診方向建議,鑒別診斷合理率達(dá)96%。
從給醫(yī)生減負(fù)的“神器”,到基層醫(yī)療機(jī)構(gòu)的“外腦”,從居民的健康管理助手,再到??崎T診的溝通工具,醫(yī)療大模型已從技術(shù)探索階段走向臨床應(yīng)用階段。
進(jìn)階之路關(guān)卡重重
密集涌現(xiàn)的醫(yī)療大模型,讓公眾對(duì)AI醫(yī)生有了更多期待。但專家指出,醫(yī)療大模型從實(shí)驗(yàn)室走進(jìn)診療室,到最終成為真正的AI醫(yī)生,還需要一場(chǎng)“職場(chǎng)拉練”。
這場(chǎng)“職場(chǎng)拉練”的難點(diǎn),首先在于AI醫(yī)生的概念模糊,其次在于落地應(yīng)用時(shí)的多重障礙。
當(dāng)前,業(yè)內(nèi)對(duì)AI醫(yī)生的定義尚未統(tǒng)一。但可以明確的是,它并不等于醫(yī)療大模型。
有專家認(rèn)為,醫(yī)療大模型偏技術(shù),AI醫(yī)生偏應(yīng)用?!搬t(yī)療大模型好比醫(yī)學(xué)院畢業(yè)生,缺乏臨床經(jīng)驗(yàn)。AI醫(yī)生既懂理論又懂實(shí)踐,可以上崗執(zhí)業(yè)。”該專家說。
還有醫(yī)生提出,“自主治療”才是AI醫(yī)生的核心標(biāo)準(zhǔn)。清華大學(xué)北京清華長(zhǎng)庚醫(yī)院(以下簡(jiǎn)稱“北京清華長(zhǎng)庚醫(yī)院”)泌尿外科主任李建興則比喻,“醫(yī)療大模型好比醫(yī)院,AI醫(yī)生好比科室大夫”。
記者梳理發(fā)現(xiàn),目前自稱AI醫(yī)生的產(chǎn)品多種多樣:有的是智能問答系統(tǒng),有的主攻影像分析,有的是醫(yī)生智能體,還有的是人類醫(yī)生的數(shù)字分身。
一位業(yè)內(nèi)人士總結(jié)道,現(xiàn)在主流的AI醫(yī)生分為輔助診斷、知識(shí)問答、健康管理三類系統(tǒng)。她坦言,“全知全能的AI醫(yī)生,對(duì)行業(yè)和患者價(jià)值更大,但距離臨床還較遠(yuǎn)”。
從醫(yī)療大模型到AI醫(yī)生,這條路并非坦途。
其面臨的一重困境是模型技術(shù)本身還存在不足。今年3月,一名“95后”新手家長(zhǎng)面對(duì)孩子反復(fù)咳嗽發(fā)熱,在手機(jī)上用AI問診。AI判定孩子為“普通呼吸道感染”,家長(zhǎng)參考建議居家用藥,卻導(dǎo)致病情延誤。最終,孩子在醫(yī)院確診為病毒感染肺炎。這一案例暴露了AI診療可能存在的風(fēng)險(xiǎn)。
“大模型的‘黑箱’‘幻覺’、引用錯(cuò)誤信息等問題,會(huì)誤導(dǎo)治療,后果不堪設(shè)想。”北京清華長(zhǎng)庚醫(yī)院泌尿外科主治醫(yī)師劉宇保說。一家專注醫(yī)療大模型研發(fā)的企業(yè)已將其醫(yī)療大模型的“幻覺”發(fā)生率控制在1%左右,但該企業(yè)負(fù)責(zé)人仍強(qiáng)調(diào):“AI醫(yī)生大規(guī)模應(yīng)用于臨床的風(fēng)險(xiǎn)防控體系尚未成熟。”
今年5月,李建興團(tuán)隊(duì)僅用兩個(gè)多月就研發(fā)出結(jié)石領(lǐng)域大模型“石說AI”的內(nèi)測(cè)版本。李建興說:“其實(shí),在基座模型、大數(shù)據(jù)的基礎(chǔ)上研發(fā)醫(yī)療模型并不難,難的是后期運(yùn)維。后期需持續(xù)投入算力、人力、數(shù)據(jù)等資源,并承擔(dān)設(shè)備維護(hù)、模型迭代等成本。”
數(shù)據(jù)是大模型的“養(yǎng)料”。數(shù)據(jù)不足或流動(dòng)不暢,是阻礙醫(yī)療大模型“進(jìn)化”的又一個(gè)桎梏。
參與“石說AI”研發(fā)的清華大學(xué)博士生徐錚表示,使用多中心的數(shù)據(jù)能提升醫(yī)療大模型的“泛化性”,但醫(yī)療數(shù)據(jù)“煙囪林立”的現(xiàn)狀還難以打破。
李建興補(bǔ)充道:“基層醫(yī)療數(shù)據(jù)不夠規(guī)范,很多有價(jià)值的病例信息沒有被記錄,更別提資源共享。而靠單中心數(shù)據(jù)訓(xùn)練的大模型,到了基層或其他醫(yī)療機(jī)構(gòu)又可能‘水土不服’?!?/p>
在罕見病領(lǐng)域,訓(xùn)練醫(yī)療大模型則普遍面臨病例數(shù)據(jù)不足的難題。國外有研究發(fā)現(xiàn),當(dāng)AI用于診斷罕見病時(shí),其準(zhǔn)確率不足60%。
多模態(tài)數(shù)據(jù)處理,對(duì)醫(yī)療大模型來說也是難關(guān)。徐錚告訴記者,醫(yī)學(xué)大模型應(yīng)用需先解決多模態(tài)醫(yī)療數(shù)據(jù)融合難題,實(shí)現(xiàn)影像、病理、基因組、電子病歷等多源數(shù)據(jù)的高效融合與安全共享。
另一重困境則源于社會(huì)認(rèn)知。
一名患者說,雖然有的醫(yī)療大模型和知名專家的水平不相上下,但他更希望坐在對(duì)面的是那個(gè)知名專家。李建興也表示,越來越多的患者看到了“AI+醫(yī)療”的潛力,但對(duì)AI診療持懷疑態(tài)度的人也不在少數(shù)。
“對(duì)AI醫(yī)生接受度低,原因很復(fù)雜。比如患者擔(dān)心技術(shù)不夠可靠或更喜歡真實(shí)世界的交流,醫(yī)療機(jī)構(gòu)擔(dān)心技術(shù)應(yīng)用成本高,醫(yī)生擔(dān)憂技術(shù)對(duì)現(xiàn)實(shí)形成沖擊?!眲⒂畋=忉尩?。
多方探索加速破局
面對(duì)多重難關(guān),業(yè)內(nèi)已開始探索如何培養(yǎng)更多更強(qiáng)的AI。
在這條賽道上,中國醫(yī)學(xué)科學(xué)院血液病醫(yī)院(中國醫(yī)學(xué)科學(xué)院血液學(xué)研究所)信息與資源中心首席技術(shù)專家陳俊仁走了極具挑戰(zhàn)性的路。
當(dāng)前,多數(shù)AI僅為輔助決策工具,而自主治療能力是AI醫(yī)生落地的重要突破點(diǎn)。陳俊仁正致力于打造能自主開展治療的AI醫(yī)生。他將AI醫(yī)生分為兩類:一是輔助型,AI提供參考信息,而醫(yī)生判斷如何運(yùn)用該信息做出決策;二是條件式自主型,AI提供默認(rèn)治療方案,但醫(yī)生有否決權(quán)。
2022年,陳俊仁和合作團(tuán)隊(duì)用數(shù)學(xué)建模解決了真實(shí)世界中血液病患者臨床數(shù)據(jù)“多參數(shù)、小樣本”的問題,并建立daGOAT模型,用于預(yù)測(cè)移植后重度急性移植物抗宿主病,研究發(fā)表于《自然·計(jì)算科學(xué)》。
模型方法經(jīng)國際同行認(rèn)可后,研究團(tuán)隊(duì)依照嚴(yán)格流程推動(dòng)AI走向臨床:完成倫理審查、把模型嵌入醫(yī)院信息系統(tǒng)……拿到倫理批件后,開始招募患者志愿者。“不是拿著模型找場(chǎng)景,而是根據(jù)場(chǎng)景需求研發(fā)模型。”陳俊仁說。
讓陳俊仁欣慰的是,從2024年第一個(gè)患者入組至今,daGOAT已具備條件式自主開展診療的能力——能定時(shí)自主追蹤患者的100多個(gè)動(dòng)態(tài)指標(biāo),提醒醫(yī)生針對(duì)高風(fēng)險(xiǎn)患者提前采取藥物干預(yù)措施。
“尋找醫(yī)療場(chǎng)景—開展科學(xué)驗(yàn)證—獲得倫理委員會(huì)批準(zhǔn)—搭建醫(yī)療模型—招募患者志愿者—多方交叉驗(yàn)證,這條AI醫(yī)生培育之路很漫長(zhǎng),但能讓醫(yī)生和患者都感到踏實(shí)?!标惪∪蕪?qiáng)調(diào),“不管是什么形態(tài)的AI醫(yī)生,核心在于能否真正解決臨床問題?!?/p>
針對(duì)模型技術(shù)的“幻覺”等問題,國內(nèi)諸多團(tuán)隊(duì)探索出不同路徑:陳俊仁團(tuán)隊(duì)通過真實(shí)世界病例探索驗(yàn)證;北京清華長(zhǎng)庚醫(yī)院泌尿外科要求模型引用最新的權(quán)威醫(yī)學(xué)文獻(xiàn);還有的醫(yī)院則采取模型在循證醫(yī)學(xué)數(shù)據(jù)庫“自檢+雙醫(yī)”模式。
中國科學(xué)院院士陳潤生曾表示,破除AI“幻覺”需應(yīng)對(duì)技術(shù)難題、倫理問題等諸多挑戰(zhàn)。從技術(shù)層面來說,AI的表現(xiàn)很大程度上依賴于訓(xùn)練數(shù)據(jù)的質(zhì)量和多樣性,如果訓(xùn)練數(shù)據(jù)存在偏差,模型可能會(huì)產(chǎn)生錯(cuò)誤輸出。從倫理層面看,算法可能因訓(xùn)練數(shù)據(jù)的不完善或設(shè)計(jì)者的主觀偏見出現(xiàn)歧視性的決策結(jié)果。
針對(duì)醫(yī)療數(shù)據(jù)“煙囪林立”問題,李建興建議,可借鑒“醫(yī)療數(shù)據(jù)中臺(tái)”模式,在數(shù)據(jù)加密脫敏基礎(chǔ)上建立跨機(jī)構(gòu)數(shù)據(jù)聯(lián)盟,讓數(shù)據(jù)可用不可見,降低數(shù)據(jù)泄露濫用風(fēng)險(xiǎn)。針對(duì)數(shù)據(jù)稀缺難題,陳俊仁團(tuán)隊(duì)通過“對(duì)小樣本抽絲剝繭分析+用真實(shí)病例反復(fù)驗(yàn)證”的方式,讓模型更精準(zhǔn)。
如何讓AI醫(yī)生成為讀懂多種數(shù)據(jù)的“多面手”?專家表示,這需要整合影像識(shí)別、自然語言處理等多領(lǐng)域技術(shù),需要全球科研力量聯(lián)合攻關(guān)。
談及提升業(yè)界對(duì)AI醫(yī)生的認(rèn)可度,劉宇保表示,要通過診療效果對(duì)比、發(fā)表研究文章、建立AI醫(yī)生評(píng)測(cè)榜等客觀方式,提升醫(yī)生對(duì)AI的認(rèn)可度。中國科學(xué)院香港創(chuàng)新研究院人工智能與機(jī)器人創(chuàng)新中心主任劉宏斌在接受媒體采訪時(shí)稱,醫(yī)學(xué)是循證學(xué)科,模型的每一個(gè)診斷結(jié)論都應(yīng)標(biāo)注依據(jù)、具備可解釋性,這樣才能獲得醫(yī)生信任。
針對(duì)AI醫(yī)生監(jiān)管和倫理問題,李建興提出,可參考自動(dòng)駕駛分級(jí)模式,依據(jù)AI醫(yī)生能力劃定診斷治療權(quán)限,隨著模型變強(qiáng)逐步放開權(quán)限,同時(shí),動(dòng)態(tài)調(diào)整醫(yī)療大模型開發(fā)者、使用者、監(jiān)管方的責(zé)任邊界。
陳俊仁認(rèn)為,應(yīng)盡早建立AI醫(yī)療的治理機(jī)制和規(guī)則框架,加強(qiáng)相關(guān)倫理審查,既要引導(dǎo)AI醫(yī)療按正確路線發(fā)展,又要防范AI醫(yī)療安全風(fēng)險(xiǎn)。
多位專家表示,為加快AI醫(yī)生落地應(yīng)用,政策方面現(xiàn)階段需要“多松土”。
李建興建議,簡(jiǎn)化院級(jí)AI產(chǎn)品的注冊(cè)備案流程,鼓勵(lì)醫(yī)療機(jī)構(gòu)與技術(shù)公司深度合作。還有專家提到,推動(dòng)AI醫(yī)生服務(wù)納入醫(yī)保支付體系,完善AI醫(yī)生的商業(yè)模式。
陳俊仁表示,政策可按照風(fēng)險(xiǎn)層次適當(dāng)放寬,讓業(yè)界有更多發(fā)揮的空間?!暗珶o論如何,每一次實(shí)踐探索都不能違背醫(yī)學(xué)倫理。”他說。