文 | 動脈網
從未有創新技術能如大語言模型一般,能在短短數月穿透醫療體系,引得醫院主動、迅速、成規模地引入。
截至2025年4月30日,統計第三方榜單中國內排名前100的醫院,已有98家對外宣稱完成了大模型部署。
在這之中,有38家醫院在通用模型的基礎上進一步展開研發,打造出55個符合自身需求的垂直醫療模型。
從“買方”轉變為“研發方”,醫生已成為“AI制造”群體中至關重要的一員。
百強醫院公開發布的垂直大模型
(截至2025年4月30日,醫院排名來源于“2022屆中國醫院競爭力春季榜”)
大模型進入??茖2r代
2022年末,OpenAI憑借GPT3.5點燃大模型的戰火后,國內醫療領域已經掀起多輪“百模大戰”。
但由于GPT時代高昂的部署成本及調用成本,國內只有少數頂級醫院完成了大模型的本地化部署,絕大多數模型均由企業開發,訓練數據主要為醫療相關的文本數據,沒有觸及醫院多模態臨床數據的內核。
因此,這個時代誕生的大量大模型具備同質化高、臨床相關弱的缺點,鮮有模型能夠為醫院帶來增量價值,因而未能在醫療領域掀起太大漣漪。
DeepSeek-R1的橫空出世可以視作醫療大模型發展的關鍵轉折點。創新架構下,DeepSeek大幅降低了大模型的使用門檻。醫院只需支付數十萬元的費用便能本地部署大模型,并對此進行個性化定制,即便是未曾接觸過大模型的醫院,也不愿錯過這一機遇。
醫院垂直模型開發時間分布(單位:個;截至2025年4月30日)
相較于企業,醫院能夠調用的醫療數據體量更龐大,模態更多元,模型的功能也能更貼近臨床的真實需求。因此,誕生于DeepSeek流行后的醫院主導的大模型(部署的通用模型可能是DeepSeek外的其他模型)開始朝專病??瓢l展,能夠處理的多模態的醫學數據,直切臨床問題。
譬如,北京協和醫院今年2月發布的“協和·太初”便是首個罕見病領域的人工智能大模型,可用于輔助醫生快速準確地識別診斷罕見病,破解罕見病診療全國范圍內同質性差的難題。
該大模型基于我國罕見病知識庫的多年積累和中國人群基因檢測數據建立,醫生向模型輸入“發現孩子從2歲起發育、語言和動作都明顯落后,交流也無法完成”等癥狀后,僅需數秒AI便會給出“需警惕罕見遺傳性疾?。ㄈ缋滋鼐C合征、天使綜合征等)或復雜神經發育障礙”的判斷,并給出就診科室、補充檢查等醫學建議。
中山大學附屬第一醫院與神州醫療共同研發的全球首個腹膜透析大模型則是聚焦腹膜透析這一細分場景。該模型采用DHC+DeepSeek雙引擎架構,能對臨床文本、影像、病理、基因、時序數據等進行深度理解和融合分析捕捉腹膜透析的相關信息,為醫生提供診斷分析、治療方案推薦、隨訪建議和風險預測等功能,進而為尿毒癥等患者緩解治療比例低、社會回歸率低等問題。
類似的垂直模型還有很多。動脈網據公開資料統計,國內目前已有專病??拼怪蹦P?2個,覆蓋心血管病、腎病、胸痛、咽喉病變、皮膚病、肝癌等病種,骨科、放射科、病理科、眼科、麻醉科等科室,甚至還專為消化內鏡、心超等設備,以及手術風險評估、感染控制等環節訓練大模型。
國內專病??拼怪蹦P蛥R總(截至2025年4月30日)
同時,垂直大模型的功能也隨醫生的加入不斷擴展。最初的大模型應用主要以患者服務為主,用生成式AI的多輪對話能力為患者提供更好的診前、診后服務。常見于智能預問診、智能導診、智能隨訪等應用中,是對過去AI的一次升級。
而如今,醫院在采用大模型優化患者就醫體驗的同時,也希望大模型能夠更好地服務于醫生群體,實現輔助決策、輔助診斷等功能,提供更為優質、更為高效的醫療服務。亦有少量醫院在探索大模型在醫學教育、醫院管理、科學研究中的應用可能,期望能夠由數字化醫院轉變為智能化醫院,從源頭上解決醫療資源缺失、科研產出有限等問題。
醫院垂直模型職能分布(截至2025年4月30日)
需要注意的是,雖然百強醫院都完成了通用模型的部署,但上文展示的垂直模型主要由排名前50的醫院開發。換句話說,垂直大模型的研發非??简炨t院的整體實力,不僅需要在研發過程中保證深度的醫工融合,還得有能力承擔研發過程中的精力與費用,這筆費用算下來相當昂貴。
醫療大模型最為花錢的部分在于算力與數據。同深度學習時代輔助診斷類AI的訓練邏輯相似,好的醫療大模型需要做好醫療數據方面的工作,有效整合電子健康記錄(EHR)、影像數據(DICOM)、實驗室報告等數據,確保數據多樣性。
此外,數據的清洗與標注也同樣重要。要確保大模型在后續使用中具備客觀的生成結果質量,開發者們必須在前期數據治理工作,剔除異常實驗室值、錯誤電子病歷等重復、缺失或錯誤數據。
以影像大模型為例,訓練一個某垂直領域的影像大模型理論上至少需要數千張經過分類和標注的影像,且影像來源需要多元,盡可能收集不同分期、不同年齡的患者影像數據,保證大模型的魯棒性。
如果訓練模型使用的影像太少,大模型在實際使用時就容易出現幻覺,為了回答問題去編造一些不存在的東西。臨床之中,這樣的模型無法成規模地應用下去。
醫院主導開發,垂直模型仍需企業助力
除了醫療大模型功能與價值產生路徑上的變化,醫院的開發模型也在不斷擴展。
上述提及的55個大模型中,醫院合作企業一起研發依然是主流,有超過一半的項目采用這一模式進行開發。
但從數據可以看出,2025年2月開始,醫院合作學校、科研機構的項目數量開始激增。尤其是醫院獨立開發這一模式(包括醫院間的合作),已占比接近25%,成為僅次于合作企業開發的重要模式。
這意味著:醫院正在醫療大模型的能力躍遷中發揮愈發重要的作用。
醫療垂直模型開發模式分布(截至2025年4月30日)
不過,由于大多數醫院缺乏兼具工程與醫學能力的跨專業人才,醫院與企業的聯合開發模型依然會是未來的主流。
畢竟,訓練模型需要以此完成數據準備與處理、模型選擇與配置、模型訓練、模型評估與調優、模型部署與集成五個步驟。相較于獨立開發,醫生提供領域知識與標注數據、AI工程師則負責技術實現的分工形式或許更能契合當下醫院的需求。
此外,企業的介入還能幫助醫院更好地從商業化的角度規劃大模型的未來迭代路徑,推動相關科研轉化的實現。畢竟,當這些成果得到充分地共享,它的價值才能最大化地展示出來。
現階段,華為、中國電信、訊飛醫療、衛寧健康、福鑫科創、神州醫療等企業已經廣泛參與到了醫療垂直大模型的開發中,取得了一定成果。伴隨醫院大模型應用場景的進一步擴大,更多中小企業亦可與醫院達成合作,共同開發細分場景下的醫療垂直大模型。
邁向下一個時代,醫療大模型還需邁過三道坎
雖說醫院這一角色的介入已為醫療大模型帶來長足的發展,但要跨越時代,更深入地應用大模型,這一行業至少還需邁過三道坎。
■ 醫院大模型訓練集的局限性
現階段醫院開發大模型采用的多是醫院自身長期積累的數據集。吸納這些數據后的大模型能夠較好地處理常見的患者,但面對一些復雜、少見的病灶,大模型很容易因為數據的缺失而產生幻覺。要解決這一問題,醫院在培育大模型時應盡可能采用多個地域、多家醫院的數據組成訓練集。
目前,已有不少醫院開始組建專病聯盟,共同開發醫療垂直大模型。這種模式不僅可以保障大模型的準確率和魯棒性,還能提高醫療數據的復用率,讓這些治理后的數據能夠充分發揮價值。
■ 大模型的形態暫無定論
到目前為止,行業圍繞大模型的討論主要集于它的功能,鮮有人去探討它的形態。當垂直大模型作為一個商業產品走出醫院時,我們必須確定它的形態,是單純的軟件應用,還是需要經歷審評審批的醫療器械。
今年3月31日,國家藥監局發布了《關于優化全生命周期監管 支持高端醫療器械創新發展的舉措(征求意見稿)》,公開征求多病種AI、大模型等新興技術準入方式的意見,先行一步為大模型的發展樹立道標。
文件提到要研究制定多病種、大模型人工智能領域相關技術指導原則或者審評要點;簡化核心算法不變而算法性能優化人工智能醫療器械產品變更注冊要求;探索完善采用測評數據庫開展人工智能醫療器械性能評價要求。
這或許意味著,醫院這波新興的輔助診斷、輔助決策模型未來將被視作醫療器械,經過嚴苛的準入審查方能進入市場進行流通。
■ 潛在的安全性問題
到目前為止醫療行業尚未曝出大模型相關的數據安全問題,但風險從未遠離過這一領域。
醫療數據承載著患者的基因信息、病史記錄等高度敏感內容,一旦泄露,將對個人隱私構成嚴重威脅,甚至可能引發基因歧視、保險欺詐等連鎖風險。
由于現階段醫院部署的大模型大多來自開源項目,相關代碼的修改可能會引入后門程序或者安全漏洞。如果醫院系統架構缺陷或數據傳輸加密不足,那么這些數據便會被暴露于網絡攻擊之下,面臨非法獲取和濫用的風險。
因此,在醫療領域應用開源AI系統時,醫院及企業最好對這些風險進行全面評估,采取嚴格的安全措施,確保系統的安全性和數據的保密性。只有做好醫療數據安全方面的保障,醫療大模型才存在持續發展下去的可能。