阮彤:基于大模型與電子病歷的醫(yī)療質(zhì)控指標(biāo)自動化計算
醫(yī)療質(zhì)控指標(biāo)需求
醫(yī)療質(zhì)控指標(biāo)既反應(yīng)了治療過程的醫(yī)學(xué)質(zhì)量,是醫(yī)療管理的重要手段,也是醫(yī)院評級和國考的要求。然而,當(dāng)前技術(shù)手段受限,主要依賴手工報送,導(dǎo)致效率低、無法溯源、精準(zhǔn)性不足等問題,難以滿足全面實時醫(yī)療管理的需求。而質(zhì)控指標(biāo)從單病種到專科,數(shù)量眾多,報送上述指標(biāo)給醫(yī)院帶來了較大的工作量。
近期,以DeepSeek為代表的生成式大語言模型引發(fā)廣泛關(guān)注,為利用AI智能化改造傳統(tǒng)耗時工作提供了新思路。本文以醫(yī)療質(zhì)控指標(biāo)計算為例,探討大模型在此類復(fù)雜場景中的問題和解決方案。
利用大模型直接進行自動計算質(zhì)控指標(biāo)存在的問題
直接將整份病歷作為端到端輸入,并依賴大模型完成質(zhì)控任務(wù),可能會面臨以下挑戰(zhàn):
首先,整份病歷通常篇幅較長,而大模型在處理長上下文時仍存在理解瓶頸,導(dǎo)致病歷溯源困難。其次,當(dāng)前的質(zhì)控規(guī)則表述往往較為模糊,大模型難以準(zhǔn)確理解其邏輯內(nèi)涵,從而影響其推理判斷的準(zhǔn)確性。最后,質(zhì)控任務(wù)涉及數(shù)值計算和邏輯規(guī)則運算,大模型在這些方面的計算能力尚未達到百分之百的可靠性。
針對這些挑戰(zhàn),以下是幾種可能的解決方案及其局限性:
(1)利用更大參數(shù)的模型解決電子病歷長上下文問題。雖然更大參數(shù)的模型(如Qwen2.5-72b、DeepSeek-V3)能夠增強長上下文理解和復(fù)雜規(guī)則推理能力,但其計算資源需求顯著增加,導(dǎo)致部署成本高、響應(yīng)速度慢,且對硬件要求極高,難以在資源有限的環(huán)境中廣泛應(yīng)用。
(2)利用分階段處理病歷內(nèi)容,解決邏輯與數(shù)學(xué)計算問題。然而,分階段處理需要設(shè)計復(fù)雜的信息提取和推理模塊,增加了系統(tǒng)復(fù)雜性,且不容易動態(tài)調(diào)整。此外,信息提取的準(zhǔn)確性直接影響后續(xù)推理結(jié)果,若提取不完整或錯誤,可能導(dǎo)致質(zhì)控結(jié)果偏差。
(3)利用RAG技術(shù)解決幻覺問題。RAG技術(shù)雖能有效緩解通用大模型因醫(yī)學(xué)知識不足而產(chǎn)生的幻覺問題,但其性能高度依賴外部知識庫和規(guī)則庫的質(zhì)量與覆蓋范圍。若知識庫不完善或規(guī)則庫更新滯后,可能導(dǎo)致檢索結(jié)果偏差,進而影響模型推理的準(zhǔn)確性。同時,RAG技術(shù)在處理復(fù)雜邏輯運算時仍存在一定局限性,難以完全滿足高精度需求。
解決方案
本方案基于大模型的特點,華東理工大學(xué)自然語言處理與大數(shù)據(jù)實驗室與區(qū)域衛(wèi)生健康委以及滬上知名三甲醫(yī)院合作,設(shè)計了指標(biāo)轉(zhuǎn)換引擎與執(zhí)行引擎,構(gòu)造了基于大模型的醫(yī)療質(zhì)控方案1 2。該方案可以快速部署,在不同的電子病歷系統(tǒng)上計算數(shù)百個醫(yī)療質(zhì)控指標(biāo),實現(xiàn)指標(biāo)計算的可解釋性要求,避免考核過程的紛爭。
方案具有以下核心優(yōu)勢:
(1)溯源機制:通過向量匹配技術(shù)精準(zhǔn)定位病歷相關(guān)內(nèi)容,解決了長文本輸入帶來的幻覺問題,同時降低了計算資源需求。
(2)指標(biāo)邏輯轉(zhuǎn)換引擎:將模糊的質(zhì)控規(guī)則轉(zhuǎn)化為清晰的邏輯關(guān)系,提升了大模型對規(guī)則的理解和執(zhí)行能力。
以腦出血的出院時好轉(zhuǎn)/穩(wěn)定率為例,質(zhì)控計算公式中不僅需要從病案首頁等非結(jié)構(gòu)化文本中抓取多項數(shù)據(jù)和編碼,還涉及數(shù)值計算。無論是數(shù)據(jù)抓取,還是其中的邏輯計算,人工抽查的方式在效率和精確度上都無法支持這類指標(biāo)的統(tǒng)計分析需要。
(3)指標(biāo)執(zhí)行引擎:結(jié)合大模型的多事實判斷和決策邏輯推理,確保了質(zhì)控結(jié)果的準(zhǔn)確性和可解釋性,彌補了大模型在數(shù)值計算和邏輯運算方面的不足。
通過這些創(chuàng)新方案,華東理工大學(xué)團隊有效地解決了大模型在病歷質(zhì)控任務(wù)中的諸多挑戰(zhàn),提升了質(zhì)控的準(zhǔn)確性和可靠性。其優(yōu)勢主要體現(xiàn)在病歷溯源的可解釋性、規(guī)則拆分的自動化,以及規(guī)則執(zhí)行引擎的準(zhǔn)確性與穩(wěn)定性。這一方案不僅有助于提升專科診療和病歷書寫的規(guī)范性,還能顯著提高醫(yī)療質(zhì)量,最終惠及廣大患者,具有廣泛的社會效益。
1.Qi Ye, Guangya Yu, Jingping Liu, Erzhen Chen, Chenjie Dong, Xiaosheng Lin, Zelei Liu, Han Yu & Tong Ruan, "IMQC: A Large Language Model Platform for Medical Quality Control," in Proceedings of the 37th Annual Conference on Innovative Applications of Artificial Intelligence (IAAI-25), 2025. (Innovative Application of AI Award)
2.Yu G, Li Y, Jiang Z, et al. CMQCIC-Bench: A Chinese Benchmark for Evaluating Large Language Models in Medical Quality Control Indicator Calculation[J]. arXiv preprint arXiv:2502.11703, 2025.
作者簡介
阮彤,CHIMA委員,華東理工大學(xué)信息科學(xué)與工程學(xué)院計算機系博導(dǎo),教授。現(xiàn)任華東理工大學(xué)計算機技術(shù)研究所所長,自然語言處理與大數(shù)據(jù)挖掘?qū)嶒炇抑魅巍iL期從事自然語言處理、知識圖譜、醫(yī)學(xué)人工智能等方面的研究。
上一篇: 對話醫(yī)療信息化的“她”力量