久久97久久-久久97人人-久久97人人超人人超碰超国产-久久99-久久999国产免费-久久999精品

張嘯:當AI叩響醫療信息化的門扉——醫信人的破局之路

發布時間:2025-04-01
瀏覽次數:

1.jpg

AI浪潮下的醫信人焦慮與破局之道

  AI浪潮已然席卷而來,無論是否做好準備,它已悄然滲透進每個角落。作為深耕醫院信息化的從業者,我與同行們共享著相似的焦慮:當ChatGPT展現出指數級增長的代碼能力,當智能體按需求自動編寫Python腳本并修正錯誤,當AI生成的技術方案和PPT堪比資深專家手筆,我們不禁叩問:未來的信息部門是否會被AI取代?醫信人的價值坐標將指向何方?

  經過365天的躬身實踐,我可以篤定地回答:那些被AI淘汰的從業者,必然是疏于知識沉淀、拙于提出優質問題、抗拒擁抱新技術的群體。而持續進化的醫信人,永遠能在技術浪潮中找到新的錨點。

  作為兼具行政、技術、醫技多重屬性的復合型角色,本文聚焦于醫學信息技術人員在AI模型探索中的技術突破,暫不展開討論AI在行政辦公領域的賦能實踐。

AI探索之路:從算力困境到模型部署

  2024年初,我和部門一位善于鉆研新技術的工程師(姑且稱他為“由大神”)開啟了AI探索之路。我們共同學習AI知識,我多去了解AI的前沿技術,醫療與AI的結合創新方向,了解國內各大公司的醫療AI進展;大神嘗試各種開源模型,嘗試不同算法,對模型進行RAG訓練和微調。

  想要嘗試AI,算力就是擺在信息部門的第一扇門,由大神日常需要在電腦上運行多個開發環境,對電腦性能要求很高,2023年底曾自費購買5000元級別獨立顯卡用于辦公和研發,雖然當時DeepSeek還沒有橫空出世,人工智能方興未艾,各種大模型如雨后春筍,然而嘗試用這種級別的顯卡運行Qwen模型無疑是奢望。正當束手無策之時,意外發現醫院一臺臨床科室的科研服務器上配有V100,并且科室對GPU的利用率較低。2024年4月,我們在這臺C86上運用Ollama成功部署了Qwen_14B模型,嘗試進行醫療相關的問答。

  2024年6月,深圳大學總醫院依托這臺配備V100訓練卡、安裝了openEuler操作系統和openGauss數據庫的C86服務器,針對院內十萬余份門診病歷,開展了主訴、現病史、體檢信息和診斷結果的提取、數據清洗與標記工作。隨后,我們分別采用qwen2_1.5b模型進行LoRA微調、Qwen2_7B模型進行QLoRA微調。經過數月嘗試,實踐驗證顯示,掛載微調后模型的qwen2在對新病歷進行診斷時,準確率已達到75%以上,為醫療質量控制工作提供了有價值的參考依據。

  或許是上述微小的星火,在向院領導匯報后,2024年12月,醫院采購了一臺配備8張4090 GPU的運算服務器,作為信息部門的AI實驗設備?;谇捌谝烟幚砗玫纳鲜鲠t療數據,我們對Qwen2.5_32B模型進行了微調,進一步提升了智能診斷的準確率。同時,借助SwanLab工具對整個訓練過程進行了可視化展示,以便更直觀地監測和分析訓練情況。

  尤為關鍵的是,憑借強大的算力支撐,我們終于能夠全面發力,突破束縛,多線并行推進。

AI模型應用與優化:從醫療診斷到導診系統

  2025年1月底,DeepSeek驟然走紅。春節后首個工作日,我們便下載了DeepSeek模型。初生牛犢不怕虎的我們,竟大膽嘗試671B模型,然而經過3天3夜的下載,終因算力不足而無法運行。無奈之下,我們轉而下載了70B、32B和1.5B模型。深圳大學總醫院隨后針對此前處理的場景及數據,對DeepSeek_R1_32B模型進行了lora微調,起碼不用因為算力不足使用qlora。憑借該模型卓越的推理能力及其內置的豐富醫療知識,智能診斷的精確性得到了顯著提升。

  2025年2月,全行業均在積極探索AI的步伐,我們也懷揣時不我待的緊迫感,加速推進相關嘗試。

  1.決定嘗試將CDSS的規則引入大模型,并與臨床系統相結合,以探索其是否能夠替代現有的CDSS。為此,首先導出CDSS知識庫,并對臨床決策支持系統(CDSS)的規則庫進行優化處理。由于CDSS的知識庫主要由一系列AND、OR等邏輯表達式構成,大模型難以通過語義理解這些規則。于是,我們首先對CDSS規則庫中的表達式進行鍵值提取,并將其轉換為抽象語法樹(AST),隨后導入數據庫,構建新的知識庫。

  針對可能出現的非標準化輸入,我們采取了多種精確匹配策略:

  (1)提示詞工程與基礎模型問答:運用提示詞工程方法,通過ollamaAPI與基礎模型對錄入內容進行結構化處理。在此過程中,基礎模型可靈活切換,我們陸續嘗試了QWQ_32B、DeepSeek_R1_70B、Gemma_27B、Qwen2.5_32B等多個模型。

  (2)嵌入模型嘗試:采用pkuseg替代嵌入模型的分詞器對醫學詞匯進行分詞。在嵌入模型的選擇上,我們嘗試了BGE、微軟的BiomedNLP、Qwen2.5_3B的微調模型、Google的中文BERT模型、華佗1.5B等。

  (3)詞向量字典匹配:借助多個醫療詞典的詞向量字典進行匹配。

  (4)AST庫匹配:最后運用AST庫進行匹配操作。

  在計算技術方面,我們采用了多GPU并行計算技術,以提升處理效率。經過一系列探索與嘗試,目前中文BERT模型+pkuseg+DeepSeek_R1_70B的組合在匹配效果上暫時表現最佳。

2.jpg

圖1 CDSS規則庫引入大模型效果

  2.導診是AI在醫院覆蓋最常見的場景,從嘗試探索的角度出發,也有必要自己嘗試一遍。初步嘗試采用DeepSeek_R1_70B模型,結合Ollama部署框架與AnythingLLM/OpenWebUI交互界面,構建院內智能知識庫系統,但效果并不理想(圖2)。

3.jpg

圖2 利用開源工具實現的科室推薦效果

  隨后,深圳大學總醫院通過自主全代碼研發的方式,構建了智能導診知識庫。該系統針對院內科室的簡介等信息進行了結構化提取工作。在模型選擇方面,基礎模型選用了DeepSeek_R1_32B,嵌入模型則選用了BGE_Large。經過實踐驗證,該智能導診知識庫能夠準確理解患者的口述內容,并據此精確地為患者推薦合適的就診科室(圖3)。

4.jpg

圖3 導診推導過程

  3.正值深圳大學總醫院即將迎來三甲強化輔導,借此機會醫院共梳理出621項院級制度。由于制度繁多,涉及醫療、行政、藥學、財務、運營、醫保等各個維度,使用查找起來非常耗時,我們通過全代碼自主研發的方式,成功構建了醫院管理制度智能知識庫。針對院內數百萬字的管理制度文本,我們進行了全自動個性化的切片處理,并將處理后的數據存儲于Fassi向量數據庫。為了實現大規模數據的精準索引,醫院綜合運用了多種前沿算法和技術,包括ANN(近似最近鄰)算法、自主研發的混合權重算法(兼顧關鍵字與語義)、Rerank技術以及BM25詞頻排序算法。同時,選用了BGE-reranker-v2-m3模型和BGE-large-zh-v1.5中文嵌入模型,并通過Ollama API接口調用DeepSeekR170B模型。

  在研發過程中,我們對多種算法進行了深度融合,并對多個模型進行了反復嘗試與優化。在系統的交互界面設計方面,支持對各項參數進行精細調整,從而提升數據匹配的精確度,使系統生成的回答更加精準。在計算方式上,我們采用單實例加載模型、多進程并行計算的策略,有效提高了處理效率,并降低了顯存使用。此外,通過對提問進行多重模型解析及優化提示詞工程等手段,進一步提升了知識庫的整體性能。

  此產品一經推出,參與內測的業務同事最喜歡問我一個問題:這個工具能做什么。“能做什么?我也不知道具體能做什么,就看你的想象力了?!碑敃r醫院正值創三甲的關鍵階段,醫院定期出題進行全院考試(錯一題即不及格需補考)。我們最滿意的是,每次考試都讓AI來幫助作答,它全對就可順利過關,它出錯就需要補考。

5.jpg

圖4 RAG醫院所有院級制度的問答助手

  4.深圳大學總醫院在醫生站醫囑系統中深度集成了多模態大模型,借助自然語言處理技術,實現了主訴、現病史、體檢等診療信息的結構化錄入,并支持診斷結論的智能化生成。同時,我們構建了智能問答交互模塊,能夠針對臨床場景提供基于醫學知識的實時推理支持,輔助醫生快速定位診斷要點,為診療決策提供數據化參考依據。

6.jpg

圖5 根據門診病歷輔助診斷及治療方案撰寫

  以上四點是今年2月至3月初一個月的工作情況。在實際醫療工作的多場景應用中,我們對DeepSeekR1、Qwen2.5、Gemma27B、Qwq_32B等不同模型或不同參數版本進行了全面評估,旨在權衡性價比后選出最優方案。

AI時代醫信人的展望與期待

  今年春節后,在一次信息部門周例會上,我滿懷激情地告知部門的15羅漢,AI時代已然來臨。掌握AI開發工具將成為未來信息部門的必備技能,無論是通過編寫代碼,還是利用dify、coze等工具,大家需根據自身情況迅速投入學習。因為未來,任何一個信息系統都有被AI重塑的必要。

  3月,深圳大學總醫院搭建Dify平臺,并在全院范圍內開展推廣工作,鼓勵全體員工參與到智能體(Agent)的開發中來,以充分發揮該平臺在醫療業務場景中的應用價值。由于算力有限,培訓后的當天下午,系統積累到10個并發時,算力服務器就發生了第一次崩潰。

  3月的一天,院長告知我,他了解到DeepSeek可以與PubMed相結合,并希望我們探索其實現的可行性。接到這一需求倍感振奮,因為在AI探索之路上,我們不畏艱難,唯恐缺乏創意與需求。經過努力,我們成功實現了通過提取PubMed摘要并結合AI自身能力,提供更為權威的醫學解答。我們暫且將這一產品命名為“【深圳大學總醫院PubMed文獻查詢系統】MeSH術語轉換模塊”。具體實現方式如下:

  (1)采用迭代優化的英文提示詞工程,通過Ollama API調用Mistral-Small-24B(嘗試各種模型,發現這個法國的小眾模型效果最佳)模型,實現用戶查詢詞到PubMed MeSH術語的精準映射,確保生成術語符合NLM詞表規范。

  (2)在文獻數據獲取方面,基于PubMed官方API構建數據獲取通道,使用OAuth2.0協議完成Google賬戶授權認證,獲取API訪問密鑰;建立包含PMID批量獲取、XML數據解析及特殊字符處理的標準化流程,實現文獻元數據的結構化提取。

  (3)智能問答引擎:通過多模型能力對比實驗,最終選定在特定任務中表現穩定且低幻覺率的Mistral-Small-24B模型。采用多層提示詞優化策略,融合用戶查詢與文獻數據構建上下文,確保生成內容的準確性與邏輯性。

7.jpg

圖6 AI模型??PubMed 本地化工具

  未來,希望不只是院領導,還有更多臨床和行政人員能深入參與醫學人工智能的探索和嘗試,提出有創意的應用場景,一起挖掘可能成為熱門的應用場景。無疑,算力的限制是廣泛部署的難題。可能在您閱讀此文之時,更強大的算力正在計劃之中,或正在努力爭取。AI時代已經到來,醫療信息工作者對探索新技術、新工具的熱情始終高漲。

  (深圳大學總醫院信息技術部數據庫與人工智能工程師由默翰對本文也有貢獻)

  作者簡介

  張嘯,深圳大學總醫院信息技術部主任

主站蜘蛛池模板: 久久久精品国产 | 午夜无码不卡中文字幕最 | 国产爆乳合集在线播放 | www.黄色免费 | 丰满少妇a级毛片 | 99久久免费精品视频在线观看 | 囯产剧情亚洲精品无码一页 | 99视频在线免费观看 | 99久久免费精品国产 | 东京热中文成av人片久久 | 99re6在线视频| 99久久免费国产精品成人一区二区 | 91传媒手机在线观看 | 91麻豆产精品久久久久久夏晴 | 国产91精品一区二区麻豆亚洲电影 | 福利无码1000合集 | 午夜欧美日韩视频 | 高清无码久道中文字幕 | 97碰碰碰免费公开在线视频 | 91人妻精品无码ww九色 | 丁香婷婷综合激情五月色 | 午夜亚洲精品国产 | 97国产欧美精品一区 | 国产av无码专区亚洲av毛片 | 91青青草视频在线观看 | av无码成| 99精品全国免费7观看视频 | 91麻豆成人精品国产免费软件 | 97人洗澡人人澡人人爽人人模 | av永久天堂一区 | 97精品国产97 | 午夜精品视频在线播放 | 91久久精品国产性色也91久久 | 91大神| 韩国午夜理| 丰满爆乳无码一区二区三区 | 午夜三级精品一区二区 | av无码天堂人妻一区二区三区 | 国产av无码精品 | a级国产乱理伦片在线 | 99久久国产综合精品五月天喷水 |