黃昊、陳俊羲:DeepSeek應用實踐探索【附2月27日直播預告】
背景篇:從迷茫到真香的AI打怪之路
三年前,領導一句靈魂拷問:"咱醫院信息化和別人比,到底如何?"直接給我整出了"深夜加班梳理建設內容"的劇情。對標完國內相關的智慧醫院建設標準后,我長舒一口氣:幾年建設已經完成了我們的五年規劃。但信息化建設下一步如何發展?繼續卷數據治理?走數字化轉型發展,還是開啟人工智能的應用實踐呢?這又是一個擺在我案頭的問題了。
2023年,隨著ChatGPT帶火全球AI熱搜,答案逐漸清晰——醫療AI將是未來的應用方向,AI不落地,談何高質量發展?于是,我們再次鄭重把"人工智能引擎"寫進了建設規劃。然鵝……現實很骨感:算力貴如金,人才難尋覓,試錯成本高,這些都不是短期能夠完成的任務。咋辦?先加強自身知識儲備吧!
2023年,在參加完人工智能培訓班后打開了新世界大門。雖然日常還是用千問、文心一言搞點"幫娃寫作文"的基本操作,但也養成了每天刷AI公司動態的"賽博養成"習慣。直到2024年某天,幻方公司扔出一顆深水炸彈——開源大模型DeepSeek,評測榜直接屠榜!必須用起來呀,好家伙,初次體驗后,回答深度就直接碾壓我這從業三十年信息老專家!更香的是,它居然支持單卡部署!當即申請了一臺4.8萬的工作站(配RTX4090顯卡),想著就算搞不成,也就只有4.8w,我也沒有那么大負罪感。
2025年春節,就如同窗外的禮花炸響般突然,DeepSeek徹底封神!它憑一己之力打破"算力霸權",讓通用大模型變得像手機APP一樣親民。和其他行業一樣,醫療圈也瞬間被DeepSeek炸鍋了,各家醫院瘋狂內卷AI落地——這一刻,我是又后悔又慶幸,后悔自己沒有提前做算力資源的儲備,慶幸的是,我們的顯卡終于要發光了!如此逆天的應用,我們也可以部署了。
實戰篇:從部署開始的探索
1.知識庫搭建:讓制度文件學會"自動答"
技術組合拳:Dify低代碼平臺 + DeepSeek 14B蒸餾模型 +bge-m3通用向量模型
先說我們的開發部署環境吧,我們采用了dify+DeepSeek的方式。Dify是一個專注于生成式 AI 應用開發的平臺,采用低代碼開發模式,且兼容多個大模型。這也方便以后的應用擴展?;谟布l件,我們先部署了14B的蒸餾模型,并利用bge-m3通用向量模型將信息科的各種制度文檔切成"知識塊"轉化為向量模型,存進數據庫。通過 DeepSeek 提供的 API,將知識庫與模型連接。在調用 DeepSeek 時,將用戶問題轉換為向量,在向量數據庫中進行相似度檢索,獲取相關知識單元向量。將檢索到的知識單元作為上下文信息,與用戶問題一同發送給 DeepSeek 模型,使模型基于知識庫內容生成更準確、符合制度要求的回答。這樣就搭建起了第一個知識庫應用。
通過測試,DeepSeek所具有的強大邏輯分析能力可以將問題轉化后提供最貼切的回答。這一下就激發起了我們的熱情,同時開始深挖硬件潛能,完成了32B版本的部署,于是一邊調整參數一面開始邀請各個部門來參觀,共同探索如何更好的將DeepSeek應用到實際的業務場景。
實踐技巧:經實踐DeepSeek對于Markdown和HTML文件的讀取正確率最佳,word文件如果其中有表格之類的控件,需要進行預處理。
效果:從此,新員工問"怎么申請服務器權限",AI秒回制度條款+操作指南,信息科老員工從此就有了"失業"危機感。
2.代碼生成與審核:程序員的摸魚神器
一直以來程序員都是信息科的心頭寶,能讓IT廠商提供駐場程序員更是醫院夢寐以求的待遇。然而現實情況是,程序員稀少,好的程序員更少。經常我們遇到的就是開發進度無法把控,開發質量難以掌控的痛點。那看看DeepSeek如何發揮作用吧,DeepSeek-Coder-V2能夠根據指令自動生成代碼。
部署方案:DeepSeek-Coder-V2接入VS Code,代碼生成+審核一條龍
實戰案例:讓AI寫個"臨床配送中心資源調度算法",只見它噼里啪啦輸出Python代碼,連異常處理都帶注釋!更絕的是,把祖傳代碼丟給它審核,直接標出3處內存泄漏+解決方案——我不知道工程師怎么想,反正作為信息主任,那一刻我感覺天空是格外的藍。
3.文檔診療室:專治PPT廢話文學
文檔分析能力可是DeepSeek強項,拿一份項目管理文檔給它,看看DS老師給出啥意見。
硬核操作:甩給AI一份項目管理文檔,5分鐘后收獲"標紅批注版"。"第8頁'優化迭代閉環'建議改為'需求-開發-驗證循環';第12頁風險預案缺少備用供應商清單……"這比我看的都快,都仔細。以后我可就輕松多了。
附加Buff:AI的思維過程,還是一個經驗展示的"心路歷程",堪比請了個24小時在線的麥肯錫顧問啊!各位老司機,就問你慌不慌,以后職場小白們都不會找你了。
4.翻車現場:當AI患上"幻覺癥"
大型社死:讓DeepSeek翻譯醫學論文,結果把《炎癥因子機制研究》翻成《小白鼠健身指南》……
這有一篇SCI論文,讓它翻譯寫個摘要。很快,翻譯的中文全文也出來了,看起來像模像樣的,又有點不對味呀。翻出原文讓豆包給翻譯一下,果然,這次翻車了。文章是一篇寫炎性反應研究的醫學論文,而DS給整出了一篇小動物訓練的中文文章。哈哈,不會這就是AI幻覺吧。這里省略1000字,經過查詢,發現了問題所在,DS沒有正確的讀取到這篇PDF的內容,于是它就發揮自己的“想象”,寫出了這篇中文文章。
破案時刻:原來PDF解析模塊“抽風”,AI開啟"一本正經胡說八道"模式。
解決方案:PDF文件通過minicpm-v多模態模型解析+DeepSeek推理,從此AI被迫學會"知之為知之"。讓DeepSeek能夠正確讀取各類數據是我們在實踐過程中不斷遇到的,看來有必要開發一個通用模塊來統一知識庫的數據格式。
5.疾病編碼訓練:從"大而化之"到"精準到細胞"
做好了專屬知識庫就可以利用DeepSeek強大的邏輯分析能力來進行病案編碼了,只需要我們將患者就醫期間的各類病歷文件提供給它,剩下的工作就是等待它出結果。當然前提是我們提供的數據準確性高,標準化程度高。如果只是依靠Deepseek自身的知識庫,它僅僅能實現亞目編碼,還是無法滿足編碼需要。
痛點:內置ICD-10編碼只到亞目,實際需要細化。
改造方案:把我們已經完成的院內標準診斷庫數據喂給AI,結合規則引擎做強化訓練,現在讓AI看到"患者主訴菊花疼",還需要判斷急性期還是慢性,是瘺還是裂,然后再淡定輸出K60.000、K60.100或者K60.301、K60.302、K60.303這些細分項了。
時間在我們的探索中飛逝,DeepSeek的實力也在不斷呈現,短短20多天,我們就已經摸索出了10多項應用,從知識庫的建立到CT片的解讀,心電圖的分析,健康體檢報告的評估。在持續探索中,我們也對硬件進行了升級,現在已經是雙A6000的配置了,速度那是嘎嘎的。對比10年前的移動互聯網醫療的興起,現在DS的應用呈現更快速的迭代升級。每天都有各個行業接入DeepSeek的新聞在轟炸著大眾的眼球,醫療行業也不斷的報道著兄弟醫院的實踐成效,基本上形成了不接入DeepSeek都是落后的態勢。這不僅是給了信息科一個添置GPU硬件條件的契機,更體現各位工程師的學習能力,必須開始惡補人工智能的知識和操作技能。當人工智能在各個行業廣泛應用時,其實不僅僅是程序員面臨下崗的風險,其實原本那些非常緊缺的崗位,比如病案編碼人員,這種依靠大量工作經驗刷出來的崗位,很快也就會被系統替代。
警惕啊朋友們!現在連臨床醫生都能用DeepSeek寫代碼了,信息科再不轉型,恐怕要淪為"重啟開關專業戶"。一句話:擁抱AI,保住工位;原地躺平,必被淘汰!
后記
以上是對我們DeepSeek使用探索的真實記錄,歡迎大家批評指正,共同把DeepSeek這個開源大模型工具用好,解決實際問題。
作者簡介
1 黃昊,CHIMA常委
2 陳俊羲,重慶大坪醫院信息科工程師
CHIMA大講堂直播預告
在數字化轉型的浪潮中,DeepSeek作為數據分析與智能化的利器,已在醫療領域展現出巨大潛力。本期大講堂聚焦DeepSeek系統的部署優化、數據分析及場景探索三大核心模塊,深入探討如何通過技術手段提升醫療服務的智能化水平,為您提供實用的操作技巧與前沿的行業洞察,助力您在醫療數字化轉型中搶占先機。
掃描圖片上方二維碼可線上參會