金域醫學:醫檢大數據的治理和質量改進實踐
本案例獲得CHIMA 2020醫院新興技術創新應用典型案例“醫院數據治理建設”方向三等獎。
廣州金域醫學基于數據中臺的逐步建設,以實現國民健康大數據分析、醫生精準診療、優質醫檢服務為目標,結合社會環境、內部業務發展、外部合作機會,推動醫檢大數據的應用和治理的不斷優化,讓金域深耕行業26年積累下來的數據發揮更大的價值,促進我國醫學檢驗診斷事業的發展和進步。
(1)建立標準醫檢元數據管理體系。
(2)初步完成醫檢基礎數據標準化(含疾病相關維度)。
(3)搭建數據資產管理平臺。
(4)建立數據管理領導工作機制。
(5)面向實際醫檢應用場景,形成整體大數據服務方案支持。
醫檢大數據數據管理和應用的建設思路為:
建設數據后臺:實現業務系統數據、專業系統數據、數字化資源的集中存儲。
建設數據中臺:作為各業務的數據源,為應用系統提供綜合的數據和計算服務。
形成應用規范:以探索臨床疾病大數據價值與應用為導向,推動服務完善與豐富,從而推動數據中臺的建設實現數據服務化,再次推動數據后臺的建設,在過程中逐步形成規范的數字資產管理和應用規范,最終發展數據治理在醫療健康領域的運用。
圖1 醫檢大數據管理和應用建設思路
圖2 金域大數據平臺云架構
圖3 金域醫學數字化建設——中臺數據驅動架構
金域醫學目前已在內地及香港地區建立了37家省級中心醫學實驗室,擁有遍布全國的遠程病理協作網,以及由600多名國內外病理醫生加盟組成的病理醫生團隊,為超過22000家醫療機構提供準確、及時、便捷的醫學檢驗及病理診斷服務。服務網絡覆蓋全國90%上人口所在區域,并以香港為橋頭堡,服務粵港澳大灣區以及“一帶一路”沿線國家和地區。通過對接國際和自主創新、成果轉化等多種方式,金域醫學可提供超過2700項檢測項目。年檢測標本量超7000萬例,積累了全球領先的東方人種大樣本、大數據庫,并以此為基礎推動體外診斷產業和人工智能診斷的原始創新。
醫檢大數據是金域的重要數字化資產,同時也是金域醫學用切實行動助力健康中國夢,幫助醫生看好病,提供優質醫檢服務的有力抓手。
醫檢大數據數據管理和應用建設,將主要沿以下技術路線進行建設:
(1)根據前期公司戰略規劃和IT規劃,規劃數據中臺,逐步建設數據底座。
1)醫檢數據中心化。實現金域歷史數據的集中存儲,規劃并逐步實施數字病理切片等非結構化數據的集中存儲。
2)檢驗數據標準化。對異構的檢驗數據進行梳理,建設標準化的統一數據結構,并以此形成數據字典,其中具備受檢者、臨床信息、檢驗信息等關鍵字段。
(2)逐步推進數據治理工作,為檢驗生產運營提供數據服務支持。
1)將檢測結果信息結構化,向內部用戶提供查詢與下載接口,向醫院客戶提供WEB自助查詢服務。
2)對檢測TAT時間實現標準化管理,以分析檢測產品屬性,服務生產運營。
3)按業務發展和科研的需要,聚焦特定疾病,結合臨床專家意見,以疾病線為維度對數據進行清洗、標準化與結構化工作,并且推出對應的數據分析、知識管理等服務,反饋生產運營。
圖4 金域醫學健康大數據云平臺
(1)建立標準醫檢元數據管理體系
對采集源端數據庫信息和存儲目標端數據庫信息的元數據進行管理,制定標準元數據管理規范,使用大數據技術,對數據資源進行解析、清洗、轉化、聚合、過濾、計算、整合管理;構建精準醫學大型知識庫元數據標準管理規范。建設過程中,逐步形成以下流程和管理規范:
《集團經營數據字典》:涉及集團經營數據的口徑、來源、數據負責部門、統計周期。
《集團數據資產標準化定義及數據服務規范》:涉及數據規范、指標體系、數據服務定義。
《集團數據資產標準化建設規范》:涉及項目管理、數據驗證、項目驗收等。
《集團數據資產管理規范》:涉及安全、數據應用范圍、保密等級等。
圖5 數據字典
圖6 元數據管理
(2)初步完成醫檢基礎數據標準化(含疾病相關維度)
面向醫檢、臨床疾病與運營基礎數據標準化的目標,為數據資產管理建立一套數據標準和數據模型,實現病理數字切片與檢測數據標準化,例如:
圖7 產品結構標準化
圖8 實驗室檢測項目標準化
(3)搭建數據資產管理平臺
金域醫檢大數據平臺已經集中26.2T結構化數據,57.82T的非結構化數據。涉及物流標本量1.24億;報告單1.71億;病人8234.5萬;項目檢測次數5.84億;項目種類數:2709;申請單1.31億;醫院:4.33萬;醫生:153.73萬。經過數據治理已經標準化120萬的維生素D數據,13萬的腎臟疾病數據。
金域醫學通過建立數據字典、數據模型,對集團各業務系統的數據進行盤點與歸類,并已搭建數據資產管理平臺,為后續數據的資產化,資產的價值化提供有效的工具支撐。
圖9 數據資產管理平臺界面
(4)建立數據管理領導工作機制
1)建立數據領導小組:由CEO擔任領導小組組長,領導小組成員為集團辦公會成員。
主要職責包括數據和指標需求的決策、數據讀取的授權范圍和核準等。
2)建立數據工作小組:
① 梳理并提出醫檢業務主要數據指標的整體需求方案,包括明確數據的定義、計算口徑,數據收集和錄入的方式、提供數據的責任部門,形成統一的數據字典。
② 協調、統籌總部各部門、子公司,實施數據收集與錄入。
③ 通過IT技術在數據資產管理平臺中實現數據呈現,并推廣、宣傳、培訓平臺相關應用。
圖10 數據工作職責結構
梳理完成新冠業務數據,為金域在全國‘一盤棋’集團化的抗疫作戰模式提供數據支持。
新冠肺炎疫情期間,金域醫學集團依托自身病毒檢測能力和物流網絡等專業優勢,截至7月中旬,已在包括湖北、廣東、北京、上海等全國29個省市區,以及香港特別行政區獲授權,接受委托,陸續開展篩查、發熱門診、住院、院內感染、復工、復學及入境等相關人員的核酸檢測和抗體檢測。截至6月底,集團累計核酸檢測總計超2500萬,日檢測產能達25萬。為了讓管理層全面了解疫情對業務的影響,項目對新冠檢測底層業務數據進行梳理,分析,每日動態展示業務量和標本量,結合不含新冠的數據,以便及時掌握受新冠影響的情況,以及掌握正常業務恢復的情況。
圖11 新冠業務數據分析展示
圖12 新冠檢測標本量查詢SQL語句
中共中央國務院2020年3月30日發出的《關于構建更加完善的要素市場和配置體制機制的意見》,將數據治理與應用的提到了新的政策高度。金域醫學將持續推進數據中臺與數據治理同生共長,關注目前已在或者將在應用場景中使用的數據,并追溯到該數據所引用的源頭數據開展治理,最大限度的優化數據治理的資源投入,提高數據治理的功效,通過數據需求、數據質量、元數據管理等領域加強數據治理。其具體舉措包括:
(1)構建企業級數據模型,指引業務系統建設
在數據中臺建設中,以數據應用為指導,梳理業務流程、業務數據,構建企業級數據模型,建立模型原則與規范,并應用到源頭系統的設計與審核過程中,有效提升源頭系統數據的統一性。
(2)增強業務需求管理,構建并持續完善數據標準體系
收集各層級管理人員和業務分析人員的業務需求,持續提煉數據中臺業務需求,依據需求及管理辦法,落地與集團數據標準體系相吻合的指標體系。
(3)提升元數據的數據質量,深化元數據分析及應用,實現數據資產化管理
通過數據中臺建設流程,整理業務層面的數據資產目錄,以及維護開發方面的物理數據模型和數據字典,實現數據資源的語義化,并通過識別和追蹤數據在全生命周期的各個形態和變化,實現元數據的分析管理。
(4)將數據治理融入到數據中臺開發團隊中
在數據中臺的整個過程開發和運營過程中,開發與運維部門應主動參與或者主導數據治理過程,積極建立數據質量管理機制,推動落實數據管理流程,輔助數據治理歸口管理部門,發現與解決數據質量問題。
(5)構建閉環的數據問題反饋機制,持續監控數據問題
針對數據中臺識別發現的數據問題,開發與運維部門應與源頭系統的開發、變更及后續質量控制相統一和協調,讓源頭系統的業務和開發人員成為數據中臺數據治理的支持者和操作者。
金域醫學希望通過推進醫檢大數據及數據中臺戰略的落地,實現數據標準化、業務數據化、數據資產化、資產價值化,進而推動醫檢行業數字化轉型。