北京友誼醫(yī)院:OCR文字識別助力放射防護(hù)精細(xì)化管理
CHIMA 2020醫(yī)院新興技術(shù)創(chuàng)新應(yīng)用優(yōu)秀案例征集自啟動(dòng)以來,獲得了業(yè)內(nèi)各方的積極響應(yīng)。CHIMA將陸續(xù)刊登參評案例,展示醫(yī)療信息技術(shù)科技創(chuàng)新應(yīng)用成果。案例征集截止日期為11月5日,歡迎大家踴躍投稿。
2019年6月,根據(jù)北京市衛(wèi)生健康委關(guān)于印發(fā)《2019年北京市放射衛(wèi)生監(jiān)測項(xiàng)目工作方案的工作》的通知:推進(jìn)2019年職業(yè)病防治項(xiàng)目,切實(shí)做好北京市職業(yè)性放射性疾病監(jiān)測、醫(yī)療衛(wèi)生機(jī)構(gòu)醫(yī)用輻射防護(hù)監(jiān)測、非醫(yī)療機(jī)構(gòu)放射性危害因素監(jiān)測等3項(xiàng)監(jiān)測工作,各區(qū)需要在轄區(qū)范圍內(nèi)選擇部分醫(yī)療機(jī)構(gòu)作為試點(diǎn)開展監(jiān)測工作,并逐漸將范圍覆蓋全市各區(qū)、各級醫(yī)療衛(wèi)生機(jī)構(gòu)。
北京友誼醫(yī)院作為其中一家監(jiān)測試點(diǎn)醫(yī)療機(jī)構(gòu),需填報(bào)“北京市放射衛(wèi)生監(jiān)測數(shù)據(jù)庫”,上傳所有放射工作人員的職業(yè)健康檢查結(jié)果、個(gè)人劑量監(jiān)測數(shù)據(jù)、持證在崗培訓(xùn)情況,與各放射診療設(shè)備檢測數(shù)據(jù)。但放射人員數(shù)據(jù)復(fù)雜、設(shè)備種類繁多,如果依賴手工統(tǒng)計(jì)整理,工作量龐大,需要通過建設(shè)信息化系統(tǒng)實(shí)現(xiàn)放射相關(guān)數(shù)據(jù)的統(tǒng)一管理與業(yè)務(wù)流程規(guī)范化,在此背景下,我院建設(shè)了放射防護(hù)管理系統(tǒng)。
放射工作人員的體檢情況與操作培訓(xùn)是否合格、每臺設(shè)備儀器的定期檢測結(jié)果是否正常,一直是醫(yī)院放射防護(hù)管理中的重點(diǎn)工作,需要及時(shí)掌握情況并做出正確措施以保證放射防護(hù)工作的正常開展,但之前由于沒有信息化系統(tǒng)支撐,存在以下管理痛點(diǎn):
(1)對于每年度或者季度的人員體檢報(bào)告、劑量筆檢測報(bào)告、設(shè)備檢測報(bào)告,各個(gè)檢測服務(wù)商基本以PDF電子掃描版或者紙質(zhì)版提供,醫(yī)院管理人員無法直接用于線上管理,只能通過手工方式在excel表中一一錄入,效率低下,而且難免錯(cuò)漏。
(2)當(dāng)出現(xiàn)體檢結(jié)果或者設(shè)備檢測結(jié)果有問題的報(bào)告,管理人員只能通過線下單一溝通方式,進(jìn)行科室之間聯(lián)系通知,溝通成本大,而且對后續(xù)的復(fù)查進(jìn)度與效果難以把控,管理工作質(zhì)量無法保證。
(3)管理部門與各放射診療科室之間,關(guān)于放射防護(hù)管理工作的信息無法及時(shí)共享,經(jīng)常出現(xiàn)信息不對等情況而影響工作成果與效率。
我院通過梳理放射防護(hù)管理工作中遇到的實(shí)際問題,于2019年7月,從需求調(diào)研階段開始建設(shè)放射防護(hù)管理系統(tǒng),對各放射診療相關(guān)人員及設(shè)備的基本信息進(jìn)行統(tǒng)一線上管理,并通過OCR文字識別技術(shù)(簡稱OCR)自動(dòng)采集人員體檢報(bào)告或設(shè)備檢測報(bào)告結(jié)果數(shù)據(jù),同時(shí)支持管理工作中所需要的多種維度的數(shù)據(jù)分析、統(tǒng)計(jì)與導(dǎo)出。
(1)系統(tǒng)架構(gòu)
放射防護(hù)管理系統(tǒng)采用分層的系統(tǒng)架構(gòu),從下至上分為數(shù)據(jù)接入層、聚合層、服務(wù)層和應(yīng)用層,層與層之間只需通過標(biāo)準(zhǔn)接口就可實(shí)現(xiàn)交互,滿足高內(nèi)聚,低耦合特點(diǎn),便于后期版本迭代,功能拓展。
系統(tǒng)架構(gòu)示意圖如下:
圖1 放射防護(hù)管理系統(tǒng)架構(gòu)圖
數(shù)據(jù)接入層:
系統(tǒng)數(shù)據(jù)接入方式包括三類:企業(yè)服務(wù)總線、ETL及API。企業(yè)服務(wù)總線是實(shí)時(shí)地從信息平臺訂閱生產(chǎn)數(shù)據(jù),根據(jù)條件規(guī)則,將滿足條件的數(shù)據(jù)存儲(chǔ)到系統(tǒng)數(shù)據(jù)庫;ETL方式是按照系統(tǒng)同步轉(zhuǎn)換規(guī)則,定時(shí)從其他業(yè)務(wù)系統(tǒng)獲取數(shù)據(jù)并進(jìn)行存儲(chǔ);API集成方式通過API接口實(shí)時(shí)獲取其他系統(tǒng)的業(yè)務(wù)數(shù)據(jù)。
聚合層:
采用關(guān)系型數(shù)據(jù)庫,將不同數(shù)據(jù)接入方式的業(yè)務(wù)數(shù)據(jù),按照數(shù)據(jù)模型集中存儲(chǔ)到本地?cái)?shù)據(jù)庫中,提高數(shù)據(jù)的訪問效率,同時(shí)存儲(chǔ)隨訪系統(tǒng)用到的標(biāo)準(zhǔn)化字典及知識庫數(shù)據(jù)。
服務(wù)層:
主要提供文件管理服務(wù)、OCR識別服務(wù)、統(tǒng)計(jì)分析服務(wù)、消息提醒服務(wù)及統(tǒng)一通訊服務(wù)。圍繞著上層的應(yīng)用,服務(wù)層完成系統(tǒng)的核心業(yè)務(wù)功能,為表現(xiàn)層提供基于業(yè)務(wù)的操作管理功能,主要實(shí)現(xiàn)報(bào)告導(dǎo)入,文字識別,數(shù)據(jù)的統(tǒng)計(jì)分析、消息提醒等功能。
表現(xiàn)層:
提供B/S架構(gòu)的展現(xiàn)界面,為系統(tǒng)使用者提供豐富靈活、友好的人機(jī)界面,同時(shí)要確保信息展示的完整性、準(zhǔn)確性、時(shí)效性。主要功能包括:人員管理、設(shè)備管理、監(jiān)督管理、證件管理、消息提醒等。
(2)關(guān)鍵技術(shù)一:OCR技術(shù)
計(jì)算機(jī)文字識別,俗稱光學(xué)字符識別,英文全稱是Optical Character Recognition(簡稱OCR),它是利用光學(xué)技術(shù)和計(jì)算機(jī)技術(shù)把印在或?qū)懺诩埳系奈淖肿x取出來,并轉(zhuǎn)換成一種計(jì)算機(jī)能夠接受、人又可以理解的格式。OCR技術(shù)是實(shí)現(xiàn)文字高速錄入的一項(xiàng)關(guān)鍵技術(shù)。
放射防護(hù)管理系統(tǒng)利用OCR技術(shù),將紙質(zhì)掃描版的放射人員年度或季度體檢報(bào)告、各個(gè)檢測服務(wù)廠商提供的設(shè)備檢測報(bào)告進(jìn)行識別讀取轉(zhuǎn)換存儲(chǔ)到系統(tǒng)數(shù)據(jù)庫中去。
圖2 OCR技術(shù)識別提取
目前系統(tǒng)中涉及到三大類報(bào)告分別為:人員體檢報(bào)告、人員劑量筆報(bào)告、設(shè)備檢測報(bào)告;需要從人員體檢報(bào)告中識別獲?。喝藛T身份信息,體檢結(jié)果及結(jié)論,體檢日期等有效信息;人員劑量筆檢測報(bào)告需要獲?。簞┝拷y(tǒng)計(jì)時(shí)間、個(gè)人劑量值等有效信息;設(shè)備檢測報(bào)告需要獲取:設(shè)備編號,設(shè)備廠商,檢測日期,檢測結(jié)果,設(shè)備使用地等有效信息。
通過將上述有效關(guān)鍵信息項(xiàng)識別提取之后,準(zhǔn)確填充到系統(tǒng)對應(yīng)數(shù)據(jù)庫中用于數(shù)據(jù)分析管理。
圖3 相關(guān)報(bào)告
最初直接使用OCR技術(shù)時(shí),由于上述相關(guān)報(bào)告來自于多家檢測服務(wù)商,報(bào)告格式各不相同,內(nèi)容形式也不統(tǒng)一,同時(shí)由于掃描紙質(zhì)版報(bào)告過程中會(huì)存在一系列的操作問題出現(xiàn):清晰度不夠、公章水印覆蓋、標(biāo)題順序差異、部分報(bào)告缺失關(guān)鍵首頁等各種現(xiàn)象,導(dǎo)致在進(jìn)行識別時(shí)準(zhǔn)確率不足50%,有的報(bào)告甚至不足20%。
為了解決此問題,提高OCR識別準(zhǔn)確率,信息技術(shù)人員經(jīng)過不斷地試驗(yàn)訓(xùn)練,對識別的圖像進(jìn)行預(yù)處理:包括圖像裁剪、矢量偏移、灰度化、降噪處理等技術(shù)提高關(guān)鍵信息的識別度、并通過特征提取、系統(tǒng)容錯(cuò)處理等手段對采集到的信息進(jìn)行校驗(yàn)修正,從而提高文字識別率和準(zhǔn)確率,經(jīng)統(tǒng)計(jì),目前為止,識別數(shù)總共4361項(xiàng),準(zhǔn)確率為92%以上。對于識別不準(zhǔn)的項(xiàng)目,系統(tǒng)會(huì)給出原因提示,告知用戶由于圖像質(zhì)量問題導(dǎo)致識別不到掃描項(xiàng),提醒用戶需要進(jìn)行修改編輯;另外對于識別到的關(guān)鍵項(xiàng)信息,系統(tǒng)也做了標(biāo)識處理,達(dá)到快速定位的目的,方便使用人員快速定位及進(jìn)一步核查。
圖4 圖像處理技術(shù)
(3)關(guān)鍵技術(shù)二:利用統(tǒng)一的通訊服務(wù)平臺進(jìn)行消息推送
利用統(tǒng)一的通訊服務(wù)平臺,不同的消息類型采用不同的消息模板通過分支選擇推送到相應(yīng)角色的人員。
圖5 消息推送提醒
(1)實(shí)現(xiàn)放射人員與設(shè)備的一體化管理
建立統(tǒng)一的放射人員及設(shè)備信息管理平臺,將醫(yī)院各科室種類繁多的相關(guān)電子報(bào)告導(dǎo)入到系統(tǒng)中,并對各管理版本的報(bào)告進(jìn)行處理存儲(chǔ)到數(shù)據(jù)庫中,提供查看、核對;并對體檢不合格人員進(jìn)行預(yù)警通知,支持?jǐn)?shù)據(jù)導(dǎo)出等操作功能,并通過權(quán)限管理設(shè)定,實(shí)現(xiàn)多科室全方位一體化管理。
本年度已經(jīng)通過信息化管理所有放射相關(guān)人員與各類放射診療設(shè)備,大幅度提升管理效率。
圖6 年度管理報(bào)告數(shù)
(2)通過高識別準(zhǔn)確率的OCR技術(shù)擺脫低效手工作業(yè)
借助OCR技術(shù),將放射防護(hù)管理人員由之前的查閱人員體檢報(bào)告、劑量值檢測報(bào)告后人工錄入到Excel中的繁瑣工作中解脫出來,現(xiàn)在只需要短短的幾分鐘便可將之前可能需要花費(fèi)數(shù)天的統(tǒng)計(jì)內(nèi)容清晰明了地展示在系統(tǒng)中,供管理人員查看導(dǎo)出等操作,使數(shù)據(jù)采集更加高效便捷,節(jié)省了人工操作時(shí)間,同時(shí)也大大提高正確率。
根據(jù)分析統(tǒng)計(jì),設(shè)備檢測報(bào)告平均識別準(zhǔn)確率為95.2%,劑量筆檢測報(bào)告識別準(zhǔn)確率為96.02%,而體檢報(bào)告識別準(zhǔn)確率已經(jīng)高達(dá)100%。
圖7 OCR識別準(zhǔn)確率
(3)消息推送提醒更加及時(shí),改變線下單一溝通方式
管理人員可以直接在系統(tǒng)中設(shè)定體檢不合格需要復(fù)查的人員或者有培訓(xùn)排期的人員,系統(tǒng)將自動(dòng)推送通知消息給相應(yīng)人員,并及時(shí)高效地得到信息反饋,與之前一對一的線下溝通的方式相比,節(jié)省了大量的時(shí)間,降低了溝通成本。
(4)監(jiān)督整改工作實(shí)現(xiàn)流程閉環(huán)管理
放射防護(hù)管理人員進(jìn)行監(jiān)督檢查后通過系統(tǒng)發(fā)送督辦事項(xiàng)提醒,相關(guān)科室進(jìn)行分析整改、持續(xù)改進(jìn)形成完整的知識體系,實(shí)現(xiàn)了整個(gè)監(jiān)督整改的閉環(huán)管理。
圖8 消息推送提醒
基于放射防護(hù)系統(tǒng)的建設(shè),實(shí)現(xiàn)了對放射相關(guān)人員基本信息、體檢報(bào)告、培訓(xùn)報(bào)告、劑量筆檢測報(bào)告及放射設(shè)備基本信息、檢測報(bào)告、防護(hù)儀器、防護(hù)用品、質(zhì)控設(shè)備的統(tǒng)一管理,提高效率與管理質(zhì)量。實(shí)現(xiàn)了管理部門對于整改過程中的閉環(huán)管理。通過統(tǒng)一通訊服務(wù),更加及時(shí)對相關(guān)人員進(jìn)行消息提醒,提升了對相關(guān)工作的精細(xì)化管理水平。
隨著醫(yī)院后續(xù)進(jìn)一步的管理需要,在滿足數(shù)據(jù)接入的條件下,繼續(xù)做好與其他業(yè)務(wù)系統(tǒng)的集成工作;后續(xù)相關(guān)體檢機(jī)構(gòu)與設(shè)備廠商能夠提供電子化文檔數(shù)據(jù)進(jìn)行對接后,便可以進(jìn)一步提高錄入效率及準(zhǔn)確率。同時(shí)在保障醫(yī)療數(shù)據(jù)安全前提下,根據(jù)業(yè)務(wù)靈活調(diào)整平臺功能模塊,持續(xù)優(yōu)化平臺功能,提高易用性及可靠性。
申報(bào)單位:
首都醫(yī)科大學(xué)附屬北京友誼醫(yī)院
聯(lián)合申報(bào)單位:
北大醫(yī)療信息技術(shù)有限公司
參選方向:
人工智能創(chuàng)新應(yīng)用