智慧醫院產品觀（六）：再談語音交互

作者：李楠發布時間：2021-03-02

我對語音交互這個方向一直有所關注，并于去年年初在CHIMA公眾號發表過兩篇關于語音交互的文章。隨著語音技術作為基礎設施日益完善，我在平時的工作和生活中，用到語音技術的機會也越來越多。

結合以上兩點，談談我對語音技術最新的思考。

語音技術是不是非得跟“寫病歷”這件事綁在一起？

我覺得沒必要。語音技術的利弊和適用場景，我在之前的文章里已經分析得很清楚了。寫病歷這件事，從來不是一件文體不限、鼓勵創新的創作行為。相反，寫病歷是一種受到非常多約束條件的專業文書寫作。一旦產生醫療糾紛、患者維權事件，病歷資料將會是認定醫療機構是否存在醫療過失的重要證據。

有興趣的可以看看下面這本書，這本書我看了好幾遍，受益匪淺。看完之后最大的感受是：寫病歷，還是模板好。因為，一個好的模板，不僅幫醫生框定了病歷的邊界、要素等大部分病歷書寫的核心內容，還做好了前置的標準化工作。剩下的工作，只是專業人員的“完形填空”和“小作文”。

因此，我不建議，一提到語音就往“寫病歷”這件事上去靠，不僅靠不住，還會無形中放大語音技術在這個領域的短板。

語音交互的價值和方向在哪里？

事實上，語音交互已經證明了其作為生產力工具的價值所在。在醫療領域，語音技術在超聲場景中的應用和落地，有目共睹，有興趣的可以看看協和的案例（參見：北京協和醫院：智能語音識別技術賦能超聲檢查模式創新），這個案例在CHIMA舉辦的2020年醫院新興技術創新應用典型案例中，獲得了“醫學人工智能創新方向”二等獎。

在民用領域，語音技術也有很接地氣的案例。我在《智慧醫院產品觀之四：語音交互篇（上）》中，開篇就提到一個很接地氣的案例，即快遞小哥用語音技術輸入快遞地址，簡單方便，非常實用。

現階段，對于語音技術，要給它機會，讓它發展，但不宜讓它挑大梁，更不要過分宣傳，免得被捧殺。

實際上，目前絕大部分手機輸入法中，“語音轉文字”已經是標配，連觸發模式都變得近乎一致（鍵盤底部居中，長按）。

受此啟發，我在年初寫作《下一代醫院信息系統：醫療操作系統》時，便提到：語音交互技術，應該作為一種“基礎設施”，成為醫療操作系統的標配，把選擇和使用的權力交給用戶，把成長的空間留給自己。

語音交互，需要用戶陪跑。

人們常說，陪伴是最長情的告白。近期，我生活中發生的兩件小事，讓我意識到，以語音交互為代表的人工智能技術，需要用戶陪跑。

一是定鬧鐘的事。上文中提到，語音技術是一種“基礎設施”。我生活中常見的語音基礎設施有：家里的某品牌智能音箱，手機上的語音助手，輸入法上的語音轉文字按鈕等等。這些基礎設施，共同構成了環繞在我身邊的一個語音環境。

最近，我對語音技術的看法，隨著一件小事發生了變化。很多人都習慣用手機定鬧鐘，我也一樣。遇到春節假期，自然會考慮關閉接下來一周的鬧鐘，免得美好的假期生活被打擾。

但是，當我想要關閉鬧鐘的時候，問題來了。我的手機上有兩套鬧鐘系統：一套是常規的鬧鐘，也就是系統自帶的“時鐘”應用中，自帶的鬧鐘；另一套鬧鐘在手機的“就寢模式”中，當用戶設定了就寢和起床時間后，手機在相應的時段進行一系列的操作。比如，進入勿擾模式，檢測拿起手機等動作，并在“起床時間”發出提醒，這也算是鬧鐘。

尷尬的事來了，系統自帶的“鬧鐘”應用比較好找，但是，“就寢模式”是近期系統更新后才上線的新功能，入門有點深，使用頻率也不高，我一時半會找不到在哪兒。

當時已經很晚了，我躺在床上，渾身困意，掙扎著用最后一絲清醒，喚醒手機的語音助手，并告訴她：幫我把接下來一周所有的鬧鐘都關了。

實際上，我說這句話時，心里也沒底。畢竟是第一次向語音助手發出這樣“復雜”的指令。平時，我和身邊的語音設施，互動雖然很頻繁，但是內容非常單調，基本上就是用語音控制開關，查一下天氣等等，都是一些非常簡單的操作，對于語音技術，我并沒有抱太大希望。

但是幾秒鐘后，語音助手給出讓我非常滿意的答復：好的，主人。已幫你關閉時鐘和就寢模式下所有的鬧鐘。與此同時，伴隨著語音，屏幕上顯示了可視化的結果：已關閉*個鬧鐘，以及就寢模式下*個鬧鐘。

這幾乎是一個滿分的回答，當晚我很快就睡著了。第二天早上，鬧鐘確實沒響，我睡到自然醒后，又想起這個案例。這個案例最有意思的地方在于：我和語音助手都在“進化”。我下意識地想到用語音交互來解決問題，而它（即語音助手）既聽懂了，也做到了，這是我沒想到的。

說到這里，有人可能想到去嘗試“復現”這個操作，我想說，不一定能實現。這背后，既有后端技術和算法的迭代，更有“前端”我和語音助手之間平時的積累。如果沒有平時我和語音助手之間，那些高頻次的互動，以及略顯單調的話題，我估計它很難在關鍵時刻，聽懂我想要什么，并給出滿意的結果。

二是洗手的事。除了語音之外，近期還有一個例子，讓我印象深刻。在疫情發生后，我的智能手表也更新了一項功能：洗手提醒。當手表感知到用戶在洗手時，會自動啟動20秒倒數計時器，如果檢測到你沒達到洗手時間，它會提示您繼續洗手。

這個功能最初上線時，誤報和漏報的幾率很高。因為手表也在學習，它在根據你手部的動作，傳感器和麥克風傳來的聲音綜合判斷你是否開始洗手。當它“懷疑”你在洗手，會彈出如下提示：

在我看來，這既是邀請用戶標注數據，更是一種良性的互動。每次我遇到這種提示，我都會很自覺的、盡可能真實的反饋問題。帶來的結果是，最近，我的手表檢測洗手的準確度，已經越來越高了。

前幾日，在某行業群里參與討論時，我跟大家分享了這兩個案例。有群友給出結論：AI的成長，需要用戶陪跑（感謝左手醫生創始人兼CEO張超精彩觀點）。

我很是喜歡這句話。用戶一定要認識到，AI不是簡單的商品或者單純的服務，買來就用，用完就走。或者說，你賣你的，我用我的，用得好我就給你點贊，用得不好就發牢騷。

用戶一定要理解AI的特殊性。我之所以樂意為手表標注數據，愿意耐著性子和語音助手互動，是我的醫工背景，加上我對于行業的理解，讓我認識到，AI的價值體現和行業發展，少不了用戶的參與，這種參與不僅僅是購買和使用，更是標注、陪跑這種看似不起眼的小事。

總結

最近，IBM Watson的話題再次登上媒體。對于Watson的失敗，我認為根子在于失衡。投入與產出的失衡，過高的期待值與實際表現之間的失衡等等。

太陽底下沒有新鮮事，在我們讀書時，這種事便屢見不鮮：高考時，有些人奔著清華北大去的，結果考了個重點一本，外界難以接受，自己承受壓力，心態失衡；有人平時默默無聞，無人問津。高考時，考了個重點一本，自己滿意，外界點贊。

語音技術作為人工智能的一個分支，經過大家多年努力，已經體現出自身價值和良好的落地應用場景，已經具備了成為生產力工具的價值和能力。希望這項技術不要被捧殺，也不要被低估，而是按照自己的實際，以自己的配速奔跑，也希望用戶、醫療機構更多的參與和陪跑，多方發力，共同進步。

作者簡介

李楠，CHIMA青年委員。先后畢業于第一軍醫大學生物醫學工程系和蘭州大學信息科學與計算機學院，現供職于某公立三甲醫院，從事信息化工作。作者觀點僅代表個人，純屬技術交流，與供職單位無關。

上一篇：基于患者角度的三級醫院住院信息化服務研究

下一篇：公立醫院多院區模式下績效管理一體化探索與實踐

久久97久久-久久97人人-久久97人人超人人超碰超国产-久久99-久久999国产免费-久久999精品

智慧醫院產品觀（六）：再談語音交互