智慧醫院產品觀(六):再談語音交互
我對語音交互這個方向一直有所關注,并于去年年初在CHIMA公眾號發表過兩篇關于語音交互的文章。隨著語音技術作為基礎設施日益完善,我在平時的工作和生活中,用到語音技術的機會也越來越多。
結合以上兩點,談談我對語音技術最新的思考。
我覺得沒必要。語音技術的利弊和適用場景,我在之前的文章里已經分析得很清楚了。寫病歷這件事,從來不是一件文體不限、鼓勵創新的創作行為。相反,寫病歷是一種受到非常多約束條件的專業文書寫作。一旦產生醫療糾紛、患者維權事件,病歷資料將會是認定醫療機構是否存在醫療過失的重要證據。
有興趣的可以看看下面這本書,這本書我看了好幾遍,受益匪淺。看完之后最大的感受是:寫病歷,還是模板好。因為,一個好的模板,不僅幫醫生框定了病歷的邊界、要素等大部分病歷書寫的核心內容,還做好了前置的標準化工作。剩下的工作,只是專業人員的“完形填空”和“小作文”。
因此,我不建議,一提到語音就往“寫病歷”這件事上去靠,不僅靠不住,還會無形中放大語音技術在這個領域的短板。
事實上,語音交互已經證明了其作為生產力工具的價值所在。在醫療領域,語音技術在超聲場景中的應用和落地,有目共睹,有興趣的可以看看協和的案例(參見:北京協和醫院:智能語音識別技術賦能超聲檢查模式創新),這個案例在CHIMA舉辦的2020年醫院新興技術創新應用典型案例中,獲得了“醫學人工智能創新方向”二等獎。
在民用領域,語音技術也有很接地氣的案例。我在《智慧醫院產品觀之四:語音交互篇(上)》中,開篇就提到一個很接地氣的案例,即快遞小哥用語音技術輸入快遞地址,簡單方便,非常實用。
現階段,對于語音技術,要給它機會,讓它發展,但不宜讓它挑大梁,更不要過分宣傳,免得被捧殺。
實際上,目前絕大部分手機輸入法中,“語音轉文字”已經是標配,連觸發模式都變得近乎一致(鍵盤底部居中,長按)。
受此啟發,我在年初寫作《下一代醫院信息系統:醫療操作系統》時,便提到:語音交互技術,應該作為一種“基礎設施”,成為醫療操作系統的標配,把選擇和使用的權力交給用戶,把成長的空間留給自己。
人們常說,陪伴是最長情的告白。近期,我生活中發生的兩件小事,讓我意識到,以語音交互為代表的人工智能技術,需要用戶陪跑。
一是定鬧鐘的事。上文中提到,語音技術是一種“基礎設施”。我生活中常見的語音基礎設施有:家里的某品牌智能音箱,手機上的語音助手,輸入法上的語音轉文字按鈕等等。這些基礎設施,共同構成了環繞在我身邊的一個語音環境。
最近,我對語音技術的看法,隨著一件小事發生了變化。很多人都習慣用手機定鬧鐘,我也一樣。遇到春節假期,自然會考慮關閉接下來一周的鬧鐘,免得美好的假期生活被打擾。
但是,當我想要關閉鬧鐘的時候,問題來了。我的手機上有兩套鬧鐘系統:一套是常規的鬧鐘,也就是系統自帶的“時鐘”應用中,自帶的鬧鐘;另一套鬧鐘在手機的“就寢模式”中,當用戶設定了就寢和起床時間后,手機在相應的時段進行一系列的操作。比如,進入勿擾模式,檢測拿起手機等動作,并在“起床時間”發出提醒,這也算是鬧鐘。
尷尬的事來了,系統自帶的“鬧鐘”應用比較好找,但是,“就寢模式”是近期系統更新后才上線的新功能,入門有點深,使用頻率也不高,我一時半會找不到在哪兒。
當時已經很晚了,我躺在床上,渾身困意,掙扎著用最后一絲清醒,喚醒手機的語音助手,并告訴她:幫我把接下來一周所有的鬧鐘都關了。
實際上,我說這句話時,心里也沒底。畢竟是第一次向語音助手發出這樣“復雜”的指令。平時,我和身邊的語音設施,互動雖然很頻繁,但是內容非常單調,基本上就是用語音控制開關,查一下天氣等等,都是一些非常簡單的操作,對于語音技術,我并沒有抱太大希望。
但是幾秒鐘后,語音助手給出讓我非常滿意的答復:好的,主人。已幫你關閉時鐘和就寢模式下所有的鬧鐘。與此同時,伴隨著語音,屏幕上顯示了可視化的結果:已關閉*個鬧鐘,以及就寢模式下*個鬧鐘。
這幾乎是一個滿分的回答,當晚我很快就睡著了。第二天早上,鬧鐘確實沒響,我睡到自然醒后,又想起這個案例。這個案例最有意思的地方在于:我和語音助手都在“進化”。我下意識地想到用語音交互來解決問題,而它(即語音助手)既聽懂了,也做到了,這是我沒想到的。
說到這里,有人可能想到去嘗試“復現”這個操作,我想說,不一定能實現。這背后,既有后端技術和算法的迭代,更有“前端”我和語音助手之間平時的積累。如果沒有平時我和語音助手之間,那些高頻次的互動,以及略顯單調的話題,我估計它很難在關鍵時刻,聽懂我想要什么,并給出滿意的結果。
二是洗手的事。除了語音之外,近期還有一個例子,讓我印象深刻。在疫情發生后,我的智能手表也更新了一項功能:洗手提醒。當手表感知到用戶在洗手時,會自動啟動20秒倒數計時器,如果檢測到你沒達到洗手時間,它會提示您繼續洗手。
這個功能最初上線時,誤報和漏報的幾率很高。因為手表也在學習,它在根據你手部的動作,傳感器和麥克風傳來的聲音綜合判斷你是否開始洗手。當它“懷疑”你在洗手,會彈出如下提示:
在我看來,這既是邀請用戶標注數據,更是一種良性的互動。每次我遇到這種提示,我都會很自覺的、盡可能真實的反饋問題。帶來的結果是,最近,我的手表檢測洗手的準確度,已經越來越高了。
前幾日,在某行業群里參與討論時,我跟大家分享了這兩個案例。有群友給出結論:AI的成長,需要用戶陪跑(感謝左手醫生創始人兼CEO張超精彩觀點)。
我很是喜歡這句話。用戶一定要認識到,AI不是簡單的商品或者單純的服務,買來就用,用完就走。或者說,你賣你的,我用我的,用得好我就給你點贊,用得不好就發牢騷。
用戶一定要理解AI的特殊性。我之所以樂意為手表標注數據,愿意耐著性子和語音助手互動,是我的醫工背景,加上我對于行業的理解,讓我認識到,AI的價值體現和行業發展,少不了用戶的參與,這種參與不僅僅是購買和使用,更是標注、陪跑這種看似不起眼的小事。
最近,IBM Watson的話題再次登上媒體。對于Watson的失敗,我認為根子在于失衡。投入與產出的失衡,過高的期待值與實際表現之間的失衡等等。
太陽底下沒有新鮮事,在我們讀書時,這種事便屢見不鮮:高考時,有些人奔著清華北大去的,結果考了個重點一本,外界難以接受,自己承受壓力,心態失衡;有人平時默默無聞,無人問津。高考時,考了個重點一本,自己滿意,外界點贊。
語音技術作為人工智能的一個分支,經過大家多年努力,已經體現出自身價值和良好的落地應用場景,已經具備了成為生產力工具的價值和能力。希望這項技術不要被捧殺,也不要被低估,而是按照自己的實際,以自己的配速奔跑,也希望用戶、醫療機構更多的參與和陪跑,多方發力,共同進步。
上一篇: 基于患者角度的三級醫院住院信息化服務研究