人工智慧語音助理項鍊,不用開口也能下指令!
圖書館內喊「嗨 SIRI」 太尷尬?讓無聲人工智慧語音助理幫助你
直接詢問與指示人工智慧 SIRI,幫忙解決日常的需求,已經是 3C 智慧產品廣泛使用的日常風景。然而,若是在安靜的環境中呢?想像一下,如果你在靜謐的圖書館或是針落有聲的會議室裡,開口詢問:「嘿 Siri,明天天氣如何?」似乎有點尷尬。
當你亟需向你的人工智慧助理下指令,卻遇到上述需要保持安靜、無法說話的情況怎麼辦?
拯救你的無聲尷尬!透過下巴動作就能辨識的語音助理項鍊 SpeeChin
不用擔心!為了拯救你的無聲尷尬,康乃爾大學資訊科學助理教授 Cheng Zhang 和博士生 Ruidong Zhang,發明了一款項鍊型的人工智慧語音助理「SpeeChin」。這款項鍊配備了紅外線鏡頭、微處理器、電池和藍牙模組,項鍊外盒配有可提高穩定性的機翼造型平衡器,亦於項鍊盒底部配置了一枚硬幣以平衡配重。
SpeeChin 特性如同一般項鍊,使用銀鍊掛在脖子上,其紅外線鏡頭裝置於 3D 列印的項鍊盒上方,使鏡頭穩定指向佩戴者的下巴。SpeeChin 能夠基於下巴運動軌跡,捕捉「頸部和臉部皮膚變形圖像」,進而辨識無聲語言。目前的實驗結果顯示,SpeeChin 已能辨識簡單的英文和中文單詞。
已可辨識中英文!移動偵測問題仍待解決
在最初的實驗裡,研究人員測量了 10 名英文使用者及 10 名中文使用者,共 20 位參與者的下巴基線,接著使用差分圖像訓練 SpeeChin 辨識簡單指令,應用機器學習演算法將辨識結果傳到配對的智慧型手機,就像用另一種方式溝通的 Siri。隱私問題也不必擔憂,SpeeChin 只會對準佩戴者的下巴,不會拍到使用者的臉。
實驗方式為:10 位英文使用者無聲說出 54 條指令,包括數字、互動、呼叫語音助理、標點和導航,10 位中文參與者的 44 條指令也一樣。最後實驗結果顯示,SpeeChin 的英文/中文命令辨識能力平均準確率分別為 90.5% 和 91.6%。
此外,研究人員還要求其中 6 名參與者在行走時默念 10 個中文和英文片語,然而因為參與者頭部以不可預測的方式移動,所以最後成功率較低。顯示移動偵測的準確度是尚待解決的問題。
為什麼無聲語音辨識要做成項鍊的形式呢?研究人員認為:項鍊是人們習慣的裝飾品,至於耳掛式設備則可能會有不太舒服的佩戴體驗。雖然人們可能會想「我的手機就是語音辨識設備了啊」,但難免還是會遇到無法出聲的人或場合,此時人工智慧無聲語音辨識的研究就能派上用場
相關文章:
留言列表