國科會補助中研院計畫,由中研院資訊科技創新研究中心副主任曹昱帶領研究團隊,花9年時間開發AI口語溝通輔助技術,協助口語溝通障礙者改善其生活品質,並提高學習能力,為口語溝通障礙者帶來一線「聲」機。

我是廣告 請繼續往下閱讀
國科會今(23)日於科技大樓舉辦學術研究成果記者會,曹昱長期深耕於深度學習與訊號處理,開發以人為中心的AI技術-基於AI的口語溝通輔助技術。

國科會指出,常見的環境噪音包含交通工具、社會環境和娛樂擴音設備等,常造成語音品質降低,進而影響語音應用體驗,對口語溝通障礙者來說,因為機能的不完全,環境躁音所造成的影響遠比正常人更強烈,為提升語音品質,曹昱團隊提出基於深度學習的語音增強處理演算法。

該演算法可應用在口語溝通障礙者對話時,有效消除環境噪音如附近的車聲、音樂等,降低訊號失真,讓口語溝通障礙者能較清楚聽到對方的聲音,以實現良好的口語溝通品質,同時提昇人與人、人與機器之間的溝通效率。

另外,目前聽障者主要是透過聽覺輔具改善與外界的溝通,但傳統聽覺輔具在有噪音的環境下,常無法得到理想的聲音品質及語音理解度。為提升聽覺輔器效益和提升溝通品質,曹昱團隊致力將AI語音增強技術應用於聽覺輔具上,包括輔聽器、助聽器、人工電子耳,讓聽障人士不只「聽到」更能「聽懂」,降低聽障可能帶來的負面影響,並進一步改善聽損者學習能力和生活品質。

至於口腔癌術後、電子喉、吶語症等構音異常患者,常因口腔動作不協調,造成發音錯誤和語音不清楚,導致溝通障礙和誤會,曹昱團隊則將數項基於AI為基礎的語音增強系統,透過手機,將構音異常患者不清楚的語音轉換為正確的語音發出,提升語音品質和理解度,協助構音異常患者進行表達與溝通,提高與其他人的溝通效率,進而改善人際互動和生活品質。

國科會表示,相關研究成果已發表超過50篇國際期刊論文及120篇國際研討會論文,並與日本、美國和義大利等研究機構進行跨國合作,並獲得國內外各大獎項。曹昱團隊也與仁寶電腦等4間廠商共同合作,將先進AI語音處理技術落地於溝通輔具產品開發,並實際應用於多媒體相關產品開發。

曹昱說,相較於開發更高效的AI機器,研究團隊更著重於運用人工智慧來發展輔具,提供給需要幫助的口語溝通障礙者,讓人工智慧的進步對人類社會有實質上的助益,也讓科學研究更有溫度。