基於多模態學習模型的新世代聲紋把脈技術

2020-08-21

嗓音問題常見於職業上需要大量用聲的族群，由於聲帶位處喉部深處，需要特殊咽喉內視鏡與經驗充分之專科醫師，方能做出正確診斷並決定後續治療方針。本團隊研發的系統，透過AI學習病理特徵，並協助醫生提升診斷效率。

全球首發１: 深度學習識別病理嗓音

使用的深度學習演算法超過了過往研究所使用的其他分類器，在麻省眼耳鼻喉機構公開資料庫及同樣的實驗條件下，可從 98%偵測率再進一步提升至99.14%，為目前文獻中嗓音疾病偵測最好的效能。

全球首發２: 嗓音疾病自動分類

本團隊發表學界第一篇嗓音疾病自動分類之論文，突破過去單純分別正常異常，應用患者之人口學特徵(如年齡性別)、個人病史(如抽菸喝酒)、以及嗓音相關症狀，即可透過機器學習分類三種常見的嗓音疾病(腫瘤、嗓音誤用、聲帶麻痺)，最高之正確率可達83.0%。

全球首發３: 多模態學習 (病史＋嗓音）

本團隊首開國內外研究之先例，成功結合動態聲學訊號與靜態病史記錄，提出多模態融合模型擷取重要資訊，一舉打破過去數十年相關研究僅能做到區分正常或異常嗓音之限制，達到嗓音疾病偵測與同步分類的里程碑，分類正確率高達87.26% ± 2.23%。

攤位號碼： L826

合作洽詢：晶片設計商、物聯網整合系統、電腦化輔助診斷系統、健康檢查機構