基於多模態學習模型的新世代聲紋把脈技術

2020-08-21

嗓音問題常見於職業上需要大量用聲的族群,由於聲帶位處喉部深處,需要特殊咽喉內視鏡與經驗充分之專科醫師,方能做出正確診斷並決定後續治療方針。本團隊研發的系統,透過AI學習病理特徵,並協助醫生提升診斷效率。

 

全球首發1: 深度學習識別病理嗓音

使用的深度學習演算法超過了過往研究所使用的其他分類器,在麻省眼耳鼻喉機構公開資料庫及同樣的實驗條件下,可從 98%偵測率再進一步提升至99.14%,為目前文獻中嗓音疾病偵測最好的效能

 

全球首發2: 嗓音疾病自動分類

本團隊發表學界第一篇嗓音疾病自動分類之論文,突破過去單純分別正常異常,應用患者之人口學特徵(如年齡性別)、個人病史(如抽菸喝酒)、以及嗓音相關症狀,即可透過機器學習分類三種常見的嗓音疾病(腫瘤、嗓音誤用、聲帶麻痺),最高之正確率可達83.0%

 

全球首發3: 多模態學習 (病史+嗓音)

本團隊首開國內外研究之先例,成功結合動態聲學訊號與靜態病史記錄,提出多模態融合模型擷取重要資訊,一舉打破過去數十年相關研究僅能做到區分正常或異常嗓音之限制,達到嗓音疾病偵測與同步分類的里程碑分類正確率高達87.26% ± 2.23%

 

 攤位號碼: L826 

 

 合作洽詢:晶片設計商、物聯網整合系統、電腦化輔助診斷系統、健康檢查機構