根據神經生理學研究,耳朵會針對聲音的各個頻率進行分頻,並產生出聽覺頻譜,研究人員根據專注聽覺現象和生物聽覺實驗,也發現了大腦聽覺皮質上神經作用的模式。於本論文中,我們運用類神經網路,建構出一種模擬人類聽覺的類神經網路模型,並在語者識別這個應用上進行討論,期望能成功連結神經生理學的知識與工程的技術。而我們所設計的模型,是利用兩層不同維度的卷積神經網路(Convolutional Neural Network),分別模擬初期耳蝸階段及大腦皮質階段,透過設計卷積核初始值,即耳蝸階段多組一維分頻濾波器和大腦皮質階段同時解析時頻資訊的二維濾波器,以使模型能夠快速地達到收斂狀態。而透過模型訓練,根據目的與環境變因的不同,模型會自動調整其中參數,使輸入資料映射至目標的型態。同時我們也針對所提出的模型架構,進行了多種形態的比較,進而發現在給定初始值的狀況下,即使訓練不夠充分,也能產生不錯的結果。 |