中文摘要 |
稀疏表示分類器(Sparse Representation Classifier, SRC)是一種基於影像稀疏表示(Sparse Representation)的機器學習方法。在影像以及人臉辨識上的研究上,稀疏表示分類器具有非常好的辨識效果以及強健性。有鑑於SRC在影像辨識上的高鑑別能力,近幾年已有許多基於稀疏表示的語者識別(Speaker Identification)方法相繼被提出。本論文提出一套基於稀疏表示的辨識系統,我們提出以機率型主成份分析(Probabilistic Principle Component Analysis, PPCA)建構超級向量(Supervector),並加入檢定的方式調整特徵值選取,使語者高斯混合模型(Gaussian Mixture Model, GMM)中每個高斯的維度可以針對資料的不同作調整。接著,我們在稀疏字典上加強,透過低秩矩陣還原(Low-Rank Matrix Recovery)以及核化降維(Kernel Dimension Reduction)對說話內容(Session)以及通道(Channel)變異補償,使字典增加鑑別性。最後利用稀疏表示分類器進行分類。根據實驗結果顯示,不論是參數的改進、字典的處理,對辨識率都有一定程度的提升。此外,與傳統的i-vector語者識別系統相比,提出的系統則具有更佳的辨識率表現。 |