本論文研究聲控智慧電視情況下之電視節目回聲消除,希望在電視節目持續播放的干擾下,仍能收到清晰的語者的語音指令。因此本論文先使用最小方差無失真波束形成器(Minimum Variance Distortionless Response Beamformer,MVDR),指向語者聲源位置。接著以頻域遞迴類神經網路(Recurrent Neural Network,RNN)學習房間響應路徑,清除電視回聲,最後加上頻譜消去法(Spectral Subtraction,SS)做後處理,將殘餘的回聲進一步的濾除掉。實驗針對不同電視節目類型、語者,人聲電視聲訊雜比與語者角度的組合作情境模擬,並以回聲衰減量(Echo Return Loss Enhancement,ERLE)來判斷電視回聲消除效能。實驗顯示,我們提出的方法,在不同情境下皆有良好的電視回聲消除表現,平均ERLE結果為11.75dB,優於傳統的NLMS的5.78dB,且處理速度比一般時域RNN快15倍,的確能有效地濾除電視回聲雜訊。 |