中文摘要 |
語音長久以來一直是人類最自然且最容易使用的溝通媒介,無庸置疑地,語音勢必會扮演著未來人類與各種智慧型電子設備間最主要的人機互動媒介,因此自動語音辨識(Automatic Speech Recognition, ASR)技術將會是扮演關鍵且重要的角色。此外,隨著資訊科技的發展,日常生活中充斥著各式各樣的多媒體影音資訊,例如廣播電視節目、語音信件、演講錄影和數位典藏等,然而大部份的多媒體資訊中,語音可以說是最具語意的主要內涵之一,因此,語音辨識技術對多媒體資訊處理也扮演著相當重要的角色。自動語音辨識的挑戰在於給定一段語音訊號,如何讓電腦能夠快速且正確的辨識出語音訊號的內容,並將其轉換成一連串詞序列(Word Sequence)。 |