台語羅馬字在過去近兩百年來,累積了數量相當可觀的文本,然而目前能流利閱讀台語羅馬字者並不多,使這些資料的利用價值大大降低。本文主要處理台語的變調問題,實作出台語變調系統。我們採用台語羅馬字書寫的台文語料,以句子為單位,透過台華對譯辭典找出中文翻譯,再從中研院資訊所詞庫小組的八萬目辭典中取得詞類訊息,接著利用我們訂出的變調規則,標記出每個音節的變調註記。台語變調情形有很多種,文中也有較詳盡的敘述。研究結果顯示,訓練語料得到97.56%的變調正確率,測試語料則有88.90%的變調正確率。我們討論了錯誤的原因,希望持續做改進,以達到更高的正確率。 |