月旦知識庫
 
  1. 熱門:
 
首頁 臺灣期刊   法律   公行政治   醫事相關   財經   社會學   教育   其他 大陸期刊   核心   重要期刊 DOI文章
ROCLING論文集 本站僅提供期刊文獻檢索。
  【月旦知識庫】是否收錄該篇全文,敬請【登入】查詢為準。
最新【購點活動】


篇名
讓格書寫以及台華互譯初探
並列篇名
LangGeh Orthography and an Initial Study of Statistical Translation Between Taiwanese and Mandarin
作者 江永進楊佩琪林淑卿張春凰高明達呂仁園陳孟彰
中文摘要
讓格書寫是新近提議的書寫方式,主張在語句中適當的地方加上空白字元,適合台客華語等使用漢字e文字系統。大體上講,讓格書寫是分簡短詞組,對比的是英語的分詞書寫,傳統華語的分句書寫,以及語言技術的分詞技術。讓格書寫有減少模糊、方便閱讀、利益語言技術等優點。我們甚至認為,空白字母的地位如同數字系統的零。我們使用讓格書寫,製作一套主要是台華語的平行語料庫,各約15萬字,並且用來初步探討台華語詞典製作、以及台華語互譯問題。在此過程中,我們利用了台華語的二大類似、共同詞多、詞序類似。比較現時詞組為基礎的統計式翻譯趨向,讓格書寫實質上有讓台語的語言技術站在較佳的基礎上。
英文摘要
LangGeh orthography is a new writing style proposed by. For Han family languages such Taiwanese or Mandarin that uses Chinese character, LangGeh proposes writing with spaces in-between, using simple short phrase as a unit. This is in contrast to word-based orthography in English and sentence-based orthography in traditional Mandarin. Easy to add spaces, LangGeh has the advangtages of reducing ambiguity, easier to read, and easier for text processing in Chinese characters. Using the LangGeh orthography, we produce a parallel corpus in Taiwanese and Madarin, about 150 thousand characters each. We then explore the extraction of “phrase dictionary” from the parallel corpus, and begin the study of statistical translation between Taiwanese and Mandarin.
起訖頁 399-413
關鍵詞 讓格書寫翻譯詞組詞組典統計式翻譯台語華語LangGeh orthographypharse-based translation pairstatistical translationTaiwaneseMandarin
刊名 ROCLING論文集  
期數 2009 (2009期)
出版單位 中華民國計算語言學學會
該期刊-上一篇 Voice Activity Detection Using Spectral Entropy in Bark-Scale Wavelet Domain
 

新書閱讀



最新影音


優惠活動




讀者服務專線:+886-2-23756688 傳真:+886-2-23318496
地址:臺北市館前路28 號 7 樓 客服信箱
Copyright © 元照出版 All rights reserved. 版權所有,禁止轉貼節錄