自動擷取英文搭配語及中英文例句：雙語辭典編纂學的計算工具

高照明

熱門：

首頁

臺灣期刊 法律公行政治醫事相關財經社會學教育其他

大陸期刊 核心重要期刊

DOI文章

	本站僅提供期刊文獻檢索。　　【月旦知識庫】是否收錄該篇全文，敬請【登入】查詢為準。最新【購點活動】
篇名	自動擷取英文搭配語及中英文例句：雙語辭典編纂學的計算工具
並列篇名	Automatic Extraction of English Collocations and their Chinese-English Bilingual Examples: A Computational Tool for Bilingual Lexicography
作者	高照明
中文摘要	本文描述英中雙語搭配語自動編纂線上系統 EXEC 的設計流程。 EXEC 由一千三百萬英文詞及二千七百萬中文字的中英雙語平行語料庫建立而成，結合英語搭配語檢索和中英雙語檢索功能。EXEC 利用統計以及具有依存關係的英文句法剖析器擷取英文搭配語。使用者在查詢時輸入關鍵詞和關鍵詞的詞性以及所搜尋的搭配語的詞性，程式依據英文句法剖析器的依存關係和 mutual information、t-score、log likelihood ratio 等統計訊息自動擷取可能的英文搭配語，並連結包含英文搭配語的英文例句及中文翻譯。實驗顯示 EXEC 在擷取的正確率和辭典的涵蓋率都超過 80%且可以很有效率地自動從平行語料擷取英文搭配語、例句、及中文翻譯。
英文摘要	This paper describes the procedures involved in developing EXEC, a web-based system which can automatically extract English collocations and their Chinese-English bilingual examples from parallel corpora. The system draws on statistics, dependency parsing, and Chinese-English parallel corpora of more than 13 million English words and 27 million Chinese characters. By taking a word as well as the parts-of-speech of the word and its collocate as input, the system can automatically generate collocation candidates based on syntactic dependency relations as well as statistical information regarding mutual information, t-scores, and log likelihood ratios. In conjunction with a Chinese-English bilingual concordancer, it can further extract English sentences containing identified collocations along with their Chinese translations. Our evaluations suggest that the proposed system performs reasonably well in terms of accuracy and efficiency. EXEC can be used in facilitating automatic compilation of bilingual collocation dictionaries as well as in overcoming the L2 language barrier for Chinese learners of English. 本文描述英中雙語搭配語自動編纂線上系統 EXEC 的設計流程。 EXEC 由一千三百萬英文詞及二千七百萬中文字的中英雙語平行語料庫建立而成，結合英語搭配語檢索和中英雙語檢索功能。EXEC 利用統計以及具有依存關係的英文句法剖析器擷取英文搭配語。使用者在查詢時輸入關鍵詞和關鍵詞的詞性以及所搜尋的搭配語的詞性，程式依據英文句法剖析器的依存關係和 mutual information、t-score、log likelihood ratio 等統計訊息自動擷取可能的英文搭配語，並連結包含英文搭配語的英文例句及中文翻譯。實驗顯示 EXEC 在擷取的正確率和辭典的涵蓋率都超過 80%且可以很有效率地自動從平行語料擷取英文搭配語、例句、及中文翻譯。
起訖頁	95-121
關鍵詞	搭配語、依存關係、計算辭典編纂學、雙語平行語料庫、collocation、dependency relation、computational lexicography、parallel corpora、mutual information、t-score、log likelihood ratio
刊名	同心圓：語言學研究
期數	201405 (40:1期)
出版單位	國立臺灣師範大學英語學系
該期刊-上一篇	語意延伸與受惠者角色的匯聚：以客語「分」與「摎」為例