中文摘要 |
本文以資訊技術處理63,234件法院毒品相關裁判之巨量資料,目的係實現「法院裁判書」之文本探勘。法院裁判書由於形式複雜,且篇幅較長(超過10,000字),以往認為機器判讀較為困難。此外,在既有的裁判書資料庫檢索時,以目前有限的檢索條件,往往導致系統抓取過多裁判件數,但顯示件數卻又有上限,研究者必須再設定檢索條件、縮小查詢範圍,否則看不到上限數量以外之文本。本文採取的文字探勘方式,能使機器協助閱讀,省卻研究者搜尋裁判之時間精力,不受資料庫對裁判篇幅之限制,且更直接地針對研究者之關注點分析大量裁判書,使吾人能迅速掌握裁判中的整體現象。以本文研究對象為例,大數據解析2014年1月起至2017年7月止我國關於毒品之相關判決發現:一、研究者能藉由機器協助大量閱讀判決,並成功處理文字探勘;二、在本文研究範圍中,毒品犯罪多為集合性或系統性犯罪,且與毒品級數相符,越高級毒品利潤越高,越可能出現組織性犯罪。三、毒品犯罪具有高再犯率,本研究使用文字探勘法結果與法務部發表結果相近,能達到平行驗證效果。
|