影片字幕通常反應影片部份內容,可以輔助影片內容檢索。雖然在新的影片格式如MPEG2以上,字幕內容可以輕易取得,但是仍有大量早期的影片,需要進行影片文字辨識,才能擷取字幕內容。本文提出一套簡易的中文字幕辨識法,包括影像擷取、字幕尋找、背景去除、字元切割、光學文字辨識、及後處理。我們以Discovery Channel影片作為訓練和測試的資料,以兩部影片作集外測試,其辨識率分別為82.3%和85.9%,而集內測試可以達94.2%的正確率。在Pentium-41.7G,256MRAM,40G 7200轉速的IBM硬碟等配備下,處理平均495MB大小的影片,需要29分11秒。這套影片文字辨識法,對於影片數位圖書館的建立,以及後續的影片內容檢索有很大的助益。本文以影片檢索和詢答系統為例,說明影片文字辨識的應用。 |