本論文根據聽覺的觀點提出利用類神經網路建構旋律抽取的方法,針對複音音樂進行旋律的抽取。根據傳統心理聲學音高分析理論,人在音高的解析分為頻譜模型和時間模型。在此論文中,我們先對個別模型進行探討並建構模型評比效能,觀察個別模型的訓練結果與聽覺理論是否相同,並依據結果建構出頻譜模型上的聽覺模板。再進一步針對頻譜模型上高頻諧音無法解析的缺失利用時間模型補足,建構出雙工模型。由實驗結果可知由時間模型補足頻譜模型無法解析的頻段有助於提升旋律抽取及音高判別。此實驗結果也證明以心理聲學為基礎來建構類神經網路確實可用於音樂資訊檢索的相關應用中。 |