在衛生署公佈的台灣民眾十大死因調查中,惡性腫瘤在連續數十年蟬連榜首,其中有近三成是罹患癌症。由於人類基因體定序大致上已經完成,如何運用資訊技術在這些龐大的資料中找尋出導致癌症發生的相關訊息就顯得特別重要了。生物學已經證實了,轉錄因子(Transcription Factor)的功用是控制其它基因的表現,也是控制基因序列在啟動子區是否會發生突變的關鍵。在一些比較著名的DNA調控序列中,大多具有一致性序列的特性,因此尋找motif一直都是生物學家們很有興趣的研究議題。過去有許多預測motif的方法被提出,這其中有關motif的長度設定可以說是能否正確預測motif的關鍵。本研究將探討使用快速傅立葉轉換預測motif的可能長度,並搭配資料庫軟體來處理資料,期望可以提高處理資料的效率與處理更大量基因序列的能力。協助縮短預測的時問,達到我們的目的,提升預測motif區段的效率與精確度,本論文將先使用已知的致癌基因作為研究的資料。 |