Browsing by Author "陳立哲"
Now showing 1 - 1 of 1
- Results Per Page
- Sort Options
Item 生物資訊文獻中人類遺傳疾病與基因關聯度之研究(2011) 陳立哲; Li-Che Chen本論文之研究,是在探討文獻中人類遺傳疾病與基因的關聯度,希望從中得到一些人類遺傳疾病與基因這兩者之間的關係,其目的在於希望在往後的生物資訊文獻上,可以快速的得知文獻上出現的人類遺傳疾病是否與文獻上出現的基因相關聯。 本論文所使用的相關資料包含了醫學文獻資料庫(Medical Literature Analysis and Retrieval System Online, Medline),從中擷取出所需要使用的資訊,包括PMID、TI以及AB,其中PMID為該篇的ID number,TI為標題,而AB即為內文。接著,利用Geniatagger來標記AB上出現的基因。再來,利用線上人類孟德爾遺傳學(Online Mendelian Inheritance in Man, OMIM)的網站,下載人類遺傳疾病與相關基因的資料,再利用這兩者去標記AB上出現的疾病與基因。 針對此研究,提出了兩類運算的方法,其中第二類方法會再加以變化,衍生出新的運算方法。第一類的方法分為五種,第一種方法是運用密度的計算公式,第二種是運用重力公式,此公式有四種變化。第二類的方法就是自然語言常用的Dice,在此,以此公式為基本架構,再加以調整延伸公式,和一般的比例公式以及一般比例公式延伸變化。 II 最後求出的結果,前兩者的準確率最高是在一成左右,屬於偏低的準確率,其原因是,他們只有運用到位置與TFIDFT(Term Frequency Inverse Document Frequency(Term))的變數去計算他們的值,忽略了一些疾病與基因的特性,所以分數才會如此的不顯著。再來,運用以Dice為主要架構的變化公式,這方法考慮到Gene Ontology,對此實驗來說,考慮的要素正好符合實驗的精神,所以計算出的分數,才會越高而越接近實驗的正確配對,當過一個門檻值之後,準確率就會達到100%。