Browsing by Author "CAI,Bing-Han"
Now showing 1 - 1 of 1
- Results Per Page
- Sort Options
Item 以答案驗證方法為基礎之生醫相關問答系統(2013) 蔡秉翰; CAI,Bing-Han本論文的研究,是以阿茲海默症為主題,實現一個問答系統來回答問題。目的在於能夠讀取一篇測試文章,回答相關文章的問題,正確理解測試問題的涵意,並擷取文章中相關字句資訊作評分計算,從中得到正確的答案,達成一個高精準度的問答系統。 本論文的測試資料共包含了四個主題為阿茲海默症的測試資料集,每個測試集包含一篇測試文章、10個關於該文章的測試問題,每個問題都有五個選項供選擇,問題答案皆為單選題。另外使用到背景知識庫,資料來源包含從Pubmed Central得到關於阿茲海默症的醫學文獻資料庫(Medical Literature Analysis and Retrieval System Online, Medline)的文章,以及美國麻薩諸塞州的阿茲海默症研究中心(Massachusetts Alzheimer’s Disease Research Center)所提供關於阿茲海默症的生物文章及摘要。我們也從線上人類孟德爾遺傳學(Online Mendelian Inheritance in Man, OMIM)的網站針對阿茲海默症作為關鍵字,擷取此疾病的相對應基因名稱,再利用連結內文來建立基因關係。 此研究首先以人類回答選擇題時最常使用的方式為模式:當接收到一個問題,會先閱讀並搜尋文章中與問題相關的句子尋求解答,接著再觀察答案選項與這些句子何者最相似、相關,最後回答覺得最可信的答案。再來我們嘗試答案驗證的方法,將問題與該問題對應可能的答案選項預先結合產生出假設(Hypothesis),再利用這些假設到文章裡閱讀並搜尋相關的句子尋求解答,相關的句子根據假設中相符的字來找尋並且用TFIDF的方法給予評分。而根據假設得到分數越高的句子就代表與該篇測試文章的主題內容越相符。最後再根據這些句子的分數給予每個假設評分,最高分的假設代表該假設所包含的答案選項為最後回答中覺得最可信的答案。在研究中分為以字為單位以及以詞彙為單位來進行實驗。此外,研究中另外使用背景知識庫以及OMIM網站取得的資源來達成詞語擴充的方法。 最後,我們將所有方法的組合進行23種實驗,前幾個實驗方法因為忽略答案選項中重要的資訊而使準確率大約只有一到兩成。再來我們改以答案驗證方法實驗,準確率就得到了高度的提升。之後加上詞彙的輔助、重要語句挑選以及字詞擴充,並分析評估這些方法如何使用及其影響,慢慢就達成準確率的上升,最後甚至能夠提升到五成左右,與使用相同測試資料的眾多研究相比較,此結果為不錯的成果。