Browsing by Author "柯佳伶"
Now showing 1 - 20 of 75
- Results Per Page
- Sort Options
Item Disease Prediction and Topic Phrase Extraction from Clinical Reports by Attention-based LSTM model(2020) 游雅雯; Yu, Ya-WennoneItem Dynamic Generation of a Facet Hierarchy for Web Search Result(2014) 張崴; Wei, ChangIn this thesis, we propose a method to construct a facet hierarchy to organize the web search results dynamically. The proposed method is designed by two steps. First, we extract candidate facet terms according to a knowledge base. Second, we construct a facet hierarchy according to the candidate facet terms. We design an objective function to simulate the browsing cost when a user accesses the search results by a facet hierarchy. Accordingly, two algorithms are proposed to construct a facet hierarchy to optimize the objective function. The first one is a bottom-up approaches which select the best facet terms from the lowest level iteratively. The second one is a top-down approach, which uses an entropy function to estimate the expected browsing cost to select facet terms from the top level. Both algorithms are greedy algorithms which find optimal solutions. We evaluate the proposed methods on different distributions of access probability. The experiment results show that the facet hierarchies construct by the proposed methods achieves better performance on saving 30 to 50 percent of expected browsing cost than the one of the existing method.Item Item Search-Based Approach for Automatic Relation Extraction of Disease and Symptom(2017) 李怡慧; Lee, Yi-Hui無中文摘要Item Timeline Summarization for Event-related Facts and Public Issues on Chinese Social Media Platform(2017) 王涵; Wang, Han無中文摘要Item Towards a Conversational Recommendation System with Item Representation Learning from Reviews(2021) 林佩萱; Lin, Pei-HsuannoneItem 以FP-tree結構為基礎之近似常見項目集探勘法(2009) 涂益郎本論文針對交易資料庫運用FP-tree結構可壓縮儲存交易資料的特性,提出以FP-tree儲存結構為基礎之近似常見項目集探勘法,稱為 FP-AFI演算法( FP-tree Approximate Frequent Itemsets mining algorithm )。透過分析容錯包含項目集之交易資料集合間的遞迴關係,擴展FP-tree執行投影的方法,可分別找出包含某個項目與不包含某個項目的conditional FP-tree。FP-AFI演算法以深先搜尋的方式,從Header Table中取出符合核心樣式門檻值的項目產生候選項目集,系統化地建構出其對應的conditional FP-tree,並透過conditional FP-tree根節點所記錄的計數值及conditional FP-tree的編碼資訊,快速獲得該項目集的容錯支持度及各項目支持度,以確認是否為一近似常見項目集。在探勘的過程中僅需掃瞄資料庫兩次,可省去大量讀取交易資料所需的時間。由實驗結果顯示,當最小支持度門檻值訂為較小或交易資料的筆數較多時,此方法較之前已提出的近似常見項目集探勘演算法FT-Apriori及AFI有顯著的執行效率增進。Item 以MapReduce分散式架構有效率進行相似資料配對搜尋之研究(2015) 彭紹峻; Peng, Shao-Chun為了有效率計算相似資料配對搜尋問題,本論文提供一個有效篩除不相似配對的方法,並設計成對應的MapReduce平行處理架構。我們提出以最大值出現維度對資料預先分群,並設計改變分群數的方式及平衡各群間資料個數的分群調整方法。根據分群結果,將相似配對計算工作分成群內相似配對以及跨群相似配對;群內相似配對運用反向串列索引方式快速計算,在跨群配對方面,本研究先以計算群代表向量的方式對進行群配對的篩除,計算可能產生相似配對的群配對,再對群配對中資料進行候選配對的組合。此外本研究也運用MapReduce平行處理架構,以平行處理上述各步驟所需執行工作。實驗結果顯示此方法適合採用MapReduce平行處理架構,可比集中式處理有效減少相似資料配對問題的回覆時間。Item 以位元序列為基礎之容錯常見項目及探勘(2003) 游佩瑜; pei_wy yo本論文針對交易資料庫提出一個容錯常見項目集之有效率探勘方法,稱為FFT-Mine(Fast Fault-Tolerant Pattern Mining)演算法。本方法以出現位元序列表示法來儲存交易資料,並將此表示法擴展成容錯出現位元序列來表示一個容錯資料項集合在資料庫中出現的情形。FFT-Mine演算法以深先搜尋的方式產生候選項目集,可系統化地算出代表候選項目集出現情況的容錯出現位元序列,並由序列運算結果快速判別出一個候選項目集是否為一個容錯常見項目集。整個探勘過程僅需掃描資料庫一次,可以大量節省讀取資料所需時間。由實驗結果顯示此方法較之前已提出的容錯常見項目集探勘演算法FT-Apriori及FPT-Mine有更好的執行效率。Item 以位元序列為基礎探勘容錯重複樣式之研究(2004) 龔毓婷; Yu-Ting, Kung本論文提出一個有效率的方法對資料序列探勘出前K個非顯然且滿足最小長度限制的容錯重複樣式。我們擴展出現位元序列的表示法,設計出容錯出現位元序列,在考慮有插入或刪除錯誤的容錯情況下,用來表示候選樣式在資料序列中的出現位置。本論文提出二個演算法,分別命名為TFTRP-Mine (Top-K non-trivial FT-RPs Mining)及RE-TFTRP-Mine (REfinement of TFTRP-Mine)。兩個演算法皆根據論文中歸納出的遞迴公式,可系統性地計算出一個樣式的容錯出現位元序列,因而很有效率地得到每個侯選樣式的容錯出現次數。此外,RE-TFTRP-Mine演算法採用額外兩個技巧來砍除搜尋空間以加快探勘效率。由實驗結果得知,當K及min_len的值較小時,RE-TFTRP-Mine比TFTRP-Mine有較好的執行效率;而由實際的樂曲資料之實驗顯示,當探勘過程中有考慮容錯比對時,可以找出更多重要且隱藏的重複樣式。Item 以元學習方法建構個人化類別感知序列推薦模型(2022) 溫博任; Wen, Po-Jen序列推薦的目的是根據使用者以往與項目互動的序列資訊,推薦使用者可能感興趣的下個互動項目。本論文擴展轉移元學習器的模型架構(MetaTL),採用類別層級(Category-level)及項目層級(Item-level)兩個轉移元學習器(Transitional Meta-Learner)進行結合,稱為 CAI-TML 模型。利用類別層級轉移元學習器學習到使用者較一般性的類別轉移行為特徵,並輸入到項目層級轉移元學習器,以注意力機制影響使用者較個人化的項目轉移行為特徵表示,用來預測推薦的下個互動項目。本論文以 Foursquare Globalscale Check-in 資料集的使用者打卡序列進行實驗評估,實驗結果顯示:本論文所提出的CAI-TML 模型相較於 MetaTL 模型,在對下個互動項目推薦的第一名命中率效能提升比率為 10.2%,項目類別的命中率效能提升 23.8%。此外,對於冷啟動使用者及推薦使用者未曾互動過的項目等特殊情況, CAI-TML 模型亦較 MetaTL 模型發揮更佳的推薦效果。Item 以句子雙重情境表示法建模改進情緒原因句配對擷取之研究(2021) 劉秝瑋; Liu, Li-Wei針對情緒原因句配對擷取任務,本論文提出一個基於句子雙重情境表示法建模的模型。本研究提出的模型中對文本中同一個句子分別學習情緒句及原因句情境表示法,並採用多任務學習的訓練方式,使模型在訓練時除了考慮情緒原因句配對預測任務,同時考慮情緒句及原 因句預測子任務,以學習語意更完整的情緒原因句配對表示法進行配對預測。此外,本研究考慮情緒句及原因句在文本中正負樣本數不平衡的問題,因此採用損失函數權重調整策略,使模型在訓練後能提高情緒句及原因句預測子任務的回復率,連帶提升情緒原因句配對擷取任務的預測效果。實驗結果顯示,本論文方法以兩個圖神經網路學習句子雙重情境表示法,並配合損失函數權重調整策略,較相關研究以單個圖神經網路學習情境表示法的模型,在情緒原因句配對擷取任務達到更佳的效果。Item 以字詞類別概念輔助部落格文件分群之研究(2010) 范喬彬; Chou-Bin Fan本論文研究使用ODP (Open Directory Project)目錄結構做為外部知識來源,透過ODP的查詢功能得到字詞的所屬類別作為特徵,結合文章中所有字詞所屬的類別及比重值來建構出特徵向量,希望改進單純以關鍵字擷取建立特徵向量的缺點,進而達到較好的主題式文章分群效果。此外,每個部落格中文章內容主題的集中度不同,在以K-Means演算法進行分群時,經常遇到的問題是不知道如何設定適當的聚落數目K值,本論文研究亦提出根據文章集合中各文章的特徵向量自動決定K-Means演算法的聚落數目及初始代表點,使部落格文章分群能更自動化。 我們將類別特徵向量法與字詞特徵向量法分別套用在文章分群實驗上,並將分群結果以Accuracy及Purity值進行評估,評估結果顯示類別特徵向量法在測試集中大多數的部落格皆能得到比字詞特徵向量法更好的分群結果。此外,實驗顯示結合文章的標題詞與複合詞類別特徵向量可進一步提升文章分群的效果。Item 以有限配對資料訓練事實問題生成模型之研究(2020) 蕭雅方; Hsiao, Ya-Fang本論文考慮在閱讀文句與對應問題的配對資料有限情況下,透過遷移式學習概念,利用未配對的資料增強編碼器-解碼器架構模型的學習效果,使模型仍能生成相當於輸入大量配對資料訓練後的生成效果。本研究採用序列對序列模型,先以非監督式學習方式,利用大量無需經過標記的文句和問題,訓練自動編碼器架構。接著,擷取出預訓練好能理解文句的編碼器及生成問題的解碼器進行組合,並對編碼器加入轉移層建構出新的模型,再以遷移式學習選用文句與問題配對訓練微調模型參數。實驗結果顯示,採用本論文設計的遷移式學習方式,並配合訓練策略,在減少一半文句與問題配對資料的訓練,仍比直接採用全部配對訓練資料進行訓練得到的問題生成模型有更佳效果。Item 以查詢詞標籤輔助指標生成網路之查詢式摘要系統(2021) 盛貫宇; SHENG, Kuan-Yu本論文擴展進行文本一般性摘要的指標生成網路,建構一個給定查詢詞為輸入型式的查詢式摘要系統。本論文所提出模型以查詢詞標籤輔助從文本學習到查詢詞相關語意,並設計句意混合單元加強模型對句子層級語意的理解,用以有效生成與查詢詞相關的摘要結果。此外,以監督式學習的查詢式摘要生成系統需要足夠多的<文本,查詢詞,查詢摘要> 資料進行模型訓練,但人工標示成本極高而不易取得。因此本論文提供一個自動化方法,根據語法分析從現有一般性摘要資料集轉換成查詢式摘要資料集的形式,以提供模型建構及測試用。實驗結果顯示本論文由CNN/Dailymail轉換產生的查詢式摘要資料集較相關研究能提供模型更好的訓練效果。且本論文所提查詢詞標籤輔助的查詢式摘要生成模型,能有效解決查詢詞為系統未知語意字彙而影響摘要生成效能的問題,並透過句意混和單元提升模型生成結果與查詢詞內容相關的精確度。Item 以樹首遞迴投影探勘常見XML查詢樣式樹之研究(2005) 邱紹禎近年來XML資料格式已成為全球網際網路環境資料交換的標準,有效率地查詢擷取XML資料成為一項重要的研究課題。從XML查詢的歷史記錄所形成的資料庫中,探勘出常見的XML查詢樣式樹,並將這些樣式作為索引或快取的依據,可以減少使用者查詢XML資料的等待時間。本論文針對XML查詢樹所形成的資料庫,以樹首遞迴投影概念為基礎,提出探勘常見XML查詢樣式樹的方法,稱為XP_Mine演算法。其探勘過程中,首先將查詢樹資料庫中以前序字串編碼的XML查詢樹轉換成前序字串-層級表示法表示,接著以樹首遞迴投影的方式進行探勘。此外,XML查詢路徑中允許有”*”及”//”特殊比對方式的查詢樣式,所以本論文方法在探勘過程中亦擴展查詢樹包含比對的方法。由實驗結果顯示,對固定大小的資料庫,在查詢樹節點個數較小的時候,XP_Mine 較FastXMiner演算法有更好的執行效率。Item 以樹首遞迴投影探勘常見子樹結構之研究(2004) 林真伊; Chen-Yi Lin本論文針對由具項目標示有序樹結構的資料庫中探勘常見子樹的問題,提出以樹首遞迴投影方式的方法,稱為Tree-Projection演算法,可在探勘過程避免產生不必要之候選子樹。此外,我們擴展Tree-Projection演算法,根據使用者所給定的初始最小支持度門檻值及K值,探勘出資料庫內前K個具最大支持度計數值的封閉常見子樹。依選取常見子樹為樹首做投影的探勘順序不同,及探勘過程中最小支持度門檻值提高與否,發展出DFS、DFS-TC、及SS-TC三種Tree-Projection演算法的變型演算法。由實驗結果顯示,在資料庫特定大小的範圍內,Tree-Projection演算法執行效率不易受最小支持度門檻值及資料產生參數值設定的影響,且效率皆優於之前已提出的常見子樹探勘演算法(TreeMiner演算法) 。此外,以支持度計數值由大而小選取常見子樹為樹首做投影,並結合在探勘過程中提高最小支持度門檻值的SS-TC法,在K遠小於所有封閉常見子樹的情況下,可大量減少資料庫投影次數,大幅提昇Tree-Projection演算法探勘前K個具最大支持度計數值的封閉常見子樹之執行效率。Item 以異質網路圖學習病況事件表示法進行死亡風險預測(2022) 洪翊誠; Hung, Yi-Cheng近年來以機器自動學習數據的特徵表示法,已顯示有助於提升預測任務的準確率。本論文以電子病歷資料中相異類型的病況資料,依指定時間區間內病況事件同時發生的關聯,建立病況事件異質網路圖,並搭配不同的病況事件序列生成樣式,從取樣的事件序列中,學習儀器偵測數據特徵的病況事件表示法,用來從加護病房病患入病房後48小時的病況資料,以LSTM類神經網路架構進行死亡風險預測。本論文實驗比較使用同質特徵走訪路徑與異質特徵走訪路徑的擷取策略,所學習到的病況事件表示法對模型預測效果的差異。實驗在院內死亡預測及短期死亡預測的任務,初步顯示由異質特徵走訪路徑中學習的病況事件表示法,對兩個預測模型的預測效果皆有提昇。Item 以異質關係進行疾病診斷碼表示法學習之研究(2020) 羅仕翰; Lo, Shih-Han疾病診斷碼表示法的學習在近年來被廣為研究,然而許多研究僅考慮疾病診斷碼間的出現關聯資料。本論文以疾病診斷碼為主體,同時考慮與其他診斷碼、個人屬性特徵、醫療用藥或醫療處置等資料出現的關聯進行表示法的學習,用於下一次看診的疾病診斷碼進行預測。本論文提出兩種訓練表示法的方法,第一種是對各屬性特徵分開進行獨立訓練,第二種是將特徵合在一個模型中進行聯合訓練。表示法訓練完成後,針對兩種不同的表示法訓練方法所得到的疾病診斷碼表示法提供對應的預測模型,其中針對獨立訓練的疾病診斷碼表示法提出三種整合方式:直接接合、權重合成及注意力機制。實驗結果顯示,獨立訓練模型的直接接合及注意力機制整合方式,以及聯合訓練模型,與Med2Vec相較起來,在預測效能都有顯著的上升。特徵組合探討方面,以聯合訓練模型,特徵採用疾病診斷碼搭配看診時間及醫療處置時,可得到最佳預測效果。Item 以討論人物隱含類別輔助論壇討論句自動分類之研究(2010) 許翼麟網路論壇是使用者自由分享意見交流的平台,同時也充滿著各式各樣的討論,熱門的棒球賽事一天動輒百篇以上的回覆量,使用者不容易從大量的討論內容裡找到自己感興趣的觀點。本論文研究方法可以透過論壇討論內容的人物類型,依其字詞的關聯程度,對討論句進行分類。若討論句出現人名,則可用來查詢近期的新聞文章,作為擴展資料來源。將討論句自動分類整理為投手句以及野手句。分類的過程中,特徵的選擇是重要的一環。在特徵選取過程中,我們透過統計方法得到足以代表各自分類的特徵,並用以建立特徵向量,透過這些特徵向量進行分類學習,來建立分類模型。讓論壇內容的討論句透過這些工具,來決定分類為投手句或野手句的類別。實驗結果顯示,本論文系統所決定的類別與實際的類別有很高的一致性,當利用新聞擴展句之後,也能得到更好的分類效果。