Browsing by Author "柯佳伶博士"
Now showing 1 - 2 of 2
- Results Per Page
- Sort Options
Item 考慮密度限制之數值區間關聯規則探勘(2003) 郭瑞男本論文提出一個新的數值區間關聯規則探勘方法,稱為PQAR(Partition-based Quantitative Association Rule mining)演算法,以空間分割方式先探勘出滿足相對密度限制的常見數值區間項集合,再由其產生數值區間關聯規則。PQAR方法在探勘常見數值區間項集合時除了考慮最小支持度門檻值的限制外,亦訂定相對密度的限制,避免在相同支持度門檻值要求下,找出資料分佈不集中的區間。此外,PQAR方法採用空間分割方式探勘出符合要求的最大數值區間,不但減少需要掃描資料庫的次數,使得執行時間大為縮短,亦使探勘結果中的區間個數較少,達到找出精簡而重要的數值區間關聯規則之目的。由實驗結果顯示PQAR方法在探勘具不同支持度及相對密度的常見區間項集合,都有很高的正確率。而且在相同的正確率的條件下,本論文方法也較QAR演算法的執行更有效率。Item 資料流中常見子圖樣式改變之漸進式偵測(2006) 蔡明瑾圖型為具結構性的資料結構,能夠完整描述真實世界的資料關聯性。探勘常見子圖必須考慮子圖間為同質異構體的問題,因此處理複雜度高,應用在資料流探勘的成本更高。本論文考慮從單位時間的累積圖型資料集中探勘常見子圖樣式的問題,我們認為在資料流中資料樣式的改變會經過一個過渡期,因此未必在每一個時間點皆需要進行重新探勘。本論文將初始時間點探勘出的常見子圖樣式稱為基底常見子圖樣式,提出從新進累積圖型資料集中有效率地偵測比對是否包含基底常見子圖樣式的方法,近似估算出基底常見子圖樣式在新進累積圖型資料集中仍為常見的比例值,以判定資料流中常見子圖樣式趨勢轉移的情況,並建議需重新進行新資料中子圖樣式探勘的時間點。本論文所提出的FGCD方法建立不同的圖型資料結構,並運用常見子圖樣式的向下包含特性來加速比對過程。由實驗結果顯示,此方法可有效比對估算出新進累積圖型資料集中仍維持常見之基底子圖樣式,當樣式趨勢尚未發生改變時,比重新進行探勘在更快的時間內提供常見子圖樣式的近似結果。