學位論文

Permanent URI for this collectionhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/73890

Browse

Search Results

Now showing 1 - 5 of 5

基於圖像串接和深度學習的改良生咖啡豆分類方法
(2024) 温鑫; Wen, Xin
為了解決生咖啡豆在影像辨識上的分類困難並提升精確度，這篇論文提出了一種通過串接不同的影像增強技術來融合不同的特徵提取演算法，以提高對生咖啡豆的辨識準確率。為了從原始影像中獲得各種關鍵特徵，我們選用了自適應閾值、位元平面分割、黑帽運算、Canny邊緣偵測、灰階、直方圖等化、Laplacian濾波、頂帽運算與非銳化濾鏡九種常見的影像增強方法。我們提出先在原本九種影像增強算法中挑選出與基準真相相關性較高的方法，並且僅將原始影像的RGB影像平面替換成相關性較高的影像處理方法，藉著多種特徵提升模型辨識度。在這項研究中，我們使用MobileViT進行實驗，最後選擇相關性較高的處理方式作為特徵融合的素材，經過影像串接產生的影像資料集作為新的輸入重新訓練。我們將不進行任何影像增強的分類方法視為基準。在二分法中，位元平面分割、直方圖等化和非銳化濾鏡的組合達到了96.9%的準確率，相對於原始方法提高了約5.5%。如果使用去除背景的相同資料集，相同的組合可以達到了97.0%的準確率；當我們選擇三分法進行實驗時，同樣都是由位元平面分割、直方圖等化和非銳化濾鏡的組合，分別達到了96.8%以及97.4%的準確率，較原始方法提升6.7%與4.9%。最後我們使用MobileNetV3驗證研究結果，在二分法的情況下，相同的影像增強組合分別在未去除背景與去除背景的影像可以獲得最高的99.12%與99.21%的準確率，相較原始方法有0.39%與0.44%的提升；如果以三分法再次進行實驗，與原始方法比較，大約分別有0.92%以及0.79%的提升，取得了98.73%與99.25%的準確率。
高性能之輕量級卷積神經網路之設計
(2021) 周世耀; Jou, Shyh-Yaw
因深度學習強大的分析能力，其時常被用做影像辨識與物件偵測的工具。時至今日，已有許多基於深度學習方法的著名模型被提出，例如：SENet、EfficientNet、Densenet、MobileNet、ResNet、ShuffleNet、GhostNet、Yolo等。深度學習模型的性能主要可從4個層面進行探討，分別是參數量，資料分析能力、處理資料的速度以及模型的泛用能力。一般而言，模型能在上述4個層面都表現優秀是很困難的。在本論文中，我們設計出一各性能皆優秀的深度學習模型―ExquisiteNetV2。我們選用了15個具公信力的影像辨識資料集以及1個物件偵測資料集進行實驗，並以上述提到的著名模型做為比較對象。我們分別使用兩種不同的權重更新法做實驗，根據實驗結果，無論使用何種權重更新法，在超過一半以上的資料集中，ExquisiteNetV2的分類正確率都是第一名。ExquisiteNetV2的參數量遠少於其他模型，但資料分析能力以及運算速度卻優於其他模型，因此，ExquisiteNetV2是一種高性能之輕量級卷積神經網路，可通用於影像分類與物件偵測之應用。
利用卷積神經網路對黃斑部病變的視力進行預測之研究
(2021) 柯竑亨; Ke, Hong-Heng
黃斑部皺褶，是一種慢性眼疾，經常發生在年長者身上，患者視網膜的黃斑部會產生皺摺，進而影響視力。不過，雖然已知此疾病對於視力有非常重大的影響，但在同樣患有此疾病的患者當中，卻可能擁有不同的視力分布，有些病人的視力可能僅僅只有 0.1，有些病人卻能夠擁有高達 1.0 的視力。視力的差異難以單純地依靠肉眼檢視醫學影像來判斷，因此，以深度學習為基礎的電腦視覺將可能是一個有效之方法。深度學習在這幾年來可以說是蓬勃發展，尤其是在影像辨識方面更是有著相當優異的表現，本論文將使用 Resnet18、Resnet50、MobilenetV2、ShuffleV2 這四種神經網路來加以分析，透過卷積神經網路強大的圖形識別能力，來幫助我們找到在患有黃斑部皺褶的病人的黃斑部之中影響視力最為關鍵的部分。本論文所使用的資料集是採用台大醫院眼科所提供的 angio retina 影像，它是一種使用了光學原理成像的眼底血管影像，由於本論文中所使用到的資料集較難以蒐集，所以在數量上比較稀少，因此除了針對資料集做了資料增強來增加資料集的數量外，另外還有使用投票法、K 折交叉驗證等方法，來提升模型的表現，在實驗的最後，本論文採用了 Grad-CAM++這個工具，使訓練結果可以視覺化，以熱像圖的方式描繪出卷積神經網路所關注的區域，希望此有助於眼科醫師的臨床判斷。
用於精細動作辨識的雙頭預測網路
(2021) 陳維均; Chen, Wei-Jyun
近年深度學習發展迅速，不僅2D影像辨識，現在3D動作辨識也受到關注。動作辨識的研究從3D CNN開始，便在許多數據集得到不錯的效果。但大部分的動作辨識網路，在細部動作的辨識上都有改進的空間，原因是細部動作整體來說和一般的動作差異不大，可能只是在一小段時間內發生的差異，因此十分不好判斷。這個情況在籃球比賽十分常見，籃球比賽中常常有各種肢體碰撞，但是這些肢體碰撞並不一定會造成犯規，要辨識這些犯規就勢必得加強細部動作的偵測。由於現在並沒有相關的資料集讓我們做相關的研究，因此我們自己蒐集資料，建立一個籃球犯規的資料集。在本論文中，我們提出了一種提昇細部動作辨識的網路套用在現有的網路上，包括3D-Resnet50[1]、(2+1)D-Resnet50[2]、I3D-50[3]。實驗結果顯示加入這個網路後，在各種模型的準確度上都獲得3~7%的提升。
SIFT影像辨識演算法及其在FPGA之實現
(2016) 潘偉正; Pan, Wei-Zheng
本文提出將SIFT影像辨識演算法實現於FPGA上，以解決影像辨識需要大量運算時間，而使得系統無法即時運算之問題。為了大幅減少邏輯單元之需求以及提升系統頻率，我們依照硬體適合之架構以及平行處理的優勢，針對SIFT演算法進行改良，如使用軟體預先計算高斯模板、使用數值方式避免反矩陣使用除法器以及將影像金字塔使用平行處理之架構實現等。除此之外，我們也使用CORDIC演算法進行三角函數、平方相加開根號以及反三角函數等實現，還有使用最佳化演算法找出高斯影像所需之最佳參數，並在硬體中進行連續高斯影像金字塔之近似，最後使用硬體實現影像梯度直方圖統計，如此一來就能於硬體中進行特徵主方向偵測以及特徵點描述之功能，而論文中會清楚介紹上述所提到之實現方法。而為了降低開發之困難性，首先以軟硬協同設計之架構對部分模組進行加速設計，完成後，再將整個系統以全硬體方式進行實現，值得一提的是，整個系統電路皆是由管線架構設計而成，因此可以大幅提升運算效率，進而達到即時運算之目標，從實驗結果證實，電路模組運算速度相較於軟體有大幅提升，而硬體實現結果相較於軟體之誤差也保有相當之精確度。

學位論文

Browse

Filters

Settings

Sort By

Results per page

Search Results