學位論文

Permanent URI for this collectionhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/73890

Browse

Search Results

Now showing 1 - 8 of 8

基於非對稱U-Net實現微小且快速移動之物體檢測網路
(2024) 羅郁鈞; Lo, Yu-Chun
本論文旨在探討物件偵測在微小、快速且特徵不明顯的物體上的應用。為了改進比賽戰術並提升技能，專業運動員和業餘玩家經常使用手機或相機記錄他們的練習和比賽。隨著這一領域的興起，越來越多的研究人員開始結合深度學習模型與運動分析，以提供更全面的見解。物件偵測是其中的關鍵任務，因為識別物體的位置可以提供有價值的資訊，如戰略分析。然而，針對如羽毛球這樣快速移動且模糊的物體進行追蹤的研究仍然有限。TrackNetv2方法基於VGG-16和U-Net，通過熱力圖檢測羽毛球的位置，但其架構需要大量計算資源，難以在實際應用中保持高效。為了解決這個問題，我們提出了一種名為TinySeeker的非對稱架構，這種新穎的架構不僅能精確的檢測羽毛球的位置，還能提高計算效率，在檢測精度和計算需求之間達到了最佳平衡，使其在現實應用中既實用又高效。實驗結果表明，Tinyseeker可以在保持精度的同時減少多達26%的計算量。這種架構在該領域標誌著一項重大進展，推動了物體檢測任務的可能性，並為未來的類似研究設立了新的基準。
針對空拍影像物件偵測之改良型YOLOv7演算法研究
(2024) 鍾宜修; Chung, Yi-Hsiu
近幾年無人機的技術發展迅速，飛行距離越來越遠、體積也不斷縮小，甚至能自動飛行，因此能應用的範圍也越來越廣泛，例如交通監測、工業或自然環境巡檢等等。另外隨著人工智慧的興起，現在無人機也會結合人工智慧演算法協助其辨識影像。由於無人機所拍攝的影像內物件往往尺寸偏小，且無人機本身的運算支援有限，因此如何提升小物件的辨識效果且同時降低模型運算時所需的資源至關重要。本論文以YOLOv7為基礎模型進行改良，提升它對小物件的偵測效果且同時降低模型參數量及計算量，我們以VisDrone-DET2019資料集來驗證模型改良成效。總共修改五種方式，第一種方式是將ELAN (Efficient Layer Aggregation Network)替換成M-ELAN (Modified Efficient Layer Aggregation Network)，第二種方式是在高階特徵層添加M-FLAM (Modified Feature Layer Attention Module)，第三種方式是將特徵融合的結構從PANet (Path Aggregation Network)改成ResFF (Residual Feature Fusion)，第四種方式是將模型內下採樣的模塊改成I-MP模塊 (Improved MaxPool Module)，最後一種方式是將SPPCSPC (Spatial Pyramid Pooling Cross Stage Partial Networks)替換成GSPP(Group Spatial Pyramid Pooling)。綜合以上方法，將mAP (mean Average Precision)提升1%，同時模型參數量卻下降24.5%，模型計算量GFLOPs (Giga Floating Point of Operations)也降低13.7%。
基於深度學習之多連接模塊對於物件偵測的影響
(2022) 李政霖; Li, Cheng-Lin
在本論文中，我們提出與YOLOv5不同的加深網路模型的方法，並設計了三種適用於特定資料集的多連接模塊(Multi-Connection)。多連接模塊的主要目的是重用特徵並保留輸入特徵以供向下傳遞。我們在8個公開的資料集驗證我們的方法。我們改進了YOLOv5中的殘差塊(Residual block)。實驗結果顯示，與YOLOv5s6相比，YOLOv5s6加入多連接模塊型一在Global Wheat Head Dataset 2020上的平均精度(mAP)提高1.6%; YOLOv5s6加入多連接模塊型二在PlantDoc 資料集上的 mAP 提高2.9%;YOLOv5s6加入多連接模塊型三的mAP在PASCAL Visual Object Classes(VOC)資料集上提高了2.9%。另一方面，我們也比較了一般的傳統深化模型的方法。一般來說，加深網絡模型會提高模型的學習能力，但我們認為對於不同的資料集，採用不同的策略可以獲得更高的準確率。此外我們設計多連接模塊型四，應用在交通號誌偵測上，多連接模塊型四之一基於殘差塊做堆疊增加網路深度，來加強網路的學習能力，並加入壓縮和激勵模塊(SE block)，來強化特徵圖資訊，另外透過一個額外的跳連接鼓勵特徵重用。多連接模塊型四之二，主要是將多連接模塊型四之一的通道減半，來減少模型計算量跟參數量。多連接模塊型四之三我們基於多連接模塊型四之二多增加一個3乘3的卷積提升模型學習能力。我們選擇TT100K資料集來訓練模型，我們也收集了臺灣交通號誌當作客製化資料集，去驗證我們的方法，目的是要設計出一個高效性能的模塊，所以設計出多連接模塊型四之三。在TT100K資料集中多連接模塊型四之三獲得最好的表現，與YOLOv5s6相比計算量僅增加了11%，mAP提升了3.2%，犧牲一點計算量換來模型準確率有感的提升，此外我們也在其他公開的資料集驗證我們的方法，多連接模塊型四之三的表現也是非常有效益的。
基於暗通道先驗之疊代神經網路應用於低光圖像增強
(2022) 劉晟岳; LIOU, Cheng-Yue
本論文研製一新穎的架構。稱為疊代低光影像增強網路，它使用暗通道先驗來增強低光源影像。我們透過觀察得知負片後之低光影像類色彩分佈似於含霧影像。因此，本論文所提出的架構遵循這個假設來恢復低光圖像。此外，我們還使用灰度世界算法來改善色彩偏移的問題。通過疊代，本架構可以得到亮度足夠的前處理影像。隨後，本論文使用自動編碼器進一步提高最終輸出影像的質量。由實驗結果可以表明，所提出的此方法可以處理各種光照條件，並且輸出效果優於現有方法。由所進行的實驗可以證明，提出之輕量化架構不僅減輕硬體設備之負擔還可以顯著提高物件偵測的性能，以便後續與高階電腦視覺任務的配合。
結合雙AI晶片與熱成像溫測模組之自動目標搜索與溫度量測系統
(2022) 沈方靖; Shen, Fang-Jing
本論文提出一種自動搜索目標系統，使用雙人工智慧邊緣型運算處理器結合紅外線熱成像感測器，並透過步控制進馬達來實現自動搜索目標且掃瞄範圍擴增的人體溫度測量設備。本文首先回顧深度學習及類神經網路對於影像辨識的起源以及其應用性，並探討邊緣型處理器對於人形偵測的可行性，再根據此基礎發想出測量人體溫度之應用。而後介紹本論文主要系統架構及硬體設備，使用Mipy深度學習AI開發板配合多種感測裝置，來達成AI目標辨識及環境訊息的測量。本系統架構建立於模型本身的可靠性，針對模型訓練的部分有加強描述：從目標圖片的選取及拍攝、訓練過程的流程改善及參數調整、及最後模型在實驗環境的誤判修正。接著將訓練好的模型載入雙Mipy深度學習AI開發板，並制定一套演算法，協調各微處理器間的交互關係，達成快速掃描且穩定測溫的功能。最後針對多個實際場景，驗證本論文所描述之目標以及該架構反應速度與正確性。
高性能之輕量級卷積神經網路之設計
(2021) 周世耀; Jou, Shyh-Yaw
因深度學習強大的分析能力，其時常被用做影像辨識與物件偵測的工具。時至今日，已有許多基於深度學習方法的著名模型被提出，例如：SENet、EfficientNet、Densenet、MobileNet、ResNet、ShuffleNet、GhostNet、Yolo等。深度學習模型的性能主要可從4個層面進行探討，分別是參數量，資料分析能力、處理資料的速度以及模型的泛用能力。一般而言，模型能在上述4個層面都表現優秀是很困難的。在本論文中，我們設計出一各性能皆優秀的深度學習模型―ExquisiteNetV2。我們選用了15個具公信力的影像辨識資料集以及1個物件偵測資料集進行實驗，並以上述提到的著名模型做為比較對象。我們分別使用兩種不同的權重更新法做實驗，根據實驗結果，無論使用何種權重更新法，在超過一半以上的資料集中，ExquisiteNetV2的分類正確率都是第一名。ExquisiteNetV2的參數量遠少於其他模型，但資料分析能力以及運算速度卻優於其他模型，因此，ExquisiteNetV2是一種高性能之輕量級卷積神經網路，可通用於影像分類與物件偵測之應用。
輕量化車牌辨識模型
(2021) 許博翔; Hsu, Po-Hsiang
近年來，深度學習的技術被廣泛的應用在智慧交通的發展，車牌辨識系統成為智慧交通中不可或缺的技術。車牌辨識系統能應用於智能城市的車輛管理、竊盜車輛調查、犯罪車輛追蹤和交通監控。舉例來說，以往警察透過人工觀看監視器影像來追蹤犯罪車輛，人工觀看的方式需要耗費大量的時間與人力，而使用車牌辨識系統能快速的搜尋大量監視器影像裡的目標車輛，如此一來能減輕人力的負擔和節省大量的追蹤時間，提高破案的效率。現代車牌辨識系統的技術已經非常成熟得應用於智慧停車場、交通收費系統等場域，但想運用在路口的監視器影像仍會面臨許多問題，其中包括監視器拍攝角度、光源條件、車輛移動造成得模糊、複雜的道路環境和過多得交通號誌與廣告招牌。車牌辨識系統可以分成兩個階段，第一階段是從影像中找到車牌得位置，第二階段則是辨識前一階段找到的車牌影像。本論文僅探討第二階段的車牌字元辨識，車牌字元辨識有兩個主要的目標，第一個是找到車牌字元的位置，第二個是辨識字元的類別。傳統的車牌辨識必須先切割出字元位置才能做後續的字元辨識，所以我們使用物件偵測的概念設計了一個輕量化的車牌辨識模型，使用物件偵測的概念可將字元切割和字元辨識的任務整合在一起，只需要一個網路模型就能找出字元位置並辨識字元的類別。本論文使用的資料集是我們自己製作的台灣車牌資料集，影像都是由我們在台灣街道上拍攝不是在網路上搜尋的照片。我們也特別挑選模糊、反光、昏暗情況的車牌照片豐富我們的資料集。整個資料集總共含有 3753張照片包含訓練用的3131張照片和測試用的622張照片，而測試的照片是偏向模糊和昏暗的情況。最後實驗的結果顯示我們模型的GFLOPs只有4.91，但map0.5能達到89.62。
以適應性門檻值為基礎應用於物件偵測之強化切割演算法
(2011) 陳俊廷; Chun-Ting Chen
物件偵測演算法是應用於智慧型影像系統中的基礎研究，尤其大量被用於智慧型監控系統與智慧型傳輸系統上，目的在於透過有效的偵測物件，使其資訊能夠提供給物件追蹤或辨識等相關應用，提升系統之效能，一般而言，大部分的研究常使用背景相減法，利用畫面之間的差異來擷取物件，而這樣的方式通常需要訂定門檻值將影像中的資訊分類，可是在傳統的作法中，此門檻值通常為定值，所以常需要因為測試環境的不同而重新定義，此外，陰影成份也是一項影響物件偵測演算法準確率的因素之ㄧ，所以在將影像資訊分類後，必須再透過陰影去除相關之演算法，將陰影成份去除以取出正確的物件資訊，所以在本論文中，我們提出一個根據陰影成份的特性分析，以像素點為基礎，個別定義其適應性之門檻值應用於物件偵測之演算法，使物件切割與陰影去除的動作，只要透過一個步驟的強化切割演算法，便能夠即時處理並準確的偵測物件，並且能夠將陰影成份的干擾降到最低，使偵測出來的物件資訊能夠更加的與實際物件吻合，實驗結果顯示，即使是在室內、戶外或是雨天的環境下，透過我們所提出的方法也都能夠快速並有效的偵測物件。

學位論文

Browse

Filters

Settings

Sort By

Results per page

Search Results