15 results
Search Results
Now showing 1 - 10 of 15
Item 基於非監督式生成對抗網路及對比學習之水下影像品質回復(2023) 宋奕泓; Sung, Yi-Hung近年來水下環境之相關應用的重要性與日俱增,比如:水下資源探勘及水下環境監控。這些應用往往需要由水下無人載具來擷取水下數位影像資料以供後續之資料分析及其相關應用 (例如:水下物件偵測及水下影像分類等相關應用)。然而水下影像品質受到許多環境因素影響而造成影像退化,包括光線折射、反射等等,如此可能使得基於水下影像之相關應用無法得到良好的效果。近年來,隨著深度學習技術蓬勃發展,研究者提出許多基於深度學習的模型來改善水下影像的品質。目前現有方法中,以具備成對影像資料之監督式深度學習模型為主。成對影像學習雖然能以較輕量模型得到好的影像品質回復效果,但礙於現實難以取得成對的原始水下影像及其還原之陸上影像,因此模型訓練上受到許多限制。為了解決這個限制,許多研究以人工合成之影像來建立成對之訓練影像資料集。然而,人工合成之訓練影像資料集未必能反映真實的水下影像特性。為了解決此問題,最近已有研究提出使用生成對抗網路及非成對影像資料來進行深度學習網路訓練。本論文提出一基於非成對影像資料及生成對抗網路之深度學習模型,來處理水下影像回復的問題。本論文提出基於非成對訓練影像資料集及利用生成對抗網路架構訓練一影像領域轉換生成器將輸入之水下影像轉換為對應之陸上影像 (回復之水下影像),其中我們利用對比學習及多樣損失函數來進行網路訓練。實驗結果已證實我們的方法可得到較佳的回復影像品質且優於 (或近似) 現有基於成對/非成對訓練資料之基於深度學習之水下影像回復網路。Item 語意分類及其應用於兩輪機器人控制(2020) 唐凡; Tang, Fan本論文目的在建構一語意分類系統,使指令不單局限在單一詞彙或單一描述,例如指令旋轉之後前進及前進之前旋轉視為同樣意思,使機器人不是單純的判斷關鍵詞的順序而是使機器人能夠自行判斷語意後執行動作,讓所接受的指令更為靈活且多樣。語意分類系統建構是先以文字語句作為訓練資料,將詞彙透過詞嵌入的方式轉為數據。接著,使用神經網路進行分類訓練,主要以卷積類神經網路(Convolutional Neural Network, CNN)、長短期記憶(Long Short-Term Memory, LSTM)這兩種神經網路進行建模,CNN 具有優秀的特徵擷取及處理能力,LSTM 則在序列表現異,透過實驗比較這兩種方法,並選擇結果較好的架構應用於兩輪機器人。Item 基於卷積神經網路之即時人臉表情辨識(2019) 劉耿丞; Liu, Keng-Cheng本文提出基於卷積神經網路(Convolution Neural Network, CNN)之即時人臉表情辨識系統,透過所提出之穩定度提升方法,以解決即時人臉表情辨識的不穩定問題。提高人臉表情辨識準確率的方式有許多種,例如:圖片預處理、辨識架構改變等無非都是要讓應用方面的效果更好。本文想解決攝影機在光照等影響下會造成不斷擷取畫面的某些時刻之圖片特徵改變,導致人臉表情在辨識中產生錯誤。由於攝影機的高速擷取影像,圖片與圖片之間時間間隔較小,因此,本文針對於改良LeNet卷積神經網路和Two Stream卷積神經網路架構辨識系統提出不同的方法,前者使用比重平均法,而後者使用統計法,使用提出之方法後對於即時人臉表情辨識整體穩定度及強健性均獲得提升。Item 結合雙AI晶片與熱成像溫測模組之自動目標搜索與溫度量測系統(2022) 沈方靖; Shen, Fang-Jing本論文提出一種自動搜索目標系統,使用雙人工智慧邊緣型運算處理器結合紅外線熱成像感測器,並透過步控制進馬達來實現自動搜索目標且掃瞄範圍擴增的人體溫度測量設備。本文首先回顧深度學習及類神經網路對於影像辨識的起源以及其應用性,並探討邊緣型處理器對於人形偵測的可行性,再根據此基礎發想出測量人體溫度之應用。而後介紹本論文主要系統架構及硬體設備,使用Mipy深度學習AI開發板配合多種感測裝置,來達成AI目標辨識及環境訊息的測量。本系統架構建立於模型本身的可靠性,針對模型訓練的部分有加強描述:從目標圖片的選取及拍攝、訓練過程的流程改善及參數調整、及最後模型在實驗環境的誤判修正。接著將訓練好的模型載入雙Mipy深度學習AI開發板,並制定一套演算法,協調各微處理器間的交互關係,達成快速掃描且穩定測溫的功能。最後針對多個實際場景,驗證本論文所描述之目標以及該架構反應速度與正確性。Item 以輕量化卷積神經網路為核心之自動抄錶系統(2020) 郭冠毅; Kuo, Kuan-Yi隨著物聯網技術的蓬勃發展,政府逐漸淘汰了傳統電錶,開始了智能電錶的時代。然而,更換智能電錶的價格昂貴且面臨通訊不良等問題,導致智能電錶佈建緩慢,我們的想法是開發一種低成本的解決方案,該解決方案使用帶有攝影鏡頭的邊緣設備自動辨識傳統電錶,然後將辨識的值上傳到雲端。過去已有研究通過傳統的圖像分割方法自動讀取錶盤,但是由於傳統的電錶大多設置在遮蔽性高、光線昏暗、灰塵多的環境中,因此對於不清晰的電錶圖像,傳統方法難以獲得良好的辨識結果。在本文中,我們提出了一種基於輕量化卷積神經網路的自動讀錶器並實現在邊緣設備上,為了減輕佈建難度和提高錶盤辨識的準確率,我們所提出的錶盤讀取器具有自動調整傾斜錶盤圖像的能力。實驗結果顯示,相較於其他相關方法,所提出的輕量化卷積神經網路在分割錯誤,誤報和運行時間方面取得了顯著改善。Item 基於深度學習之光流法應用於全天空影像之日射量估計與預測(2023) 陳家豪; Chen, Chia-Hao因應太陽能發電日益重要,又因太陽能發電量受制於日射量的影響,同時考量太陽能發電是間歇性的能源,故提出一種基於深度學習光流應用於全天空影像之日射量估計與預測的方法。由於日射量變化容易受到天氣狀況影響,本文藉由全天空影像,建立一個以影像特徵為基礎之日射量估計與預測系統,其影像特徵包括,利用紅藍比例法計算影像中雲層比例、雲層厚度,及藉太陽位置演算法得到影像中太陽位置,分析太陽附近雲層特徵,萃取全域與局部的雲層權重。同時用基於深度學習的光流法推算雲層移動的狀態,並製作未來數分鐘之天空預測圖像,將這些預測圖像作長短期記憶(LSTM)之輸入特徵,日射量作為訓練輸出,其深度學習光流法是透過卷積神經網路來實現。本文將資料集區分為月、季、半年與一年,分別進行10分鐘至60分鐘的日射量預測。同時,本文使用多個效能指標評估效果,包括平均絕對誤差(Mean Absolute Error)、均方根誤差(Root Mean Square Error)與判定係數(R^2)。最後,與文獻的方法進行比較,本文所提的方法具有較好的結果。Item 疊代推進生成對抗網路用於陰影去除(2022) 吳建霖; Wu, Chien-Lin隨著科技的高速發展,深度學習在工業、軍事、民生科技處處都有大量的應用,現今運用在影像處理上的深度學習技術不斷進步,影像的去除如影像除霧、去反光、去陰影等都是電腦視覺領域中具挑戰性的任務。本論文研究目的為針對影像陰影去除提出了迭代推進生成對抗網路,首先我們輸入陰影圖藉由兩個生成器網路分別生成出無陰影的圖及殘差陰影圖,將兩者合成得到陰影圖,與輸入進行比對,最後將合成的圖再次輸入至網路重複上述步驟直到收斂,透過迭代推進的方式提升陰影移除的效果。此外為了使結果更加優異,我們的生成器網路加入了注意力機制,讓模型更專注於影子的部分,以及長短期記憶,使我們在長序列訓練過程中有更好的表現,最後是修復網路,以進一步改善生成的結果。我們與傳統方法以及近年來基於深度學習所提出的陰影去除方法比較,實驗結果表明本論文所提出的迭代推進方法有更優異的結果。Item 基於生成對抗式網路的人臉影像身分重建(2021) 屈軒宇; Chiu, Daniel基於卷積神經網路的人臉辨識技術已經達成極高的準確率並且廣泛應用於各種場域,然而在特定的應用場合人臉辨識技術還是有很大的挑戰,特別是影像品質不佳的監控設備環境下,人會與鏡頭有較大的距離,導致人臉影像解析度過低造成人臉身分難以辨識,為此我們提出一個新穎的基於生成對抗式網路的人臉影像重建網路,藉由學習低解析度的人臉影像與高解析度的人臉影像之映射關係,我們可以從低解析度人臉影像重建出高解析度人臉影像,此外我們使用Feature Embedding的方法從網路的輸出層得到人臉身分特徵,並且利用三元組損失計算人臉身分特徵用以訓練神經網路,使神經網路可以藉由人臉身分特徵表達做相應的高解析度人臉影像重建,實驗階段我們使用了公開的人臉資料集CASIA-WebFaces進行訓練,並與近年來基於深度學習所提出的底解析度人臉重建方法作為比較並稱為傳統方法。實驗結果表明我們所提出的極低解析度人臉重建網路在大倍率放大的影像品質與辨識率優於傳統方法。Item 高性能之輕量級卷積神經網路之設計(2021) 周世耀; Jou, Shyh-Yaw因深度學習強大的分析能力,其時常被用做影像辨識與物件偵測的工具。時至今日,已有許多基於深度學習方法的著名模型被提出,例如:SENet、EfficientNet、Densenet、MobileNet、ResNet、ShuffleNet、GhostNet、Yolo等。深度學習模型的性能主要可從4個層面進行探討,分別是參數量,資料分析能力、處理資料的速度以及模型的泛用能力。一般而言,模型能在上述4個層面都表現優秀是很困難的。在本論文中,我們設計出一各性能皆優秀的深度學習模型―ExquisiteNetV2。我們選用了15個具公信力的影像辨識資料集以及1個物件偵測資料集進行實驗,並以上述提到的著名模型做為比較對象。我們分別使用兩種不同的權重更新法做實驗,根據實驗結果,無論使用何種權重更新法,在超過一半以上的資料集中,ExquisiteNetV2的分類正確率都是第一名。ExquisiteNetV2的參數量遠少於其他模型,但資料分析能力以及運算速度卻優於其他模型,因此,ExquisiteNetV2是一種高性能之輕量級卷積神經網路,可通用於影像分類與物件偵測之應用。Item 植基於卷積神經網路之高效能車牌辨識系統(2018) 林永鑫; Lin, Yong-Sin近年來,車牌辨識系統已成為智能城市車輛管理、被盜車輛調查、交通監控等發展中的關鍵角色,車牌辨識系統有三個階段,包括車牌偵測、字元分割,與字元辨識。儘管車牌辨識系統已成功的應用於環境單純的智能停車場,但使用於監控系統中仍會面臨許多問題,例如多車道辨識,大量的交通號誌與廣告招牌,惡劣天氣與夜間拍攝的模糊傾斜圖像。本論文提出了一種高效的車牌辨識系統,首先偵測車輛,再從車輛中偵測車牌,以減少車牌偵測的誤報。再使用卷積神經網路來改善模糊圖像與近似字元的辨識效果,實驗結果顯示,與傳統的車牌辨識系統相比,該系統擁有較高的精確度。