此外,本所致力於技術移轉並開發具有潛力之高科技產品,包括以下項目:
瞳孔的大小或變化的速度可以同時表明其身體狀況和精神狀態。如果瞳孔收縮或瞳孔反應速率異常,則可能意味著一些症狀,例如青光眼、糖尿病性視網膜病、全身麻醉或霍納綜合症。另一方面,瞳孔的擴張可能受到精神條件的刺激,例如興奮和愉悅,而瞳孔的收縮可能是由於壓力、不適等引起的。本研究提出了一種基於卷積神經網絡(CNN)的可計算瞳孔大小的算法。通常,瞳孔的形狀不是圓形的,約50%的瞳孔可以使用橢圓計算獲得最佳擬合效果。本研究使用橢圓的長軸和短軸來表示瞳孔的大小,並將這兩個參數用作網絡的輸出。關於網絡的輸入,數據集來自視頻(連續幀)。如果從視頻中獲取每一幀並使用它們來訓練CNN模型,則可能會因為圖像太相似而導致過度擬合。為了避免這個問題,本研究使用數據擴充以及計算結構相似度以確保圖像具有一定程度的差異。為了優化網絡結構,本研究使用平均誤差對更改網絡深度和卷積濾波器的視場(FOV)進行了比較。結果表明,加深網絡和加寬卷積濾波器的FOV都可以減小平均誤差。根據結果,瞳孔長度的平均誤差為7.63%,瞳孔面積為14.68%。它可以在每秒36幀的低成本移動嵌入式系統中運行,因此可以將低成本系統用於瞳孔大小預測。
實驗室發展AI自動偵測野鳥技術,整合於飼養場域中並搭配雷射裝置用於驅趕野鳥,以此預防家禽感染禽流感。演算法基於小物件偵測數據增強法、課程學習、困難反例探勘方法進行改良,並改善模型辨識小物件的準確度。於研究中,我們驗證不同方法對相同模型的辨識準確度之改進效果。本研究以鳥類偵測為例,在大量收集鳥類數據後進行驗證,並於實際場域中實現軟硬體設備。
本研究基於深度生成網路開發了適用於傢俱、磁磚等產業的圖紋擴增技術。該架構透過學習特定的紋理樣本,來達到自動化生成與原樣本具有視覺相似,但帶有變異及隨機性的紋理。本研究架構如圖1-(a)所示,包含了一個VAE (variational autoencoder)網路與一個GAN(Generative adversarial nets)網路:前者生成粗略紋理,加入了殘差結構(Residual connection)以及批次正規化層(Batch normalization)來加速訓練與提升影像品質。後者以WGAN-GP生成紋理細節。
圖1 系統架構
訓練流程如圖1-(a) 所示,由VAE產生兩種影像,一種是經編碼器壓縮、解碼器解壓縮後得到的「重建影像」 (圖中以紅色外框標示);另一種是一符合高斯分佈的隨機張量直接經過解碼器解壓縮所生成的「生成影像」(圖中以黃色外框標示)。對於生成影像,我們將其輸入生成網路來得到細節化的成果,再將該成果輸入判別網路計算損失。而對於重建影像,除了上述的損失,還額外將細節化的成果與原始樣本輸入已訓練好的經典模型VGG19,計算兩者於特徵空間中的差異。實際應用流程如圖1- (b) 所示,僅須透過輸入隨機張量,經由VAE的解碼器與GAN的生成網路,便能夠得到具備高細節的生成影像。
圖2展示了訓練影像(上)與隨機生成的影像(下),可以看到在木紋以及石紋的生成表現,該系統能夠學習各尺度的特徵並用於重構影像產生高仿真的影像。雖然在細節部分無法達到與訓練樣本一樣的細緻,但仍具備了一定的水準及潛力。
圖2 訓練影像與生成影像
逆色調映射器(Inverse Tone-Mapping Operator, ITMO)能夠將SDR影像的動態範圍擴展至高動態範圍(HDR),幫助佔絕對多數的SDR影像轉換成HDR影像,進而發揮HDR顯示器的性能,提升影像品質。不過現有的數種ITMO是基於不同的理念或目的設計的,不同的影像內容可能分別適用不同的ITMO,因此本研究嘗試結合善於處理影像內容分析的AI技術,建構一套基於監督式學習的最適ITMO預測系統。本研究透過最佳影像標記與等級評價人因實驗,評估8種ITMO,使用6種機械學習方法(SVM, MLP, KNN等)、5種CNN網路架構(VGG16, ResNet-50等)在不同參數下預測最適ITMO的準確度。結果顯示灰度影像訓練的AlexNet模型能準確預測最適逆色調映射器。
在這項研究中,我們提出了一種預測光學系統的Zernike係數的新方法。我們通過神經網絡中的圖像識別功能預測Zernike係數。它可以減少干涉儀中常用的數學運算並提高測量精度。我們使用相位圖和干涉條紋作為神經網絡的輸入,分別預測係數並比較兩個模型的效果。在這項研究中,使用python和光學仿真軟件來確認整體效果。結果顯示,所有的均方根誤差(RMSE)都小於0.09,這意味著可以將干涉條紋或相位圖直接轉換為係數。 不僅可以減少計算步驟,而且可以提高整體效率並減少計算時間。例如,我們可以使用它來檢查相機鏡頭的性能。