〔記者鄭德政南市報導〕為有效解決高光譜衛星影像辨識與重建,成大電機系副教授林家祥結合人工智慧的「深度學習」與數學函數理論「凸優化」,發展出獨一無二的「CODE理論」把消失的影像「算」回來,其運算效率與影像還原度領先全球現有技術,其研發成果對太空遙測技術具重要價值,獲刊「衛星遙測」領域指標性期刊《IEEE Transactions on Geoscience and Remote Sensing》。
(圖說)獨創智慧運算理論,成大電機系副教授林家祥精準重建高光譜衛星影像。(成大提供)
出自民生經濟與國防軍事用途,人類借助現代科技發射低軌道衛星回傳高光譜影像以觀測地表構造與物質,但這類「高光譜衛星影像」有別於一般RGB三原色(紅、綠、藍)相組成的影像,足以捕捉多達242種不同頻譜(以NASA Hyperion衛星影像為例),因此造價不斐,也因為取得管道少,有錢也不見得買得到,倘若因為衛星感測器失靈導致購得的影像殘缺,更將造成許多不便。
「凸優化」又稱作凸函數最佳化,是數學最佳化問題中的一個子領域,探討定義於某一抽象集合中的局部最佳值,同時也是全局最佳值。成大電機系副教授林家祥說,為解決高光譜影像辨識與重建,工程師們常選擇以人工智慧的「深度學習」或以數理運算為基礎的「凸優化」其一作為解決問題的切入點,長期以來這兩項工具各有優點而未被彼此取代。
「深度學習」可以透過大數據訓練人工智慧,無須複雜的數學運算也能重現消失的衛星影像,但蒐集多達百萬筆的「大數據」,就得耗費半年到一年的時間,更何況是每一筆資料都是造價高昂的衛星影像;反觀以數理運算為基礎的「凸優化」,僅只需要單筆或少量數據即可運算並還原影像原貌,但這類影像處理方式需要經歷繁複的公式簡化過程,有時甚至需要具備數學系碩士以上的學識才能達成這項工作。
(圖說)最左邊為衛星成功拍攝之完整畫面,第二排為感測器失效時所拍攝的殘缺畫面,最右側為林家祥團隊研發之運算系統「ADMM-Adam」(CODE理論設計之軟體)呈現結果,不僅填補斷裂的殘缺,顏色與位置細節與完整畫面近乎一樣。(林家祥提供)
林家祥指出,在高光譜影像辨識領域,比較不具備數學背景的學生和一般軟體工程師常會因時間或技術上的限制,遇到軟體開發困境。而以往用單筆數據或小數據就能精準重現衛星影像是幾乎不可能的,就算能夠重現,補回來的影像也會模糊或有色差,與實景不符,更遑論以此判斷衛星影像細部物質差異的功能。「但是我們相信,就算在這麼粗略的成像裡面,還是具有關鍵且有價值的資訊。」
秉持這個信念,林家祥與團隊將凸優化概念引入深度學習,透過「Q範數」(Q-Norm,基於「特徵數值皆大於零」的矩陣Q而設計的數學函數)調節因子作為人工智慧深度學習的核心運算公式,並為該理論原型命名為「ADMM-Adam」,最終成功萃取小數據成像中的關鍵資訊,還原衛星影像完整面貌。
(圖說)林家祥將概念整理為圖表,圖正中央紅圈裡的運算式就是經由複雜數學推導而成,包含數學函數符號「Q範數」與深度學習所呈現的運算式。(林家祥提供)
2021年林家祥的團隊以高光譜影像重建成果發表論文〈ADMM-ADAM: A new inverse imaging framework blending the advantages of convex optimization and deep learning〉( IEEE Transactions on Geoscience and Remote Sensing,2021) ,使用美國太空總署NASA衛星影像拍攝北美洲的城市、農田、山區與海岸線等四種地貌做展示,並與各國產學界現行具備的影像辨識技術做比對。
在影像還原度與運算效率上,林家祥團隊的系統皆表現最佳,並且在影像處理領域公認4大關鍵指標皆達到目前全世界最好的表現,同時將原本需要破萬組數據的深度學習技術,在論文中只用了400組數據就辦到,若現存仰賴大數據的衛星影像修復軟體需要5000組數據,可省下美金23萬4600元(相當約新台幣692萬餘元),即能達到少量數據、精準運算的成果。
(圖說)林家祥指出,在高光譜衛星影像辨識技術裡有公認的四項標準,包含空間維度、全局品質好壞指標與光譜等量化表現,表中他將ADMM-Adam與全球現有之技術比對,4項皆為全球最佳。(林家祥提供)
2022年,林家祥團隊給予該理論更簡潔的名稱「CODE」,以CO代表凸優化的凸性質(Convex),而DE代表深度學習(Deep),更利於記憶與國際通用;此外,也將運算系統優化,最少僅用單筆數據就能達到影像還原。
林家祥分享推導公式的心路歷程,「其實一般科學家開始推公式之前心裡經常會已經有個預設答案,朝著心裡的目標步步前進,並在過程中逐漸發現原來事情還能更簡單,就像愛因斯坦的著名公式E=mc2也並非偶然。」他加入成大後投入高光譜影像重建的議題長達2年,終將繁雜且龐大的影像重建公式化為一道純粹的減法。
(圖說)在林家祥提出自創理論以前,以數學運算為主的影像重建公式需要經歷非常複雜的函數計算如上圖,其公式推導極具難度。(林家祥提供)
從大學到博士班都是唸電機的林家祥,是學界少數能統合「大數據運算」與「凸優化」並創造全新理論的學者。林家祥說自己雖不是專攻數學,但因為對數學的熱愛,大學時期會主動到數學系選課,一路到博士班。
林家祥說,數學訓練的其實是邏輯跟直覺,得以讓程式設計很強的學生發揮更強的實力。「在我們實驗室的研究成果很多都仰賴數學系的知識。」他從自身經驗觀察到跨領域學習帶來的好處,因此現在也會極力「洗腦」實驗室學生到數學系上課。「目前在我實驗室裡,要不就是程式設計很在行,要不就是數學邏輯很好,還沒有出現兩個都不行的。」
最後,林家祥引用愛因斯坦名言:「如果你沒辦法簡單說明,代表你了解得不夠透徹。」總結「CODE理論」,現在他希望自己的成果能幫助業界軟體工程師或各領域的學者「不用複雜數學、也不用大數據」就能輕鬆達到想要的效果,並持續產出跨領域合作研究。
這兩年來林家祥所主持的高光譜智慧運算實驗室已發表8篇IEEE Transactions期刊論文、一本專書以及23篇會議論文,此外,也與成大光電系團隊合作,成功開發可操控光的超穎介面,並與海外眾多學者合作發表文章,將CODE理論放到空間資訊、材料、統計、光電等領域大放異彩。