韓國電子通訊研究院(ETRI)發布,將公開可辨識事物及追蹤行動的視覺AI所需之核心技術—VoVNet,以及不需Photoshop照片編輯軟體也可輕鬆編輯臉部照片的技術—SC-FEGAN,同時也公布視覺AI學習所需的560種都市環境與景物,以及20萬筆的影像資料,主要來自監視器所錄製的內容,例如車輛、號誌燈等,勢必對AI產業帶來助益。
VoVNet技術透過找到照片中人物的特徵、蒐集與分析資訊,再建構類神經網路模型,將可實現各種事物檢測、部分辨識及臉部辨識等功能。另一項臉部照片編輯技術SC-FEGAN,可為照片中的人物添加配件、改變髮型、表情等,甚至因塗鴉而毀損或部分照片空白等情況也可透過簡單的編輯恢復原狀。此技術使用深度學習(Deep Learning)技術中的GAN技術,以人工的方式建立數據,並透過辨識此數據來打造仿真的人造數據,將可大幅減少電腦圖像運算、網頁設計、產業設計等的作業時間並提高辨識結果品質。