分類
人工智慧 科技

2020人工智慧AI有哪些熱門的應用主題? (電腦視覺篇)

人工智慧(AI)領域的發展速度不斷突破人們的想像。新技術的出現,推動了新的應用,創造了新的商機。這一篇文章用較口語的方式簡單整理了一些這個領域的新興技術及帶來的商業應用,希望能對不熟AI但對AI這個主題有興趣的讀者有些幫助。這篇的介紹會以AI中的電腦視覺為主。

Computer Vision(電腦視覺)

1. Image Classification(影像分類)

影像分類的任務是讓電腦擁有辨認單項物件的能力。可以配合語意分割一起使用。例如給機器看藍色部分的原圖,問機器這是什麼,機器會回答”沙發”;綠色部分的原圖機器會回答”桌子”。

常見應用: 良率偵測、人臉身分識別

2. Object Detection(物件偵測)

物件偵測的任務是讓電腦擁有辨認多項物件的能力。會用一個框框(bounding box)把看到的物件們圈出來,並辨識那些物件是屬於什麼東西。

圖片來源: Zyl Story
這邊有一個網路上的demo影片,如果覺得框框跳動太快可以按一下暫停。

常見應用: 雲端照片辨識

3. Semantic Segmentation(語義分割)

語意分割的任務是讓電腦擁有辨認物件邊界的能力。在電腦的世界中,看到的影像其實都是由一格一格像素所組成的資料。但電腦實際上沒辦法知道哪些像素該合起來當一個物件看,哪些像素又是其他物件。

圖片來源: CSAILVision 

常見應用: 自動駕駛車、機器人、無人商店

3.1 進階研究1: Real-Time Semantic Segmentation(實時語義分割)

影片型的語意分割。除了分割效果外,要實際應用也需要考量運算速度能不能跟上。

3.2 進階研究2: 3D Semantic Segmentation(立體語義分割)

3.3 進階研究3: Scene Segmentation(場景語意分割)

4. Image Generation(影像生成)

影像生成的任務是讓電腦生成影像。電腦會先看過非常多照片,存在它的腦袋(neural network),並天馬行空的把它想像中的東西畫出來。前陣子赫赫有名的deepfake隸屬於影像生成這個領域。筆者也曾經致力於研究影像生成過!(小聲…)。

generate-face
圖片來源: stylegan (這是假人)

常見應用: 虛擬助理(Virtual Assistants)、電商快速換衣

4.1 進階研究1: Conditional Image Generation(條件影像生成)

最一開始的電腦學會的技能是胡亂生成的,腦袋想到什麼就生什麼,比較難以運用。因此接著人們研究怎麼下一些條件給電腦,讓電腦能夠依著條件進行生成,才比較好做後續的商業運用。例如下的條件是,金髮、藍眼睛、女性,電腦才有機會生出個金髮藍眼美人。

4.2 進階研究2: Image inpainting(圖像修復)

4.3 進階研究3: Image-to-Image Translation(影像風格轉換)

5. Super-Resolution(超解析度)

超解析度的任務是讓電腦提高某個影像的解析度。我們手邊可能有一些照片是很久以前拍的,又或者是上傳到網路但被電腦壓縮過的,看起來很模糊。可以將照片交給Super-Resolution處理。

常見應用: 機場犯罪監視器

總結

AI除了電腦視覺外,還有許多經典的研究主題。例如: 語言(Natural Language)、語音(Speech)。如果想要更深入了解技術,可以看李弘毅在台大開授的課程,李弘毅的課程由淺入深,且每個學期都會即時更新最新的技術,非常適合想學技術的讀者。如果想學更多應用的讀者,可以在hahow上搜尋ai、機器學習、深度學習,裡面有許多業界人士分享他們應用上的經驗。有一堂教python+ai理財的更是價值千萬。

想追蹤更多的學界最新技術,可以上paperswithcode,裡面都是最新the-state-of-the-art的學界論文,也能找到對應的程式碼(from github)。

喜歡的話可以在下面幫我留個言,我會更深入探討更多主題!

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *