人工智慧影像辨識工具的各種玩法 - Google Vision API

人工智慧影像辨識工具的各種玩法 - Google Vision API

 

目前人工智慧 ( AI ) 已經應用到很多專業的產業中,如醫療咖啡零售人臉合成養殖業無人駕駛救流浪貓等等。 Google 也展現了將人工智慧技術帶入日常生活的決心,並且推出了新一代機器學習產品。本篇文章要介紹的 Google Vision API 是 Google Cloud 提供的 AI 影像辨識工具,而且還被聯合利華 Unilever 採用、傢俱大廠 IKEA 也透過 Cloud Vision API 打造一款商品搜尋應用程式,消費者只要對產品拍照,馬上就能得知詳細資訊。

目錄
動手玩玩 Google Vision API
標籤偵測(LABEL_DETECTION)
臉部偵測(FACE_DETECTION)
煽情露骨內容偵測(SAFE_SEARCH_DETECTION)
標誌偵測(LOGO_DETECTION)
地標偵測(LANDMARK_DETECTION)
OCR 文字辨識(DOCUMENT_TEXT_DETECTION)

動手玩玩 Google Vision API

上過  Python 課程一定對Google Vision API 不陌生。它就像是 Google 的照片搜尋功能,主要能夠讓機器學習圖片中的物件 (如人臉、商標 Logo、圖片中的文字等等),還可以偵測是否有暴力色羶腥的內容等等。簡單而言,Vision API 會自動辨認照片出現的物品並逐一做標籤。 Python 也能造出這麼強大的AI,是不是很神奇?

只要點我打開 Google Cloud Vision API 的網頁,將圖片拖曳進下圖中的紅色區域,就能無痛、無料試玩大多數的 API 功能。

1.jpg

API 功能可簡單分成臉部辨識、標籤偵測、Web、文本辨識等等,下面將會就各個功能分別做說明。

標籤偵測

今天我們上傳一張圖片,API 就會回傳一組或多組回應。下圖為我們上傳一張貓咪圖片的範例,API 回傳了多組回應。

2.JPG

每一組回應包含三個值:mid、description 以及 score。上圖中右側顯示有 description 以及 score。

mid、description 以及 score。上圖中右側顯示有 description 以及 score。

description:這就是對該物件的文字敘述,例如:Cat(貓)、Mammal(哺乳類)等;而 score 就是 Cloud Vision API 對於這個敘述的信心分數。如此例中 Cat 為 100%,代表 API 認為 「貓」 是圖片中的主題,因此給了最高分。 其他敘述還有 Mammal(哺乳類)99%、Felidae(貓科動物)97%、Tabby Cat(虎斑貓) 95% 等。利用這個文字敘述,可以輕易找出照片內容關鍵字,對於大量照片的分類、關鍵資訊的抽取都很有幫助。

而 mid 值則是 Machine-generated identifier(機器合成辨識)的縮寫,要點選 「Show JSON」 才會看的到。如果 API 偵測出的物件或特徵是知識卡裡面的資料,那麼mid 值就會秀出該物件在知識圖譜中的位置 (如下圖紅框內容所示):

3.JPG

臉部偵測

可以偵測輸入圖片中的多個臉孔,並可針對圖片中的每個臉,個別指出臉部的喜怒哀樂、特徵、位置、是否有戴眼鏡、是否模糊等。

4.JPG

點選 「Show JSON」 則可以看到更細部的分析,包含左右眼的位置、眼睛上下緣的位置、人臉的仰角、傾角、可能的情緒狀態等極細微的特徵

5.JPG

煽情露骨內容偵測

此功能可偵測 5 種內容:adult(成人)、spoof(詐騙)、medical(藥物)、violence(暴力)、racy(性刺激),幫助使用者過濾出可能有爭議而不適合顯示的圖片。

下圖為使用裸體假人圖測試 API 的結果。API 則依據假人的裸體判斷此圖 「可能」 含有 adult(成人)及 racy(性刺激)的內容。 6.JPG

標誌偵測

此功能可偵測出圖片中是否含有著名商標。以下圖為例,賽車上的 「Red Bull」 就被偵測出來了。

7.JPG

地標偵測

此功能可偵測出圖片中是否含有著名地標。以下圖為例,台北 101 的地點、經緯度都被偵測出來了。

8.JPG

OCR 文字辨識

這功能很強大,能抓取圖片中出現的文字,可存成文字檔,省去輸入謄稿的時間。

9.JPG

 

 

 

 

繼續閱讀:

 

川普不想輸!美國AI 人工智慧發展加速催落去!

 

未來不用自己開車,荷蘭新創公司開始研究AI人工智慧自駕船

 

全世界超過40%企業導入AI人工智慧 ,數位轉型的重要關鍵

 

天啊!今天上Python課程發現我最愛的netflex竟然..

 

SEO優化沒在怕!四個語意標記關卡:第三關-JSON-LD

 

Java課程、UI課程、程式課程、網路行銷課程推薦

 

帶領AI人工智慧產業的兩大國家正在做什麼,你知道嗎?

 

arrow
arrow

    uidesignxiaoshow 發表在 痞客邦 留言(0) 人氣()