微控制器板/嵌入式開發板的AI影像辨識福音 – 千元上下且含螢幕的鏡頭模組 HuskyLens

DFRobot公司在kickstarter群眾募資的HuskyLens 可以讓Arduino跟micro:bit做影像辨識及訓練辨識模型

手中有Arduino、micro:bit的使用者想要嘗試AI影像辨識與訓練自己的物體偵測模型,可以參考DFRobot公司在kickstarter募資的HuskyLens,它內建常見的影像演算法如物體辨識及追蹤、臉部辨識、循線、顏色辨識、標籤辨識。想訓練HuskyLens辨識新物件,只需要像相機一樣按下按鈕就可以儲存影像以及框選新物體範圍。其內含的2.0英吋螢幕,用於顯示即時影像及操作介面,讓使用者能選擇要使用的演算法、調整設定、或是確認辨識效果,過程中不需要使用電腦。

作者蔡雨錡
參考網頁https://www.kickstarter.com/projects/1371216747/huskylens-an-ai-camera-click-learn-and-play/description

之前聽過李飛飛教授 TED 上的演講 [1],講述如何教導電腦看懂圖像,他說小嬰兒呱呱墜地後,他們的眼睛就如同生物相機一樣,每 200 毫秒就拍一張照片,蒐集數以百萬計的照片來學習辨識事物的能力。而這篇要介紹的 DFRobot 公司的 HuskyLens 鏡頭模組,有別於一般的相機僅能攝影或錄影,它不需要搭配複雜的演算法便可以透過拍攝的影像來學習,它使用 AI 功能的晶片 Kendryte K210 [2],讓你可以輕鬆的按按鈕拍照來教它認識物體、臉部辨識、以及顏色辨識。而且 HuskyLens 本身有 2.0 英吋的螢幕,可以顯示即時影像確認是否辨識成功及操作介面提供使用者選擇要使用的演算法與調整設定,不需要使用電腦調整任何參數。

使用 HuskyLens 內建的多種演算法,你除了可以拍照片讓它認識並記錄不同的物體,讓 HuskyLens 從不同角度或不同遠近距離來拍攝同一物體的各種影像,收集越多的影像,它的辨識就會越準確。

HuskyLens 擁有的演算法如下:

  • 物體追蹤 Object Tracking
  • 臉部辨識 Face Recognition
  • 物體辨識 Object Recognition
  • 循線 Line Tracking
  • 顏色辨識 Color Recognition
  • 標籤辨識 Tag Recognition

除了擁有上述的多種演算法之外,HuskyLens 還可以同時運行這些演算法,例如你可以做一台智能小車,讓它除了能沿著黑線循線行進之外,還可以辨識行進過程中看到的標籤,並根據標籤類別決定轉向方向。

在硬體規格方面,鏡頭分成200萬像素的基礎版(29 CAD,約 687 NTD)跟500萬像素 (65 CAD,約 1594 NTD)的進階版這兩種。在這樣的像素下能以30 fps的速度來做偵測。更重要的是,HuskyLens 使用UART埠通訊,除了能應用在嵌入式開發板 Raspberry Pi、LattePanda 上之外,也可以用在微控制板 Arduino 跟 micro:bit 上,讓使用者可以不使用複雜程式的情況下,快速且有效的做出各式各樣的作品。其他詳細規格可以參考 HuskyLens 在kickstarter募資的介紹 [3]。

HuskyLens 的功能多到令人心動,可以做很多有趣的專題:小編學生時代一直很想做的火影忍者結印解鎖門禁(手勢辨識控制)、耳熟能詳的自走車(循線)、課堂或公司自動影像點名打卡(臉部辨識)、放在野外協助野生動物偵測及標定(物體辨識)、發票對獎(數字辨識)、結合上述的各種演算法建立強大的智能機器人助理、製作大型互動式裝置藝術等等,等待你去進一步探索。

當然除了讚嘆 HuskyLens 的厲害程度之外,也必須跟市面上已有的產品做一下比較。大師級的人可以直接買AI專用晶片Kendryte K210來使用,Github上也有詳細的datasheet [3]。Arduino 的使用者原先可能有些人有碰過 ESP32-CAM (約435 NTD)[4] 或是 Pixy2,又稱CMUcam5(Amazon 上賣 59.9 USD,約1866 NTD,2014年發行)[5],小編兩種都有用過。ESP32可以搭配 Arduino 透過它建立的 stream server來做基礎影像處理以及辨識,也有臉部辨識功能,但框選範圍品質普通。最新的 Pixy2 可以搭配Arduino/Raspberry Pi/BeagleBone Black/LEGO Mindstorms EV3,擷取影像的更新速率是60fps,能使用內建的資料庫偵測上百種物件、會自動追蹤偵測到的物件、做顏色追蹤跟循線、也可以訓練他辨識新的物體。官方有提供PixyMon讓使用者可以在電腦上查看影像處理的結果。另外有一個宣傳概念類似的產品,JeVois A33 Smart Machine Vision Camera (49.99 USD,約1557 NTD,2017年發行)[6],自帶降溫風扇,可以接SD卡讓你可以裝作業系統、JeVois軟體、下載TensorFlow等演算法以及儲存資料。這個產品預設的競爭對手是Raspberry Pi 3 Model B,主打麻雀雖小五臟俱全,CPU有1.35GHz,但Ram只有256MB DDR3-1600。鏡頭部分使用最高的1280×1024解析度下能有15fps的影像更新速率。可以接Arduino/Raspberry Pi,或是接電腦使用。產品定位比較接近用途多樣化。

綜上所述,HuskyLens 是一個性價比高且能讓你快速開發AI互動專案的鏡頭模組,推薦大家有機會可以買來玩玩看!

(上述商品價格按照文章撰寫當下匯率做換算)

圖片來源皆來自於 DFRobot 在 kickstarter 上的群眾募資頁面 [2]

 

參考資料:

[1] 李飛飛教授TED連結

[2] DFRobot 在 kickstarter 上的群眾募資

https://www.kickstarter.com/projects/1371216747/huskylens-an-ai-camera-click-learn-and-play/description

[3] Kendryte K210 on Github

https://github.com/kendryte/kendryte-doc-datasheet/blob/master/en/001.md

[4] ESP32-CAM  on Github

https://github.com/topics/esp32-cam

[5] Pixy/CMUcam 官網

http://www.cmucam.org

[6] JeVois 官網

http://jevois.org

 

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *