近年來深度學習技術在各種機器學習任務上達到前所未有的精度,這樣的突破使得自駕車或是機器人甚至是AIOT中的感知系統在可靠度上有了極大的提升。
在各種深度學習模型中,應用最廣泛的就是所謂的物件偵測模型,而物件偵測模型最受歡迎的就是YOLO的各種衍生版本,從2015年YOLOv1橫空出世以來,大部份即時物件偵測系統都是應用YOLO,其原因在於 YOLO一直在辨識率以及速度上得到了很好的平衡,之後的YOLOv2-v5,甚至是2021年的YOLOX,2022年的YOLOv7以及2023年的YOLOv8都持續的在這兩個最重要的指標上突破。
然而,這些各代YOLO除了速度與辨識率的差異外,還有什麼呢?你知道YOLOv1無法偵測重心在同一個grid cell的不同類物體,但YOLOv2可以嗎?你知道YOLOv3可以實現單一物體多類別的偵測與辨識嗎?你知道YOLOv4使用了那些trick使得mAP提升了那麼多嗎?你知道YOLOX的decoupled head對辨識率的影響有多大嗎?你知道在MSCOCO這個資料集,如果將輸入影像的解析度限制在640x640,其實YOLOv4的辨識率比YOLOv5與YOLOX高嗎?那YOLOv5與YOLOX的優勢在什麼地方?你知道YOLOv7就辨識率來說並沒有達到史上最高,但卻達到辨識率與及速度的最佳平衡,你知道YOLOv8基於YOLOv5並借鑑YOLOv7中的哪些設計思維因而能再一次的提升辨識率嗎?
本課程的主要內容在於以上所有YOLO模型的理論介紹與實作,實作內容包括了如何修改這些模型使其能在客制化的資料集上完成訓練。此外,本課程內容還包括運用Optuna這樣的超參數調整函式庫,在物件偵測模型訓練的效能不如預期,但手動調整超參數,效能提升也有限的情形下,自動化的調整超參數,以顯著提升辨識率。若你手邊有足夠的GPU訓練資源,我們可以使用更為進階的RayTune平行化超參數搜尋,以進一步的提升搜尋效率。
經過本次課程的洗禮,您將學會(1) 以上八個YOLO模型各有什麼優缺點,以及如何針對自己的應用選擇一個最佳的模型,例如自駕車或是室內監控系統,(2) 如何運用一個物件偵測模型解決特定問題,例如從頭訓練一個模型以偵測紅血球與白血球,(3) 在訓練效果不佳時,如何有系統的調整超參數以提升辨識率。
本課程所有的程式都使用PyTorch在Colab此雲端平台上開發,實作範例包含資料集以及程式碼都會提供,本次課程的內容包括了:
1. 深度學習各種資料集簡介,辨識率定義以及辨識率計算實作 2. 辨識率(Average Precision)以及Non-Maximal Suppression實作 3. YOLOv1原理以及實作(使用Pascal VOC dataset實作與口罩資料集) 4. YOLOv2原理以及實作(使用Pascal VOC dataset實作) 5. YOLOv3原理以及實作(使用Carsim dataset) 6. YOLOv4原理以及實作(使用BCCD dataset) 7. YOLOv4超參數最佳化(使用Optuna最佳化在 BCCD dataset上的辨識率) 8. YOLOv5原理以及實作(使用 COCO128 dataset) 9. YOLOX原理以及實作(使用 COCO128 dataset與口罩資料集) 10. YOLOv7原理以及實作(使用口罩資料集與VisDrone資料集) 11. YOLOv8原理以及實作(使用口罩資料集與VisDrone資料集)
12. YOLOv8原理以及實作(使用RayTune最佳化在VisDrone資料集上的辨識率)
|
林哲聰 老師
實體:工研院產業學院 產業人才訓練一部(台北) (實際地點以上課通知為主!)
線上:線上直播會議室(使用Cisco Webex Meeting)
報名方案 |
費用 |
課程原價 |
每人10,800元 |
早鳥價 (開課前3週) |
每人9,800元 |
團報價 (三人以上) |
每人9,200元 |