課程代號:2322050010  

PyTorch深度學習物件偵測模型實作(從YOLOv1-v7)

1.熟悉Python此程式語言 2.學會運用PyTorch 開發深度學習模型 3.協助具影像處理/電腦視覺專長之學員切入電腦視覺、深度學習領域 4.未來應用這樣的深度學習模型至駕駛輔助系統、自駕車甚至是機器人中的視覺感知次系統

課程型態/
數位課程
上課地址/
純線上授課 (使用Cisco Webex Meetings)
時  數/
12 小時
起迄日期/
2023/08/04 ~ 2023/08/18
聯絡資訊/
陳品諠   (02) 2370-1111#303
活動取消
課程介紹

  近年來深度學習技術在各種機器學習任務上達到前所未有的精度,這樣的突破使得自駕車或是機器人甚至是AIOT中的感知系統在可靠度上有了極大的提升。
  在各種深度學習模型中,應用最廣泛的就是所謂的物件偵測模型,而物件偵測模型最受歡迎的就是YOLO的各種衍生版本,從2015年YOLOv1橫空出世以來,大部份即時物件偵測系統都是應用YOLO,其原因在於 YOLO一直在辨識率以及速度上得到了很好的平衡,之後的YOLOv2-v5,甚至是2021年的YOLOX以及2022年的YOLOv7都持續的在這兩個最重要的指標上突破。
  然而,這些各代YOLO除了速度與辨識率的差異外,還有什麼呢?你知道YOLOv1無法偵測重心在同一個grid cell的不同類物體,但YOLOv2可以嗎?你知道YOLOv3可以實現單一物體多類別的偵測與辨識嗎?你知道YOLOv4使用了那些trick使得mAP提升了那麼多嗎?你知道YOLOX的decoupled head對辨識率的影響有多大嗎?你知道在MSCOCO這個資料集,如果將輸入影像的解析度限制在640x640,其實YOLOv4的辨識率比YOLOv5與YOLOX高嗎?那YOLOv5與YOLOX的優勢在什麼地方?你知道YOLOv7就辨識率來說並沒有達到史上最高,但卻達到辨識率與及速度的最佳平衡!
  本課程的主要內容在於以上所有YOLO模型的理論介紹與實作,實作內容包括了如何修改這些模型使其能在客制化的資料集上完成訓練。此外,本課程最重要的內容還包括了運用Optuna這樣的超參數調整函式庫,在物件偵測模型訓練的效能不如預期,但手動調整超參數,效能提升也有限的情形下,自動化的調整超參數,以顯著提升辨識率。
  經過本次課程的洗禮,您將學會(1) 以上七個YOLO模型各有什麼優缺點,以及如何針對自己的應用選擇一個最佳的模型,例如自駕車或是室內監控系統,(2)如何運用一個物件偵測模型解決特定問題,例如從頭訓練一個模型以偵測紅血球與白血球,(3)在訓練效果不佳時,如何有系統的調整超參數以提升辨識率。
  本課程所有的程式都使用PyTorch在Colab此雲端平台上開發,實作範例包含資料集以及程式碼都會提供,本次課程的內容包括了:

  1. 深度學習各種資料集簡介,辨識率定義以及辨識率計算實作
  2. 辨識率(Average Precision)以及Non-Maximal Suppression實作
  3. YOLOv1原理以及實作(使用Pascal VOC dataset實作與口罩資料集)
  4. YOLOv2原理以及實作(使用Pascal VOC dataset實作)
  5. YOLOv3原理以及實作(使用Carsim dataset)
  6. YOLOv4原理以及實作(使用BCCD dataset)
  7. YOLOv4超參數最佳化(使用Optuna最佳化在 BCCD dataset上的辨識率)
  8. YOLOv5原理以及實作(使用 COCO128 dataset)
  9. YOLOX原理以及實作(使用 COCO128 dataset與口罩資料集)
  10. YOLOv7原理以及實作(使用口罩資料集與VisDrone資料集)

 

課程目標

  1. 熟悉Python此程式語言
  2. 學會運用PyTorch 開發深度學習模型
  3. 協助具影像處理/電腦視覺專長之學員切入電腦視覺、深度學習領域
  4. 未來應用這樣的深度學習模型至駕駛輔助系統、自駕車甚至是機器人中的視覺感知次系統


課程對象

  1. 具備程式設計能力,未來想投入機器學習、電腦視覺或資料科學領域的工程師
  2. 想應用電腦視覺、機器學習相關技術至物聯網、駕駛輔助系統之程式設計師


講師簡介

林哲聰  老師

  • 學歷:台灣大學應用力學研究所碩士/清華大學資訊工程研究所博士
  • 現職:Chalmers University of Technology 博士後研究員
  • 經歷:工研院機械所副研究員/研究員/資深研究員
   加州大學聖塔芭芭拉分校資工系訪問研究員
   上奇資訊-計算機概論 共同譯者
   2010 伽利略創新大賽 台灣區季軍
   2011 伽利略創新大賽 特別獎(GNSS Living Lab)得主
   2013 伽利略創新大賽 瑞士區冠軍
   2016 日本立命館大學英文演講比賽 清華大學代表
   2017 CVGIP 行人偵測競賽 亞軍
   2017 MOST 生成式對抗網路競賽 佳作
   2018第八屆兩岸清華研究生學術論壇 清華大學代表
   2019 IEEE ICIP Three Minute Thesis Competition (3MT®): Finalist
   2020 AI智慧應用新世代人才培育計畫-人才解題實證(倒車攝影機影像識別-障礙物與逼近偵測):佳作
   2020 中華民國影像處理與圖形識別學會第十三屆博碩士論文獎博士論文佳作
   2020 中華民國資訊學會碩博士最佳論文獎-博士論文佳作
  • 專長
  Computer Vision, Image Processing, Pattern Recognition, Machine Learning, Deep Learning,GPS, Embedded System, iPhone Programming
  已於車用影像安全警示系統領域中發表過二十五篇國際論文,十五篇國內論文,以及十三篇專利。


課程大綱

  1. 深度學習各種資料集簡介,辨識率定義以及辨識率計算實作
  2. 辨識率(Average Precision)以及Non-Maximal Suppression實作
  3. YOLOv1原理以及實作(使用Pascal VOC dataset實作與口罩資料集)
  4. YOLOv2原理以及實作(使用Pascal VOC dataset實作)
  5. YOLOv3原理以及實作(使用Carsim dataset)
  6. YOLOv4原理以及實作(使用BCCD dataset)
  7. YOLOv4超參數最佳化(使用Optuna最佳化在 BCCD dataset上的辨識率)
  8. YOLOv5原理以及實作(使用 COCO128 dataset)
  9. YOLOX原理以及實作(使用 COCO128 dataset與口罩資料集)
  10. YOLOv7原理以及實作(使用口罩資料集與VisDrone資料集)

 

開課資訊

  • 主辦單位:工研院產業學院 台北學習中心
  • 上課時間:112/08/04、08/11、08/18 (每週五) ,13:00~17:00(12小時)
  • 上課地點:線上直播會議室(使用Cisco Webex Meeting,將於課前提供會議室連結)
  • 報名方式:

  1.線上報名:點選課程頁面上方的「線上報名」
  2.傳真報名:填妥報名表傳真至02-23811000
  3.email報名:填妥報名表email至 itri535842@itri.org.tw

  • 課程洽詢:(02) 2370-1111 *303 陳小姐  *315 陳先生

 

課程費用

  • 原價:每人 $ 10,800 元
  • 早鳥價 (開課前三週):每人 $ 9,800 元
  • 團報價 (三人以上):每人 $ 9,200 元。

  (以上費用已包含講義及教材費)


注意事項

  • 信用卡(線上報名):繳費方式選「信用卡」,直到顯示「您已完成報名手續」為止,才確實完成繳費。
  • ATM 轉帳(線上報名):繳費方式選擇「ATM 轉帳」者,系統將給您一組轉帳帳號「銀行代號、轉帳帳號」,但此帳號僅提供本課程轉帳使用,各別學員轉帳請使用不同轉帳帳號!!轉帳後,寫上您的「公司全銜、課程名稱、姓名、聯絡電話」與「收據」傳真或E-mail 給 陳小姐。
  • 銀行匯款(限由公司逕行電匯付款):土地銀行 工研院分行,帳號 156-005-00002-5(土銀代碼:005)。戶名「財團法人工業技術研究院」。匯款後,寫上您的「公司全銜、課程名稱、姓名、聯絡電話」與「收據」傳真或E-mail 給 陳小姐。
  • 即期支票:抬頭「財團法人工業技術研究院」,郵寄至:106臺北市大安區復興南路2段237號4樓, 陳小姐收 或 於課程當日攜帶給予 陳小姐。
  • 計畫代號扣款(工研院同仁):請從產業學院學習網直接登入工研人報名;俾利計畫代號扣款。

 

注意事項

  1. 為確保您的上課權益,報名後若未收到任何回覆,敬請來電洽詢方完成報名。
  2. 因課前教材、講義及餐點之準備及需為您進行退款相關事宜,若您不克前來,請於開課三個工作日前告知,以利行政作業進行並共同愛護資源。
  3. 若原報名者因故不克參加,但欲更換他人參加,敬請於開課前二個工作日通知。