課程代號:2322090024  

PyTorch深度學習模型實作

1.熟悉Python此程式語言 2.協助具影像處理專長之學員切入電腦視覺/深度學習領域 3.未來可銜接各類進階深度學習課程

課程型態/
混成
上課地址/
實體:工研院產業學院 產業人才訓練一部(台北) (實際地點以上課通知為主!)/線上:線上直播會議室 (使用Cisco Webex Meeting)
時  數/
12 小時
起迄日期/
2024/01/19 ~ 2024/01/26
聯絡資訊/
謝芷欣   02-23701111#312
報名截止
課程介紹

近年來深度學習技術在各種機器學習任務上達到前所未有的突破,而開發者使用的深度學習框架與開發效率有極大的關係。
PyTorch為FAIR (Facebook AI Research)於2017年所開放的深度學習框架,過去兩年在深度學習、電腦視覺、自然語言處理等頂會中的使用率,已經全面超越Tensorflow。相較於Tensorflow,PyTorch容易上手、搭建模型效率極高,程式碼卻更為簡潔,因此,許多最新的深度學習模型都是運用PyTorch實現。
本課程除了簡介深度學習的基本原理以及訓練細節,還會介紹各種深度學習模型,其中包括了影像分類、物件偵測、影像分割,甚至是生成式對抗網路。
經過本次課程的洗禮,您將學會
  1. 從頭訓練一個深度學習網路
  2. 在訓練效果不佳時,如何有系統的調整超參數以提升辨識率

運用適當的模型解決工作上的需求,尤其是如何訓練一個能在效能與計算量間得到平衡的模型。本課程所有的程式都將在Colab此雲端平台上開發,實作範例包含資料以及程式碼都會提供,本次課程的內容包括了:

  1. 深度學習(Deep Learning)簡介
  2. 卷積神經網路之訓練細節簡介
  3. 知名卷積神經網路(CNN)簡介
  4. 基礎神經網路實作:比較神經網路倒傳遞以Python實作與運用PyTorch自動微分間的差異
  5. 運用遷移學習之圖片分類模型實作: 運用Alexnet, ResNet進行人臉分類(使用CelebA dataset)
  6. 物體偵測模型簡介與實作:實作YOLOv1以實現通用物體偵測(使用Pascal    VOC dataset)
  7. 語義影像分割模型簡介與實作:運用FCN實現行車場景之影像分割(使用CamVid dataset)
  8. 生成式對抗網路簡介與實作:運用DCGAN實現人臉影像生成(使用CelebA dataset)並使用生成影像提高訓練資料量以提升人臉分類之辨識率。


課程目標

  1. 熟悉Python此程式語言
  2. 協助具影像處理專長之學員切入電腦視覺/深度學習領域
  3. 未來可銜接各類進階深度學習課程


課程大綱

  1. 深度學習(Deep Learning)簡介
  2. 卷積神經網路之訓練細節簡介
  3. 知名卷積神經網路(CNN)簡介
  4. 基礎神經網路實作:比較神經網路倒傳遞以Python實作與運用PyTorch自動微分間的差異
  5. 運用遷移學習之圖片分類模型實作: 運用Alexnet, ResNet進行人臉分類(使用CelebA dataset)
  6. 物體偵測模型簡介與實作:實作YOLOv1以實現通用物體偵測(使用Pascal VOC dataset)
  7. 語義影像分割模型簡介與實作:運用FCN實現行車場景之影像分割(使用CamVid dataset)
  8. 生成式對抗網路簡介與實作:運用DCGAN實現人臉影像生成(使用CelebA dataset)並使用生成影像提高訓練資料量以提升人臉分類之辨識率。


講師簡介

林哲聰  老師

  • 學歷:台灣大學應用力學研究所碩士/清華大學資訊工程研究所博士
  • 現職:Chalmers University of Technology 博士後研究員
  • 經歷:工研院機械所副研究員/研究員/資深研究員
   加州大學聖塔芭芭拉分校資工系訪問研究員
   上奇資訊-計算機概論 共同譯者
   2010 伽利略創新大賽 台灣區季軍
   2011 伽利略創新大賽 特別獎(GNSS Living Lab)得主
   2013 伽利略創新大賽 瑞士區冠軍
   2016 日本立命館大學英文演講比賽 清華大學代表
   2017 CVGIP 行人偵測競賽 亞軍
   2017 MOST 生成式對抗網路競賽 佳作
   2018第八屆兩岸清華研究生學術論壇 清華大學代表
   2019 IEEE ICIP Three Minute Thesis Competition (3MT®): Finalist
   2020 AI智慧應用新世代人才培育計畫-人才解題實證(倒車攝影機影像識別-障礙物與逼近偵測):佳作
   2020 中華民國影像處理與圖形識別學會第十三屆博碩士論文獎博士論文佳作
   2020 中華民國資訊學會碩博士最佳論文獎-博士論文佳作
  • 專長
  Computer Vision, Image Processing, Pattern Recognition, Machine Learning, Deep Learning,   GPS, Embedded System, iPhone Programming
  已於車用影像安全警示系統領域中發表過二十五篇國際論文,十五篇國內論文,以及十三篇專利。


開課資訊

  • 主辦單位:工研院產業學院
  • 上課時間:113/01/19、01/26 (隔週五) ,09:30~16:30(12小時)
  • 上課地點:實體:工研院產業學院 產業人才訓練一部(台北) (實際地點以上課通知為主!)/線上:線上直播會議室 (使用Cisco Webex Meeting)
  • 招生人數:本班預計20人為原則,最低開課門檻為10人
  • 報名方式:

  1.線上報名:點選課程頁面上方的「線上報名」
  2.傳真報名:填妥報名表傳真至02-23811000
  3.email報名:填妥報名表email至 itri535662@itri.org.tw

  • 繳費方式:報名時可選擇信用卡線上繳費或匯款,主辦單位將於確認開班後通知您相關匯款資訊
  • 退費標準:若欲取消報名,請於開課前三日以傳真或email告知主辦單位,並電話確認退費事宜,逾期將郵寄講義,恕不退費。若您未於期限內申請退費,則不得於任何因素要求退費,惟可轉讓與其他人參訓。

課程費用

 

類別

費用

說明

原價

每人10,800

 

早鳥價

每人9,800

開課3週完成報名

團報價

每人9,200

同公司3人以上

☉註:以上費用已包含講義及教材費


注意事項

  1. 為確保您的上課權益,報名後若未收到任何回覆,敬請來電洽詢方完成報名。
  2. 若您不克前來,請於開課前3日以E-mail或電話通知主辦單位聯絡人確認申請退費事宜。學員於開訓前退訓者,將依其申請退還所繳上課費用90%,另於培訓期間若因個人因素無法繼續參與課程,將依上課未逾總時數1/3,退還所繳上課費用之50%,上課逾總時數1/3,恕不退費。
  3. 若原報名者因故不克參加,但欲更換他人參加,敬請於開課前三日通知。
  4. 配合講師時間或臨時突發事件,主辦單位有調整日期或更換講師之權利。
  5. 報名時請註明欲開立發票完整抬頭,以利開立收據;未註明者,一律開立個人抬頭,恕不接受更換發票之要求
  6. 為尊重講師之智慧財產權,課程進行中請勿錄音及錄影。