課程代號:2321070007  

Python影像處理、電腦視覺與機器學習實作

1.熟悉Python此程式語言。 2.協助具影像處理專長之學員切入電腦視覺領域 3.未來可銜接各類程式設計/機器學習/深度學習課程

課程型態/
數位課程
上課地址/
純線上授課 (使用Cisco Webex),將於課前提供會議室連結
時  數/
12 小時
起迄日期/
2022/11/04 ~ 2022/11/18
聯絡資訊/
陳品諠   (02) 2370-1111#303
活動取消
課程介紹

  本課程將帶領學員學習Python基本語法並運用OpenCV此函式庫於Colab此雲端平台上開發程式。
  本課程在影像處理部份將介紹影像增強、影像幾何轉換。電腦視覺部份包括了SIFT特徵偵測,以及如何運用SIFT特徵以及RANSAC實現全景圖及物體偵測,機器學習部份主要會介紹HOG特徵與支持向量機(Support Vector Machine, SVM),以及基於HOG+SVM的人臉分類以及偵測。超參數最佳化一直是機器學習以及深度學習中相當重要的一個議題,本次課程我們還會介紹如何使用Optuna這個函式庫來找出最佳的超參數,以進一步提升人臉分類的效果。課程中每一主題都會提供範例程式供學員參考,以提升學習效果,期待學員可藉由此課程初步瞭解影像處理、電腦視覺以及機器學習,尤其是使用Python此程式語言開發相關應用,期待未來順利進入相關產業發展。
  本課程所有的程式都將在Colab此雲端平台上開發,實作範例包含資料以及程式碼都會提供,本次課程的內容包括了:
  1. 影像處理,電腦視覺與機器學習簡介
  2. 影像感測器以及各種影像缺陷簡介
  3. 影像標記、各類電腦視覺任務之量化指標及其實作
  4. 影像增強(空間域與頻域)
  5. 形態學及其於影像處理之應用
  6. 影像幾何轉換
  7. 基於影像特徵偵測之全景圖實現與物體偵測
  8. 基於HOG與SVM之人臉分類以及人臉偵測
  9. 基於Optuna之超參數最佳化


課程目標

  1. 熟悉Python此程式語言
  2. 協助具影像處理專長之學員切入電腦視覺領域
  3. 未來可銜接各類程式設計/機器學習/深度學習課程


課程大綱

  1. 影像處理、電腦視覺與機器學習簡介
  2. 影像感測器以及各種影像缺陷簡介
  3. 影像標記、各類電腦視覺任務之量化指標及其實作
  4. 影像增強(空間域與頻域)
  5. 形態學及其於影像處理之應用
  6. 影像幾何轉換
  7. 基於影像特徵偵測之全景圖實現與物體偵測
  8. 基於HOG與SVM之人臉分類以及人臉偵測
  9. 基於Optuna之超參數最佳化


訓練對象

  1. 具備程式設計能力,未來想投入機器學習、電腦視覺或資料科學領域的工程師
  2. 想應用電腦視覺、機器學習相關技術至物聯網、駕駛輔助系統之程式設計師


講師簡介

林哲聰  老師

  • 學歷:台灣大學應用力學研究所碩士/清華大學資訊工程研究所博士
  • 現職:Chalmers University of Technology 博士後研究員
  • 經歷:工研院機械所副研究員/研究員/資深研究員
   加州大學聖塔芭芭拉分校資工系訪問研究員
   上奇資訊-計算機概論 共同譯者
   2010 伽利略創新大賽 台灣區季軍
   2011 伽利略創新大賽 特別獎(GNSS Living Lab)得主
   2013 伽利略創新大賽 瑞士區冠軍
   2016 日本立命館大學英文演講比賽 清華大學代表
   2017 CVGIP 行人偵測競賽 亞軍
   2017 MOST 生成式對抗網路競賽 佳作
   2018第八屆兩岸清華研究生學術論壇 清華大學代表
   2019 IEEE ICIP Three Minute Thesis Competition (3MT®): Finalist
   2020 AI智慧應用新世代人才培育計畫-人才解題實證(倒車攝影機影像識別-障礙物與逼近偵測):佳作
   2020 中華民國影像處理與圖形識別學會第十三屆博碩士論文獎博士論文佳作
   2020 中華民國資訊學會碩博士最佳論文獎-博士論文佳作
  • 專長
  Computer Vision, Image Processing, Pattern Recognition, Machine Learning, Deep Learning,   GPS, Embedded System, iPhone Programming
  已於車用影像安全警示系統領域中發表過二十五篇國際論文,十五篇國內論文,以及十三篇專利。

開課資訊

  • 主辦單位:工研院產業學院 台北學習中心
  • 上課時間:111/11/04、11/11、11/18 (每週五) ,13:00~17:00(12小時)
  • 上課地點:線上直播會議室(使用Cisco Webex Meeting,將於課前提供會議室連結)
  • 報名方式:
  1.線上報名:點選課程頁面上方的「線上報名」
  2.傳真報名:填妥報名表傳真至02-23811000
  3.email報名:填妥報名表email至 itri535842@itri.org.tw
  • 繳費方式:報名時可選擇信用卡線上繳費或匯款,主辦單位將於確認開班後通知您相關匯款資訊


課程費用

  1. 原價:$ 9,000 元/人
  2. 開課10天前或同一公司二人(含)以上報名:$ 8,200 元/人。 
(以上費用已包含講義及教材費)


注意事項

  1. 本線上直播課程無補課機制。
  2. 為確保您的上課權益,報名後若未收到任何回覆,敬請來電洽詢方完成報名。
  3. 為配合講師時間或臨時突發事件,主辦單位有調整日期或更換講師之權利。
  4. 報名時請註明欲開立發票完整抬頭,以利開立收據;未註明者,一律開立個人抬頭,恕不接受更換發票之要求,課程開始當天不得以任何因素要求退費。
  5. 為尊重講師之智慧財產權,恕無法提供課程講義電子檔。
  6. 因課前教材、講義及餐點之準備及需為您進行退款相關事宜,若您不克前來, 請於開課三個工作日前告知或更換他人參加,以利行政作業進行並共同愛護資源。


相關課程連結

【線上直播】Python機器學習模型實作
【課程大綱】

  1. 機器學習簡介
  2. 迴歸分析簡介與實作: 線性迴歸、嶺迴歸、套索迴歸、彈性網路
  3. 分群法簡介與實作:  K-平均演算法、均值漂移演算法、最大似然估測、最大後驗估測、最大期望演算法
  4. 基於資訊的分類方法簡介與實作: 決策樹與隨機森林
  5. 基於誤差的分類方法簡介與實作:  K-近鄰演算法、支持向量機、人臉分類實作(使用HOG特徵+SVM)
  6. 資料降維簡介與實作: 運用主成份分析進行資料降維,並運用邏輯迴歸進行(MNIST)手寫數字辨識。

=================================================================
【線上直播】PyTorch
深度學習模型實作
【課程大綱】

  1. 深度學習(Deep Learning)簡介
  2. 卷積神經網路之訓練細節簡介
  3. 知名卷積神經網路(CNN)簡介
  4. 基礎神經網路實作:比較神經網路倒傳遞以Python實作與運用PyTorch自動微分間的差異
  5. 運用遷移學習之圖片分類模型實作: 運用Alexnet, ResNet進行人臉分類 (使用CelebA dataset)
  6. 物體偵測模型簡介與實作:實作YOLOv1以實現通用物體偵測(使用Pascal VOC dataset)
  7. 語義影像分割模型簡介與實作:運用FCN實現行車場景之影像分割(使用CamVid dataset)
  8. 生成式對抗網路簡介與實作:運用DCGAN實現人臉影像生成(使用CelebA dataset)並使用生成影像提高訓練資料量以提升人臉分類之辨識率。