深度增強式學習 (Deep Reinforcement Learning) 為人工智慧領域中,一個重要的範疇,主要目的為探討如何藉由深度神經網路的幫助,訓練代理人 (Agents) 與環境 (Environment) 的互動,在其中進行控制決策,以期待盡可能地獲取最佳結果。深度增強式學習已經被應用於多個重要的研究領域,例如AlphaGo、遊戲AI、自動控制、自主機器人、自動駕駛車等。
本課程將從基本的增強式學習 (Reinforcement Learning) 開始,帶領學員們理解價值函數 (Value Function)、行為策略 (Behavior Policy)、以及一些深度增強式學習相關的重要概念,和深度增強式學習代理人之訓練方法,並介紹深度增強式學習在智慧機器人控制上的應用分析。本課程也會介紹一些經典的深度增強式學習演算法,例如DQN、DDPG、A3C、PPO、TRPO、SAC等。結合深度學習和強化學習的前沿領域課程,將引領學生進入深度增強學習的世界,探索如何讓機器能夠自主學習並進一步提升性能。
1.帶領學員理解深度增強式學習的基本概念。
2.學習在深度增強式學習中,重要且經典的幾種演算法
3.了解深度增強式學習在智慧機器人的應用模式。
1.由淺入深,從基本的增強式學習,帶領學員理解深度增強式學習的基本概念。
2.除理論基礎外,也包含實際應用至智慧機器人的案例說明。
1.智慧機器人、自動駕駛…等系統開發員。
2.自動化和控制系統工程師,想了解如何應用深度增強式學習於自動化系統控制
3.希望了解深度增強式學習架構的人士。
4.對人工智慧的應用有興趣的人士。
5.對資訊科技有興趣的人士。
6.對機器學習、深度學習感興趣的人士。
時間
課程大綱
內容
9:00
~
10:00
深度增強學習基礎
1.馬可夫決策Markov Decision Process (MDP)過程的基本概念。
2.增強式學習的基本架構與問題假設。
3.簡介何謂Reward、Environment、Value、Policy等概念。
11:00
價值函數
1.說明價值State Value Function與State-Action Value Function之差異。
2.價值函數之逼近方法Value Function Approximation。
12:00
強化學習算法
1.動態規劃與策略學習。
2.價值迭代:策略 (Policy) 如何經由迭代 (Iteration) 的方式改善,以及如何從價值函數中推導而得。
3.理解了價值函數與策略的學習。
4.如何將策略 (Actor) 與價值 (Critic) 函數一同學習的方式,稱之為Actor-Critic。
13:00
午休
14:00
探索與利用
1.探索技術 (Exploration Technique)
2.探索技術、價值函數與策略之學習。
15:00
深度增強式學習
演算法
1.重要且經典的深度增強式學習演算法,例如DQN、DDPG、A3C、PPO、TRPO、SAC等演算法簡介。
2.本課程將對這些演算法逐一概述,並說明其優缺點與特性等。
16:00
深度增強式學習於
機器人的應用
1.如何將深度增強式學習技術,應用於智慧型機器人上,與智慧型機器人之視覺模組相結合。
2.智慧型機器人之概要,以及其上搭載之相關深度學習技術。
★主辦單位及講師保留調整課程內容之權利
李老師
【學歷】
美國普林斯頓大學電機工程博士
國立台灣大學電子工程學研究所碩士
國立台灣大學電機工程學系學士
【專業領域】
智慧型機器人
電腦視覺
平行程式與系統設計、多核心處理器系統設計
舉辦地點/方式: 本課程將以實體課為主,後續將視中央疫情規定,配合動態調整授課方式,或改為線上直播方式辦理。 若為實體課,將於新竹訓練中心舉辦。 若為線上直播,將採用Cisco Webex,確定開課前一周用Email寄送上課通知、講義、Webex Meetings連結網址及Webex與會者操作手冊,屆時請詳閱。依上課通知,於課程前30分鐘,與學員進行連線測試,確認: 署名,操作,及喇叭、麥克風、視訊等裝置設定。
實際上課地點/方式,請依上課通知為準!
舉辦日期:2023/09/08 (五), 09:00~16:00, 報到時間: 08:30~09:00
報名截止日期:09/01
課程費用:含稅、講義 (報名完成後不用先繳費,可先取得早鳥優惠資格,等開課前1~2週確定開課前才會寄發繳費通知。)
方案
價格
一般報名
6,000元/人
早鳥優惠價(需在開課前三週報名)
5,400元/人
3人以上團報優惠價
5,100元/人
1.為確保您的上課權益,報名後若未收到任何回覆,敬請來電洽詢。
2.若原報名者因故不克參加,但欲更換他人參加,敬請於開課前二日通知。
3.出席率達80%以上,將可取得產業學院之培訓證書。
4.尊重老師之智慧財產權,授課時請勿錄影錄音。
5.視疫情狀況,本課程保留實體授課或線上授課之權利。