OpenAI在2022年推出ChatGPT,讓AI變成平易近人的智慧工具,也讓「生成式AI」成為目前最受到矚目的AI技術。ChatGPT是以生成型預訓練變換模型(GPT)為基礎,在GPT-3.5之上使用基於人類回饋的監督式學習與強化學習來進行微調。這兩種方法都是用人類給的回饋來當作訓練教練,進而提高訓練模型效能,並以人類干預增強機器學習的效果,產出讓人類滿意的回答與結果。
在GPT的訓練過程中,強化學習扮演相當重要的角色,透過增強式的學習將協助引導大型語言模型快速朝「對」的方向收斂,因此想踏入生成式AI領域,就必須學好深度強化學習(DRL)這項關鍵技術。
本課程將帶領學員熟悉深度學習(Deep Learning)與強化學習(Reinforcement Learning),並進一步瞭解將兩者結合的深度強化學習(Deep Reinforcement Learning,DRL)理論與應用場景(目前深度強化學習的實務應用範疇相當多元,舉凡是自駕車、聊天機器人、機台調整参數、機器手臂、無人機、下棋遊戲等都能透過相關演算法來達成),課程中更搭配實作與案例分享,有助業界將人工智慧技術導入真實工作情境,善用AI來幫助決策並提高工作效能。
1.能讓學員瞭解深度學習、強化學習經典理論與眾多模型,接著能選擇適當的訓練模型作為工具,達到解決問題之最大效益。
2.能指導學員使用Python和Keras來實作演練,進而能分析並應用深度強化學習的方法到不同領域當中。
課程日期 |
課程大綱 |
第一天課程 (7/29) |
1.機器學習到深度學習概論 2.多層感知器 3.卷積神經網路家族系列介紹與實作 4.遞迴神經網路系列介紹與實作 5.案例探討 |
第二天課程 (7/31) |
1.強化學習模型基礎 -馬可夫決策過程 -蒙地卡羅法 -時間差分法 2.Value-based Methods (DQN, Double-DQN) 3.Policy-based Methods (Policy Gradient, A3C, DDPG) 4.案例探討 |
工研院特聘專業講師-洪老師
【學歷】國立交通大學資訊工程所博士
【專長】資料探勘、人工智慧、城市計算(Urban Computing)、智慧運輸系統(Intelligent Traffic Systems)等
上課時間:113/7/29(一)、7/31(三),09:30-16:30,共2天12小時。
上課地點:工研院中興院區21館/新竹縣竹東鎮中興路四段195號(實際教室以上課通知為主)
報名方式:
◎線上報名:請學員前往工研院「產業學習網」報名課程
◎信箱報名:將報名資訊填完並寄至VHsieh@itri.org.tw 謝小姐
◎課程諮詢:有任何課程或報名上的問題,請洽服務專線03-5913417 謝小姐
【實體課程】
★為確保上課權益,報名後或開課前未收到任何通知信件,請學員務必來電詢問是否完成報名。我們通常於開課前幾天發送上課通知,敬請學員留意信件。
★因課前教材、講義製作及餐點等皆需提前準備,若您不克前來,請於開課前三日告知,以利行政作業進行並共同愛護資源。
★若原報名者因故不克參加,但欲更換他人參加,敬請於開課前二日通知。
★學員於開訓前退訓者,將依其申請退還所繳上課費用90%(上課當天臨時取消則不退費),若於培訓期間若因個人因素無法繼續參與課程,將依上課未逾總時數1/3,退還所繳上課費用之50%,上課逾總時數1/3,則不退費。