OpenAI在2022年推出ChatGPT,讓AI變成平易近人的智慧工具,也讓「生成式AI」成為目前最受到矚目的AI技術。ChatGPT是以生成型預訓練變換模型(GPT)為基礎,在GPT-3.5之上使用基於人類回饋的監督式學習與強化學習來進行微調。這兩種方法都是用人類給的回饋來當作訓練教練,進而提高訓練模型效能,並以人類干預增強機器學習的效果,產出讓人類滿意的回答與結果。
在GPT的訓練過程中,強化學習扮演相當重要的角色,透過增強式的學習將協助引導大型語言模型快速朝「對」的方向收斂,因此想踏入生成式AI領域,就必須學好深度強化學習(DRL)這項關鍵技術。
本課程將帶領學員熟悉深度學習(Deep Learning)與強化學習(Reinforcement Learning),並進一步瞭解將兩者結合的深度強化學習(Deep Reinforcement Learning,DRL)理論與應用場景(目前深度強化學習的實務應用範疇相當多元,舉凡是自駕車、聊天機器人、機台調整参數、機器手臂、無人機、下棋遊戲等都能透過相關演算法來達成),課程中更搭配實作與案例分享,有助業界將人工智慧技術導入真實工作情境,善用AI來幫助決策並提高工作效能。