今年推出一系列AI主題的數位課程,內容包括「模型建立 → 模型部署 → 模型微調 → 多模態應用」,有助學員輕鬆掌握AI學習路徑,在短時間內瞭解AI模型部署之流程,逐步熟悉讓大型語言模型「跑得更快、更省資源」的關鍵心法!

【rocBLAS核心架構與其Transformer加速潛力】
生成式AI與大型語言模型快速發展,矩陣運算效能已成為影響模型訓練與推論速度的關鍵因素。本課程將從AI運算底層的BLAS與GEMM概念切入,解析Transformer模型中QKV、Attention及FFN等主要運算熱點,並介紹AMD ROCm軟體生態系中rocBLAS的角色與技術架構。其中透過API、Tensile及hipBLASLt等核心元件說明,帶領學員瞭解rocBLAS如何發揮GPU運算效能,以及其在Transformer模型加速上的優勢與限制,協助學員建立AI底層運算與效能優化基礎。