隨著巨量時代的到來,資料分析與探勘成為科技顯學,各行各業對於大數據的濃厚興趣也直接反映在大數據人才的豐厚薪資中。「資料分析師」指的是不同行業中,專門從事行業內數據蒐集、整理、分析,並依據這些數據做出研究、評估的專業人員。本課程選擇以Python程式語言教學,帶領您從零基礎開始,一步步進入資料分析的專業領域。
工業局補助課程
經濟部工業局『推動機電產業智慧製造計畫』
– 主辦單位:經濟部工業局 / 執行單位:工業技術研究院
– 工業局補助計畫課程費用50% /「特定對象」及「中堅企業」:補助65%
培訓證書發放準則
- 參加本課程之學員,研習期滿,出席率超過80%(含)以上,且參加實作演練或考試成績合格者,即可獲得工研院頒發的培訓證書。
- 測驗平均總成績在60分(含)以上為合格。
課程對象
大專畢業,對從事巨量資料分析與程式開發工作有興趣者。
講師簡介
- 【單元一講師】鄭老師,僑光科技大學電腦輔助工業設計系講師,清華大學工業工程與工程管理系博士/專長: Python, 機器人學、深度學習、計算科學、自動駕駛輔助系統。
- 【單元二講師】張老師,清華大學資訊工程研究所畢,主要研究領域為巨量資料之實務應用,曾經擔任資料科學年會/行動科技年會講者。擅長資料科學與網站開發技術,熟悉的語言是 Python 跟 JavaScript。是資料科學的信仰者,試圖用資料科學的方法導入到不同領域解決問題。喜歡與不同背景的人進行交流,分享資訊思維與跨領域的整合經驗。
- 【單元三講師】陳老師,交通大學統計研究所博士畢業,主要研究領域為透過統計分析與機器學習演算法等技術實作解決實務問題,目前在童綜合醫院擔任AI數據科學家的角色,同時,也為AI Tech社群社長,善於觀察,透過數據、行為與現象發現事物的變化,運用心理學、行為科學與資料科學演算法探究內部的本質與原因。
- 【單元四講師】阮老師,台灣科技大學電子所通訊組碩士畢業,企業顧問。主要研究領域為通訊系統、深度學習、機器學習與專案管理。擅長資料科學與人工智慧模型,熟悉的語言是 Python 。是人工智慧深度學習的信仰者,試圖用深度學習的模型導入到不同領域解決問題。喜歡與不同背景的人進行交流,分享資訊思維與跨領域的整合經驗。
開課資訊:上課時間:112/3/4-4/16,共10天64小時。
上課方式:線上直播本課程使用Microsoft Teams系統 請學員先安裝此會議軟體(並註冊報名時填寫的MAIL為帳號)https://www.microsoft.com/zh-tw/microsoft-teams/ group-chat-software
【自備設備】具有耳麥、筆電或桌上型電腦、穩定的網路環境(建議使用有線網路)並於課前統一軟體測試後,寄出紙本講義 請務必上線進行連線測試,以利課程進行
課程洽詢:有任何課程或報名上的問題,請洽:04-25678652 林智君小姐
單元一: Python程式設計入門
Python程式語言比C或Java語言更容易學習,語法簡易功能強大,有高效的內建資料結構及優雅的語法,其優質的設計架構及豐富的程式套件更讓Python在許多領域廣泛應用。此外,Python也可在Linux, MAC, Windows, Android, 與iOS等平台上執行。
Python在網路爬蟲、數據處理、與雲端基礎設施等領域都有大量運用,是您學習數據資料分析不可或缺的工具。
課程目標
1. 快速瞭解Python基礎知識與技術
2. 深入淺出學會流程控制與邏輯判斷
3. 高階資料結構的運用
4. 物件導向基礎能力養成
5. 完整程式碼範例強化實作能力
課程大綱&日期:112/3/4、3/5(六日) 9:00~17:00,共計14小時
主題 |
內容 |
Python簡介 |
程式語言發展、編譯器與直譯器、Python 語言特性與禪思、Python 的應用、設定開發環境、安裝套件、整合式開發環境、程式基本要素、陳述與表示式、輸出指令與註解 |
資料與模組 |
資料值與資料型態、字串、資料型態轉換、變數、運算子與運算元、Python模組 |
資料結構 |
Python型態、字串與字串方法、串列與串列方法、字組、字典 |
決策迴圈與函式 |
半導體產業就業輔導 |
物件與類別 |
物件簡介、類別、物件的產生、程序式與物件導向式設計的比較、物件導向程式設計範例 |
單元二: Python網路爬蟲實作技術
處理大數據的目標使效率越來越高,成本不斷減少,從而造就了基於大數據的商業智能。而網際網路大量的資料等待著挖掘與分析,如何取得正確與精準的資料,網路爬蟲技術是一項非常實用的技能。這堂課深入淺出地教您如何打造自己的網頁爬蟲,透過實際的範例練習,讓您了解基礎的網頁爬蟲實戰技術。
課程大綱&日期:3/11-3/12 (六日) 9:00~17:00,共計14小時
主題 |
內容 |
資料來源與取得 |
* 介紹公開的資料來源與如何使用 Python 存取資料 * 所需套件與環境準備 * API 資料來源與 Request 串接存取 |
認識 HTTP 網站架構與資料溝通方式 |
* 介紹目前網站前後端架構 * 網頁結構的解析與拆解 |
資料爬蟲靜態網頁篇 |
* 使用 Request 與 Beatifulsoup 套件進行靜態網頁的爬蟲教學 * 運用正規表示式有效率的整理資料 |
靜態網頁爬蟲實戰 |
*實機操作 |
資料爬蟲動態網頁篇 |
使用 Selenium 與 PhantomJS 套件進行動態網頁的爬蟲教學 |
靜態網頁爬蟲實戰 |
*實機操作 |
實務上的爬蟲應用 |
* 爬蟲被擋了怎麼辦?淺談常見防爬蟲機制與處理策略 * 如何建構一個可以自動持續更新的爬蟲程式 |
有了資料之後,然後呢? |
* 資料儲存與管理(CSV、EXCEL、SQL) * 介紹 Python 的資料科學生態系* 初探視覺化與資料探索 |
※主辦單位保留課程調整及講師更動之權利
單元三: Python資料分析及工具運用
隨著電腦運算效率提升與大數據資料取得便利,讓資料分析的應用範圍擴及各個產業,也大大提高資料處理的效益。本課程選擇的程式語言是Python,理論搭配實作教學,讓您能夠理解數據分析的基本概念與技巧,將所學運用在您的專業領域。
課程大綱&日期:3/18-3/18 、4/8-4/9 (六日) 9:30~16:30,共計24小時
以python 功能與語法,學資料科學
主題 |
內容 |
資料科學及python 工具 |
資料科學簡介 資料科學的價值及案例分析 |
運用Pandas進行資料前處理 |
1.基本資料結構 2.資料匯入與匯出:Excel、CSV、JSON 3.遺失值處理語法與運用 4.資料合併、JOIN 語法與運用 5.自由取想要的資料 語法與運用 6.分組計算 語法與運用 7.數值運算 語法與運用 |
運用 Matplotlib 與 Seaborn 進行資料視覺化 |
1.matplotlib 的架構簡介 2.seaborn 的視覺化特性與分類 語法與運用 3.圖解資料,運用語法劃出以下圖形 * 折線圖(Line plot)* 散佈圖(Scatter plot) * 直方圖(Histogram)* 長條圖(Bar plot)等。 4.剖析視覺化的目標與圖形蘊含意義,讓你可以根據你的目的,挑選出合適的圖形,進行視覺化呈現。 |
資料科學實戰綜合應用
主題 |
內容 |
探索性資料分析的-異常值偵測 |
拆解與實現業界執行資料科學模型建置前的重要準備工作。 *探索性資料分析的定義 *異常值偵測 |
探索性資料分析的-補值策略分析 |
常見的遺失值與異常值的進階補值策略,包含 k nearest neighbor(KNN)等方法。 |
探索性資料分析的-變數間的相關性 |
運用統計方法的指標,挖掘連續型與連續型資料間的關係,連續型與離散型資料間的關係,以及離散型與離散型資料的關係。 |
探索性資料分析的-特徵工程 |
1.從資料中產生特徵 *好特徵的特性剖析*常見的產生的特徵的方法 2.特徵選取*如何從眾多特徵中,篩選出好的特徵,課程中會介紹過濾法與包裝法等方法。 3.特徵降維*何時需要特徵降維?課程中會介紹常見的特徵降維的方法,包含 Principal Component Analysis(PCA)等。 |
專題實作 |
真實的資料集出發,綜合運用探索性資料分析的技巧,發現躲藏在資料下的特徵與目標結果的相關性,在課堂上進行你的第一場 kaggle 比賽吧!! |
※主辦單位保留課程調整及講師更動之權利
單元四: 機器學習與深度學習模型應用
AI已經進入到不同產業,不論在電子、金融、資訊、醫療、零售、通訊、交通、物流等領域,您都可能透過機器學習(Machine Learning)解決過去難以解決的問題。機器學習與深度學習是人工智慧的分支,是一門很深的學問,本課程從基礎切入,由淺入深,包含理論及實作技術,讓學習者了解何時可以使用機器學習與深度學習、為何機器可以學習、機器如何學習、如何讓機器學得更好,幫助您掌握機器學習最核心的觀念與技術本質。
課程大綱&日期:4/15-4/16 (六日) 9:30~16:30,共計12小時
主題 |
內容 |
認識人工智慧與機器學習 |
1. 人工智慧可以做什麼:為什麼需要人工智慧、為什麼需要機器學習。 2. 機器學習/深度學習的運作原理與實踐框架 3. 初探梯度下降法 4. 人工智慧、機器學習與深度學習相對應關係 |
深度學習: 深層深經網路Deep Neural Networks |
1. 初探深度學習: a.深度學習模型元件介紹 b.深度學習專案流程全貌。 C.專案資料的數字化:照片資料介紹 2. 深入探討深度學習模型 a.深度學習模型層次作用 b.神經元、神經元層的運作:正向傳遞 c.白話深度學習反向傳遞 3. 程式範例:用Keras 實踐深度學習 4. 補充內容: a.反向傳遞數學推導 b.基本損失函式介紹:MAE、MSE 與交叉熵 c.參數量計算 |
深度學習:卷積神經網路CNN入門 |
1. 初探卷積網路 a.卷機網路架構 b.圖像特性與為什麼採用新元件(filter and pooling) 研究 2. 內積與卷積運作介紹 3. 卷積網路運作動作拆解 4. 程式與參數量計算 |
深度學習網路實作優化 |
1.訓練過程優化與測試過程優化簡介 2.無法找到適當函式的討論:強化網路、適當優化器與適當的激活器(activation function) 3.Overfitting 討論 4.pre-train model 與 data augmentation
|
其他深度學習技術簡介 |
1. 再探CNN: a.CNN 與 DNN 的關係(視時間情況進行) b.GAN 與其他應用 2. RNN、attention 與 NLP Pre-train model 3. 強化學習 (視時間情況進行) 4. 網路攻擊 (視時間情況進行) |
機器學習與 sklearn |
1. 機器學習與深度學習 2. sklearn 套件與可用模型介紹 3. 程式範例。 |
※主辦單位保留課程調整及講師更動之權利 |
|
課程費用:(限本國籍)
身份別(本國籍)
|
費用
|
說明
|
一般身分補助20%
|
每人32,000元
|
原價NT$ 40,000,政府補助 NT$8,000,學員自付 NT$32,000
|
同公司10人以上團報
|
每人30,800元
|
原價NT$ 40,000,政府補助 NT$9,200,學員自付 NT$30,800
|
◎本課程經政府補助,上課學員皆需依規定填寫相關資料,且學員出席時數需達報名課程時數八成以上,方可適用補助辦法,若未符合規定者,則需將其政府補助費用繳回。
--------------------------------------------
★因應性別主流化國際趨勢,打造友善職場之發展,歡迎女性學員踴躍報名
單元 |
課程名稱 |
課程時間 |
時數 |
全系列 |
Python AI人工智慧資料分析師 |
112/3/4-4/16 |
64 |
單元一 |
Python程式設計入門 |
3/4-3/5 |
14 |
單元二 |
網路爬蟲實作技術 |
3/11-3/12 |
14 |
單元三 |
Python資料分析及工具運用 |
3/18-19.4/8-9 |
24 |
單元四 |
機器學習與深度學習模型應用 |
4/15-4/16 |
12 |
貼心提醒:
◆以下注意事項─敬請您的協助,謝謝!
1、為確保學員的上課權益,報名後若未收到任何回覆,敬請主動詢問是否完成報名。
2、為尊重講師之智慧財產權,請勿錄影、錄音,恕無法提供課程講義電子檔。
3、請註明服務機關之完整抬頭,以利開立收據;未註明者,一律開立個人抬頭,恕不接受更換發票之要求。
4、若報名者不克參加者,可指派其他人參加,並於開課前三日通知。
5、退費辦法:學員於開訓前退訓者,將依其申請退還所繳上課費用90%,另於培訓期間若因個人因素無法繼續參與課程,將依上課未逾總時數1/3,退還所繳上課費用之50%,上課逾總時數1/3,則不退費。
6、若因臨時突發事件或不可抗力之因素,主辦單位保有調整日期或更換講師之權利。
7、結訓學員應配合培訓後電訪調查。