隨著巨量時代的到來,資料分析與探勘成為科技顯學,各行各業對於大數據的濃厚興趣也直接反映在大數據人才的豐厚薪資中。「資料分析師」指的是不同行業中,專門從事行業內數據蒐集、整理、分析,並依據這些數據做出研究、評估的專業人員。本課程選擇以Python程式語言教學,帶領您從零基礎開始,一步步進入資料分析的專業領域。
培訓證書發放準則
參訓學員出席率達80% 且參與實作演練或考試成績合格者(測驗平均總成績60分以上)
工研院產業學院頒發「Python AI人工智慧資料分析師」培訓證書。
課程對象
大專畢業,對從事巨量資料分析與程式開發工作有興趣者。
講師簡介
開課資訊:
上課時間:112/7/1-8/6,共10天,共64小時。
上課方式:線上直播本課程使用Microsoft Teams系統 請學員先安裝此會議軟體(並註冊報名時填寫的MAIL為帳號)https://www.microsoft.com/zh-tw/microsoft-teams/ group-chat-software
【自備設備】具有耳麥、筆電或桌上型電腦、穩定的網路環境(建議使用有線網路)並於課前統一軟體測試後,寄出紙本講義 請務必上線進行連線測試,以利課程進行
課程洽詢:04-25678652 林智君小姐
單元一: Python程式設計入門
Python程式語言比C或Java語言更容易學習,語法簡易功能強大,有高效的內建資料結構及優雅的語法,其優質的設計架構及豐富的程式套件更讓Python在許多領域廣泛應用。此外,Python也可在Linux, MAC, Windows, Android, 與iOS等平台上執行。
Python在網路爬蟲、數據處理、與雲端基礎設施等領域都有大量運用,是您學習數據資料分析不可或缺的工具。
課程目標
1. 快速瞭解Python基礎知識與技術
2. 深入淺出學會流程控制與邏輯判斷
3. 高階資料結構的運用
4. 物件導向基礎能力養成
5. 完整程式碼範例強化實作能力
課程大綱&日期:112/7/1、7/2(六日) 9:00~17:00,共計14小時
主題 | 內容 |
---|---|
Python簡介 | 程式語言發展、編譯器與直譯器、Python 語言特性與禪思、Python 的應用、設定開發環境、安裝套件、整合式開發環境、程式基本要素、陳述與表示式、輸出指令與註解 |
資料與模組 | 資料值與資料型態、字串、資料型態轉換、變數、運算子與運算元、Python模組 |
資料結構 | Python型態、字串與字串方法、串列與串列方法、字組、字典 |
決策迴圈與函式 | 半導體產業就業輔導 |
物件與類別 | 物件簡介、類別、物件的產生、程序式與物件導向式設計的比較、物件導向程式設計範例 |
單元二: Python網路爬蟲實作技術
處理大數據的目標使效率越來越高,成本不斷減少,從而造就了基於大數據的商業智能。而網際網路大量的資料等待著挖掘與分析,如何取得正確與精準的資料,網路爬蟲技術是一項非常實用的技能。這堂課深入淺出地教您如何打造自己的網頁爬蟲,透過實際的範例練習,讓您了解基礎的網頁爬蟲實戰技術。
課程大綱&日期:7/8-7/9 (六日) 9:00~17:00,共計14小時
主題 | 內容 |
---|---|
資料來源與取得 | * 介紹公開的資料來源與如何使用 Python 存取資料 * 所需套件與環境準備 * API 資料來源與 Request 串接存取 |
認識 HTTP 網站架構與資料溝通方式 | * 介紹目前網站前後端架構 * 網頁結構的解析與拆解 |
資料爬蟲靜態網頁篇 | * 使用 Request 與 Beatifulsoup 套件進行靜態網頁的爬蟲教學 * 運用正規表示式有效率的整理資料 |
靜態網頁爬蟲實戰 | *實機操作 |
資料爬蟲動態網頁篇 | 使用 Selenium 與 PhantomJS 套件進行動態網頁的爬蟲教學 |
靜態網頁爬蟲實戰 | *實機操作 |
實務上的爬蟲應用 | * 爬蟲被擋了怎麼辦?淺談常見防爬蟲機制與處理策略 * 如何建構一個可以自動持續更新的爬蟲程式 |
有了資料之後,然後呢? | * 資料儲存與管理(CSV、EXCEL、SQL) * 介紹 Python 的資料科學生態系* 初探視覺化與資料探索 |
※主辦單位保留課程調整及講師更動之權利
單元三: Python資料分析及工具運用
隨著電腦運算效率提升與大數據資料取得便利,讓資料分析的應用範圍擴及各個產業,也大大提高資料處理的效益。本課程選擇的程式語言是Python,理論搭配實作教學,讓您能夠理解數據分析的基本概念與技巧,將所學運用在您的專業領域。
課程大綱&日期:7/15-7/16 7/29-7/30 (六日) 9:30~16:30,共計24小時
以python 功能與語法,學資料科學
主題 | 內容 |
---|---|
資料科學及python 工具 | 資料科學簡介 資料科學的價值及案例分析 |
運用Pandas進行資料前處理 | 1.基本資料結構 2.資料匯入與匯出:Excel、CSV、JSON 3.遺失值處理語法與運用 4.資料合併、JOIN 語法與運用 5.自由取想要的資料 語法與運用 6.分組計算 語法與運用 7.數值運算 語法與運用 |
運用 Matplotlib 與 Seaborn 進行資料視覺化 | 1.matplotlib 的架構簡介 2.seaborn 的視覺化特性與分類 語法與運用 3.圖解資料,運用語法劃出以下圖形 * 折線圖(Line plot)* 散佈圖(Scatter plot) * 直方圖(Histogram)* 長條圖(Bar plot)等。 4.剖析視覺化的目標與圖形蘊含意義,讓你可以根據你的目的,挑選出合適的圖形,進行視覺化呈現。 |
資料科學實戰綜合應用
主題 | 內容 |
---|---|
探索性資料分析的-異常值偵測 | 拆解與實現業界執行資料科學模型建置前的重要準備工作。 *探索性資料分析的定義 *異常值偵測 |
探索性資料分析的-補值策略分析 | 常見的遺失值與異常值的進階補值策略,包含 k nearest neighbor(KNN)等方法。 |
探索性資料分析的-變數間的相關性 | 運用統計方法的指標,挖掘連續型與連續型資料間的關係,連續型與離散型資料間的關係,以及離散型與離散型資料的關係。 |
探索性資料分析的-特徵工程 | 1.從資料中產生特徵 *好特徵的特性剖析*常見的產生的特徵的方法 2.特徵選取*如何從眾多特徵中,篩選出好的特徵,課程中會介紹過濾法與包裝法等方法。 3.特徵降維*何時需要特徵降維?課程中會介紹常見的特徵降維的方法,包含 Principal Component Analysis(PCA)等。 |
專題實作 | 真實的資料集出發,綜合運用探索性資料分析的技巧,發現躲藏在資料下的特徵與目標結果的相關性,在課堂上進行你的第一場 kaggle 比賽吧!! |
※主辦單位保留課程調整及講師更動之權利
單元四: 機器學習與深度學習模型應用
AI已經進入到不同產業,不論在電子、金融、資訊、醫療、零售、通訊、交通、物流等領域,您都可能透過機器學習(Machine Learning)解決過去難以解決的問題。機器學習與深度學習是人工智慧的分支,是一門很深的學問,本課程從基礎切入,由淺入深,包含理論及實作技術,讓學習者了解何時可以使用機器學習與深度學習、為何機器可以學習、機器如何學習、如何讓機器學得更好,幫助您掌握機器學習最核心的觀念與技術本質。
課程大綱&日期:8/5-8/6 (六日) 9:30~16:30,共計12小時
主題 | 內容 |
---|---|
Introduction to Machine Learning | 1.何謂機器學習? 2.機器學習的核心與框架 3.機器學習的種類? 監督式學習? 非監督式學習? 強化學習?... 4.為什麼要分訓練資料集與測試資料集? 5模型複雜度與資料複雜度 |
Machine Learning I: Regression & Classification | 1.機器學習實作是以Scikit Learn為主,以線性迴歸 (Linear Regression)為出發點, 帶你深入淺出迴歸模型與分類問題 (Classification) 2.Linear binary classification、羅吉斯迴歸(Logistic Regression)、 支持向量機(Support Vector Machine)、Kernel method 評估機器學習模型的學習效果 3.損失函數(Loss Function)、均方根誤差(RMSE)、 梯度下降法(Gradient Descent)、如何縮小RMSE? 模型與參數的選擇 4.判斷模型預測能力的指標 混淆矩陣、準確率 (Accuracy)、精準度(Precison)、召回率(Recall)、F-分數 (F-Score)、ROC曲線、AUC |
Machine Learning II: Model evaluation | 1.什麼是Overfitting? 2.如何避免 Overfitting? Regularization 技巧 3.如何挑選好的模型? 交叉驗證法(Cross Validation) |
Machine Learning III: Clustering | 分群 (Clustering) o K-means o K-medoids o Hierarchical clustering o DBSCAN |
Machine Learning IV: Ensemble learning | 1.Bagging 2.決策樹 (Decision tree) 3.剪枝演算法 4.隨機森林 (Random forest) |
Machine Learning V: Feature engineering & Dimensional reduction | 特徵工程的應用技術:遺失值處理、特徵縮放、轉換、建構、組合、萃取 降維演算法與應用:PCA、MDS、tSNE、應用 |
Machine Learning VI: Deep learning fundations | 1.Autoencoder 2.CNN 3.RNN |
※主辦單位保留課程調整及講師更動之權利
價格
全系列原價:40000元
優惠價36800元
單元 | 課程名稱 | 課程時間 | 時數 |
全系列 | Python AI人工智慧資料分析師 | 7/1-8/6 | 64 |
單元一 | Python程式設計入門 | 7/1-7/2 | 14 |
單元二 | 網路爬蟲實作技術 | 7/8-7/9 | 14 |
單元三 | Python資料分析及工具運用 | 7/15-7/16.7/29-30 | 24 |
單元四 | 機器學習與深度學習模型應用 | 8/5-8/6 | 12 |
貼心提醒:
為確保學員的上課權益,報名後若未收到任何回覆,敬請主動詢問是否完成報名。
若因臨時突發事件或不可抗力之因素,主辦單位保有調整日期或更換講師之權利。
我們會提前幫學員郵寄講義,若不克前來,請務必於開課前一週來電或來信取消或告知指派其他人參加,以利後續行政作業進行。
在培訓期間因個人因素無法繼續參與課程,若上課時數未超過總時數1/3,本單位將退還所繳上課費用之50%,若上課時數超過總時數1/3,恕不予退費。若原報名者因故不克參加,且欲更換他人參加,敬請於開課前三日告知。