課程介紹
在大數據的時代,巨量的資料往往蘊藏了許多有用的價值。然而,如何有效地蒐集網路上不同的數據並加以分析,是資訊時代裡每個人不可或缺的基本能力,也是進入許多企業之基本門檻。
本課程會先介紹HTML基本的原理並使用Python爬取許多網頁上之數據,再利用一連串分析工具過濾出有用的資訊,藉由一連串理論的介紹及實際的操作,最後會帶學生動手打造一個自動擷取數據之平台。
課程目標
- 了解爬蟲的基本原理
- 了解瀏覽器的運作原理
- 熟悉網路爬蟲分析的流程
- 學會爬取網路上有用的資訊
課程對象
- 對大數據、資料分析工作有需求/興趣者
- 使用Python軟體進行資料蒐集、過濾、分析等工作者
- 企業資訊人員、企劃/行銷分析人員等
講師簡介
李老師 業界資深AI講師
- 現職:核果智能(股)公司 執行長
- 畢業於台灣大學電子工程所
- 專長在於人工智慧、資料分析、影像辨識、金融數據等議題,是台積電、中華電信、富邦銀行、新思科技等上市櫃公司企業內訓指定AI講師。
課程大綱
一、Python語法複習與Pandas模組介紹
二、網頁基礎原理
三、Python網路爬蟲
- GET/POST介紹
- Beautifulsoup解析HTML
- Regular expression解析HTML
四、爬蟲實務上遇到的問題
- 表格式資料爬取
- 大量爬取網頁
- 驗證碼處理
- 定時爬取網路資訊
五、資料儲存與分析
先備知識
- Python基礎語法
- 學員須自備筆電,電腦為64位元,建議記憶體至少8G,作業系統Windows, Mac, Linux皆可。
課程費用
本課程原價10,000元整,費用含課程講義、稅。
- 早鳥優惠(課程7日前報名):每人7,800元
- 工研人優惠:每人7,800元
- 團報優惠(同公司2人以上團報):每人7,500元
報名資訊
一、主辦單位:財團法人工業技術研究院 產業學院
二、舉辦地點:WEBEX MEETING 線上同步直播學習
三、舉辦日期:111 年8 月17 日(三) ~ 8 月18 日(四) 09:30-16:30,兩天共12 小時。
四、培訓證書:完成課程學習後頒發工研院電子培訓證書。
五、報名方式:工研院學習服務網,線上報名:http://college.itri.org.tw/
六、課程洽詢:03-5732932 吳小姐,itri535934@itri.org.tw 或 03-5732034 黃小姐,itri535579@itri.org.tw
七、注意事項:
- 為確保您的上課權益,報名後若未收到任何回覆,敬請來電洽詢方完成報名。
- 因課前教材、講義及餐點之準備及需為您進行退款相關事宜,若您不克前來,請於開課前3日以E-mail或電話通知主辦單位聯絡人確認申請退費事宜。學員於開訓前退訓者,將依其申請退還所繳上課費用90%,另於培訓期間若因個人因素無法繼續參與課程,將依上課未逾總時數1/3,退還所繳上課費用之50%,上課逾總時數1/3,恕不退費。若原報名者因故不克參加,但欲更換他人參加,敬請於開課前三日通知。
- 若原報名者因故不克參加,欲更換他人參加,敬請於開課前三日通知!
★本課程歡迎企業包班★