【巨量資料分析工具應用- PySpark實作】一起用 Python 和 Spark 分析大數據

上課地址:中興院區21館109教室

時數:6

起迄日期:2019-07-25~2019-07-25

聯絡資訊:高婉菱/03-5918313

報名截止日:2019-07-23

課程類別:人才培訓(課程)

研討會編號:2319030072

課程簡介

人工智慧襲捲全球,背後皆仰賴巨量資料的支援,如何有效處理這些資料,Hadoop是目前被運用最多的巨量資料分析工具。本課程介紹巨量資料的特性及相關應用,並透過PySpark實作方式演練巨量資料分析工具,了解如何在Python中使用Spark,以學習如何轉換巨量資料至具有競爭價值之知識及決策。課程中以商業活動相關的資料介紹實務上的案例。

課程大綱

日期

時間

課程大綱

7/25(三)

9:30-16:30

1.   巨量資料分析簡介

2.   Analytics 概念及案例

3.   Hadoop Ecosystem Spark介紹

4.    Hadoop應用案例分享

5.    用Python和Spark分析大數據 ─ PySpark數據分析實作

-PySpark Data Preparation

-PySpark Clustering

-PySpark Association Rule

-PySpark Classification

課程對象

1.企業資料分析人員

2.系統網路人員

3.已負責相關業務,欲針對大數據分析與應用更了解者

學員先備知識

具備程式背景,熟悉Python程式語言

課程注意事項

課程中講師將帶領學員實際演練,為提升學員效益,學員於課程當天請攜帶NB,與講師同步操作學習。

講師簡介

楊朝龍

【現職】
國立台灣科技大學工業管理系 副教授
【學歷
-美國普渡大學工業工程博士 (副修應用統計)
-美國普渡大學工業工程碩士
-中華民國國立台灣科技大學自動化碩士
-中華民國國立台灣科技大學機械工程學士
【經歷
-長庚大學工商管理學系助理教授
-美商開拓重工Caterpillar資料分析師 (Peoria, IL USA)
-美商印第安那研究所資深工程師 (Columbus, IN USA)
-美國普渡大學工業工程系研究助理(supported by Hewlett Packard)
-美商惠普公司Hewlett Packard Intern研究員 (Boise, ID USA)
【專長領域】
-資料探勘
-巨量資料分析 
-機器學習
-多變量分析
-產品設計品質改善

開課資訊

●主辦單位:工研院 產業學院
舉辦地點: 工研院竹東中興院區21館 (新竹縣竹東鎮中興路4段195號)
舉辦日期:20197月 25 日 (三) 9:30-16:30,共 6 小時
課程費用:4,000元
報名期:即起至 7 月 23 日止
報名方式:採線上報名,請至產業學院網站
課程洽詢:(03)591-8313 高小姐
繳費方式:可使用ATM轉帳或信用卡等方式付款
●注意事項: 
1.因課前教材、講義及餐點之準備及需為您進行退款相關事宜,若您不克前來,請於開課三日前告知,以利行政進行。
2.若原報名者因故不克參加,但欲更換他人參加,敬請於開課前二日來電通知。

Pin It