【精選好文】資料科學入門 免費課程規劃
資料科學 - 入門課程規劃

隨著產學界人工智慧的聲浪不斷加溫,越來越多人走向資料科學領域,跨領域的應用尤其受到重視,但是學習 AI 該如何起步呢?許多電機、資工、統計背景領域的高手,直接越級打怪自學深度學習相當常見,但相信還有許多讀者雖無相關領域背景知識,因此自由小編深入鑽研由 IBM 所推出的線上免費學習網站 (Cognitive Class . ai) ,精心規劃了以下課程清單,教你如何穩扎穩打地自學資料科學!
— — — — 以下推薦課程,適合初次接觸 or 想打穩資料科學基礎的讀者,高手可跳過! — — — —
上圖相信讀者們都還有印象(沒印象 or 新讀者,請參考:https://goo.gl/D15Pxe),前往資料科學領域的路上,有許多基礎知識跨足眾多領域,資料庫、程式語言、統計學、微積分等,對於甫入門讀者而言,會需要花較多的時間去理解龐雜且廣泛多樣的應用領域,在小編學習資料科學的歷程中,也耗費大量的時間不斷地去整理所學,釐清課程內容、實務應用等,最後整理出了此篇免費課程清單;課程皆來自 IBM 的 Cognitive Class . ai ,不僅免費,課程結束、通過測驗後,還提供課程證照及專業領域獎章,以利學員們求職用,完成課程後,您將具備成為資料分析師的能力及資料科學家的基礎技能。
課程分為三部分 (1) 緒論 - 基礎認知 (2) 入門 - 分析實務 (3) 其他 - 選擇性內容。
(1) 資料科學 - 緒論 (21 hr)
◆ Class 1. (3 hr) Introduction to Data Science - 資料科學介紹
-- 簡單介紹資料科學的緣起與應用,認識「資料科學家」
◆ Class 2. (5 hr) Data Science Tools - 資料科學工具
-- 簡介 IBM 的產品(Data Scientist Workbench)及實用工具 (*Jupyter Notebook)
◆ Class 3. (5 hr) Data Science Methodology - 資料科學方法論
-- 介紹資料分析的流程、概念及思維
◆ Class 4. (3 hr) Big Data 101 - 大數據入門
-- 介紹何謂大數據?說明大數據的影響力
◆ Class 5. (5 hr) Data Privacy Fundamentals - 資料隱私權認識
-- 瞭解資料隱私權的重要性,及其相關法規
(2) 資料科學 - 入門 (Python & R 學習路徑 - 二擇一)
Python 學習路徑 (35 hr)
◆ Class 1. (5 hr) Python for Data Science - 資料科學之 Python 入門
-- Python 基本語法 & 工具操作教學 (Jupyter Notebook)
◆ Class 2. (8 hr) Data Analysis with Python - 資料分析從 Python 開始
-- Python 資料分析相關套件使用 (Pandas, Numpy, Scipy...)
◆ Class 3. (10 hr) Data Visualization with Python - Python 資料視覺化
-- Python 相關數據視覺化套件介紹(Matplotlib, Seaborn...)
◆ Class 4. (12 hr) Mahine Learning with Python - 機器學習與 Python
-- Python 機器學習實作教學 (Regression, Classification, Clustering...)
R 學習路徑 (32 hr)
◆ Class 1. (5 hr) R 101 - R 入門
-- R 基本語法 & 工具操作教學 (Jupyter Notebook)
◆ Class 2. (5 hr) Digital Analytics and Regression - 數位分析與回歸
-- R 與 資料科學家;簡單線性回歸介紹(simple linear regression)
◆ Class 3. (5 hr) Using R with Databases - R語言與資料庫
-- R 與 關聯性資料庫操作使用
◆ Class 4. (5 hr) Data Visualization with R - R 資料視覺化
-- R 相關數據視覺化套件介紹(plot, ggplo2...)
◆ Class 5. (12 hr) Mahine Learning with R - 機器學習與 R
-- 統計模型 vs. 機器學習;監督式學習 vs. 非監督式學習
上述兩堂入門實務課程 Python & R 內容的編排與課程邏輯各有差異,Python 以處理Excel數據分析為開頭,循序漸進以敘述統計、資料清理、資料視覺化帶到機器學習,為實務上完整的資料分析週期,課程結構較 R 系列課程完整;相比 Python 課程,R 語言過去專注於統計分析相關應用的開發,以處理資料庫數據為出發點,比較傳統統計模型與機器學習的差異,帶入資料視覺化、機器學習等領域。
兩種語言的課程安排,因程式語言的發展歷史而有所不同,建議有充裕學習時間的讀者,可以兩種課程都看過一次,加強對程式語言的敏感度,也能對分析的流程、機器學習的邏輯更熟悉;而時間較有限的讀者,則建議以 Python 系列課程為主,雖然 R 對於程式語言初學者較快上手,但是 Python 的開發社群、其他應用領域、語言效能,皆比 R 來的傑出。
(3) 資料科學 - 入門 (選擇性課程)
◆ Predictive Modeling Fundamentals I - 預測性模型基礎認識
◆ Data Journalism: First Steps, Skills & Tools - 資料新聞學 (步驟、技能與工具)
◆ Statistic 101 - 統計學入門
◆ Hadoop 101 - 大數據平台 Hadoop 入門
◆ SQL & Relational Databases 101 - SQL與關聯性資料庫入門
◆ Bulid your Own Chatbot - 建造自己的聊天機器人
◆ Mathematical Optimization for Business Problems - 數學最佳化應用
在第三部分的課程,則為因實作領域不同而需要額外補強的相關課程推薦。
在每一堂課程結束後,您將獲得課程認證(Certificates)如下圖一,完成系列專業課程更能獲得獎章(Badges)如下圖二,且這些學習認證皆能個別下載為 PDF 檔案,並有IBM認證標註,無論是在104求職可上傳附加檔案,也能直接將證照連結到個人Linkedin Profile,對於跨領域的學員來說,真的相當加分!

▲ 圖一

▲ 圖二
看完了自由團隊精心設計的課程清單及相關證照、獎章後,你是否也心動了呢?趕緊來學習資料科學吧!若有任何問題或其他建議,自由團隊歡迎您來信與我們進一步互動喔!(Email: AI.Free.Team@gmail.com)
留言
張貼留言