跳到主要內容

2018學習清單:150個最好的機器學習,NLP和Python教程

本文英文出處:Robbie Allen
翻譯/ 吳楚
校對/ 田晉陽
在今年秋季開始準備博士項目的時候,我已經精選了一些有關機器學習和NLP的優質網絡資源。一般我會找一個有意思的教程或者視頻,再由此找到三四個,甚至更多的教程或者視頻。猛回頭,發現標收藏夾又多了20個資源待我學習(推薦提升效率工具Tab Bundler)。
爲了幫助也在經歷類似探索過程的童鞋,我把至今發現的最好的教程彙總了一個列表。當然這不是網絡上有關ML的最全集合,而且其中有一部分內容很普通。我的目標是要找到最好的有關機器學習子方向和NLP的教程。
我引用了能簡潔介紹概念的基礎內容。我已經迴避包含一些大部頭書的章節,和對理解概念沒有幫助的科研論文。那爲什麼不買一本書呢? 因爲教程能更好地幫助你學一技之長或者打開新視野。
我把這博文分成四個部分,機器學習,NLP,Python,和數學基礎。在每一小節我會隨機引入一些問題。由於這方面學習材料太豐富了,本文並未涵括所有內容。
乾貨 | 請收下這份2018學習清單:150個最好的機器學習,NLP和Python教程
機器學習
1、機器學習就是這麼好玩!(medium.com/@ageitgey)
機器學習速成課程(Berkeley的ML):
機器學習入門與應用:實例圖解(toptal.com)
機器學習的簡易指南 (monkeylearn.com)
如何選擇機器學習算法?(sas.com)
2、Activation and Loss Functions
激活函數與損失函數
sigmoid 神經元 (neuralnetworksanddeeplearning.com)
激活函數在神經網絡中有什麼作用?(quora.com)
神經網絡的激活函數大全及其優劣 (stats.stackexchange.com)
激活函數及其分類比較(medium.com)
理解對數損失 (exegetic.biz)
損失函數(Stanford CS231n)
損失函數L1 與L2 比較(rishy.github.io)
交叉熵損失函數(neuralnetworksanddeeplearning.com)
3、偏差(Bias)
神經網絡中的偏差的作用(stackoverflow.com)
神經網絡中的偏差節點(makeyourownneuralnetwork.blogspot.com)
什麼是人工神經網絡中的偏差 (quora.com)
4、感知器(Perceptron)
感知器模型(neuralnetworksanddeeplearning.com)
感知器(natureofcode.com)
一層的神經網絡(感知器模型)(dcu.ie)
從感知器模型到深度網絡(toptal.com)
5、迴歸算法
線性迴歸分析簡介(duke.edu)
線性迴歸 (ufldl.stanford.edu)
線性迴歸 (readthedocs.io)
邏輯斯特迴歸 (readthedocs.io)
機器學習之簡單線性迴歸教程(machinelearningmastery.com)
機器學習之邏輯斯特迴歸教程(machinelearningmastery.com)
softmax 迴歸(ufldl.stanford.edu)
乾貨 | 請收下這份2018學習清單:150個最好的機器學習,NLP和Python教程
6、梯度下降
基於梯度下降的學習 (neuralnetworksanddeeplearning.com)
梯度下降(iamtrask.github.io)
如何理解梯度下降算法?(kdnuggets.com)
梯度下降優化算法概覽(sebastianruder.com)
優化算法:隨機梯度下降算法 (Stanford CS231n)
7、生成學習
生成學習算法 (Stanford CS229)
貝葉斯分類算法之實例解析(monkeylearn.com)
8、支持向量機
支持向量機(SVM)入門(monkeylearn.com)
支持向量機(Stanford CS229)
線性分類:支持向量機,Softmax (Stanford 231n)
9、後向傳播算法(Backpropagation)
後向傳播算法必知(medium.com/@karpathy)
來,給我圖解一下神經網絡後向傳播算法?(github.com/rasbt)
後向傳播算法是如何運行的?(neuralnetworksanddeeplearning.com)
沿時後向傳播算法與梯度消失(wildml.com)
簡易入門沿時後向傳播算法(machinelearningmastery.com)
奔跑吧,後向傳播算法!(Stanford CS231n)
10、深度學習
果殼裏的深度學習(nikhilbuduma.com)
深度學習教程 (Quoc V. Le)
深度學習,什麼鬼?(machinelearningmastery.com)
什麼是人工智能,機器學習,深度學習之間的區別? (nvidia.com)
11、優化算法與降維算法
數據降維的七招鍊金術(knime.org)
主成分分析(Stanford CS229)
Dropout: 改進神經網絡的一個簡單方法(Hinton @ NIPS 2012)
如何溜你們家的深度神經網絡?(rishy.github.io)
乾貨 | 請收下這份2018學習清單:150個最好的機器學習,NLP和Python教程
12、長短期記憶(LSTM)
老司機帶你簡易入門長短期神經網絡(machinelearningmastery.com)
理解LSTM網絡(colah.github.io)
漫談LSTM模型(echen.me)
小學生看完這教程都可以用Python實現一個LSTM-RNN (iamtrask.github.io)
13、卷積神經網絡(CNNs)
卷積網絡入門(neuralnetworksanddeeplearning.com)
深度學習與卷積神經網絡模型(medium.com/@ageitgey)
拆解卷積網絡模型(colah.github.io)
理解卷積網絡(colah.github.io)
14、遞歸神經網絡(RNNs)
遞歸神經網絡教程 (wildml.com)
注意力模型與增強型遞歸神經網絡(distill.pub)
這麼不科學的遞歸神經網絡模型(karpathy.github.io)
深入遞歸神經網絡模型(nikhilbuduma.com)
15、強化學習
給小白看的強化學習及其實現指南 (analyticsvidhya.com)
強化學習教程(mst.edu)
強化學習,你學了麼?(wildml.com)
深度強化學習:開掛玩Pong (karpathy.github.io)
16、對抗式生成網絡模型(GANs)
什麼是對抗式生成網絡模型?(nvidia.com)
用對抗式生成網絡創造8個像素的藝術(medium.com/@ageitgey)
對抗式生成網絡入門(TensorFlow)(aylien.com)
《對抗式生成網絡》(小學一年級~上冊)(oreilly.com)
17、多任務學習
深度神經網絡中的多任務學習概述(sebastianruder.com)
NLP
乾貨 | 請收下這份2018學習清單:150個最好的機器學習,NLP和Python教程
1、NLP
《基於神經網絡模型的自然語言處理》(小學一年級~上冊)(Yoav Goldberg)
自然語言處理權威指南(monkeylearn.com)
自然語言處理入門(algorithmia.com)
自然語言處理教程 (vikparuchuri.com)
Natural Language Processing (almost) from Scratch (arxiv.org)
初高中生課程:自然語言處理 (arxiv.org)
2、深度學習和 NLP
基於深度學習的NLP應用(arxiv.org)
基於深度學習的NLP(Richard Socher)
理解卷積神經網絡在NLP中的應用(wildml.com)
深度學習,NLP,表示學習(colah.github.io)
嵌入表示,編碼,注意力,預測 : 新一代深度學習因NLP的精妙而存在(explosion.ai)
理解基於神經網絡的自然語言處理(Torch實現) (nvidia.com)
深度學習在NLP中的應用(Pytorch實現) (pytorich.org)
3、詞向量(Word Vectors)
詞袋法遇到感知器裝袋法(kaggle.com)
學習單詞嵌入表示法(sebastianruder.com)
單詞嵌入表示的神奇力量(acolyer.org)
解釋word2vec 的參數學習(arxiv.org)
word2vec教程 skip-gram 模型,負採樣(mccormickml.com)
4、Encoder-Decoder
注意力機制與記憶機制在深度學習與NLP中的應用(wildml.com)
序列到序列模型(tensorflow.org)
利用神經網絡學習序列到序列模型(NIPS 2014)
基於深度學習和魔法序列的語言翻譯(medium.com/@ageitgey)
如何使用編碼-解碼LSTM輸出隨機整數對應的序列(machinelearningmastery.com)
tf-seq2seq (google.github.io)
Python
乾貨 | 請收下這份2018學習清單:150個最好的機器學習,NLP和Python教程1、Python
使用Python精通機器學習的七步法(kdnuggets.com)
機器學習的一個簡例(nbviewer.jupyter.org)
2、實例
小白如何用python實現感知器算法(machinelearningmastery.com)
小學生用python實現一個神經網絡(wildml.com)
只用11行python代碼實現一個神經網絡算法(iamtrask.github.io)
自己動手用ptython實現最近鄰算法(kdnuggets.com)
python實現長短期記憶網絡的記憶機制(machinelearningmastery.com)
如何用長短期記憶遞歸神經網絡輸出隨機整數(machinelearningmastery.com)
如何用seq2seq遞歸神經網絡學習加法運算(machinelearningmastery.com)
3、Scipy 和 numpy
Scipy課程筆記(scipy-lectures.org)
Python Numpy 教程(Stanford CS231n)
Numpy 與 Scipy 入門(UCSB CHE210D)
給科學家看的Python微課程(nbviewer.jupyter.org)
4、scikit-learn
PyCon會議上的Scik-learn 教程(nbviewer.jupyter.org)
Scikit-learn 中的分類算法(github.com/mmmayo13)
Scikit-learn教程(scikit-learn.org)
簡明版Scikit-learn教程(github.com/mmmayo13)
5、Tensorflow
Tensorflow教程(tensorflow.org)
Tensorflow入門--CPU vs GPU
(medium.com/@erikhallstrm)
Tensorflow入門(metaflow.fr)
Tensorflow實現RNNs (wildml.com)
Tensorflow實現文本分類CNN模型(wildml.com)
如何用Tensorflow做文本摘要(surmenok.com)
6、PyTorch
Pytorch教程(pytorch.org)
Pytorch快手入門 (gaurav.im)
利用Pytorch深度學習教程(iamtrask.github.io)
Pytorch實戰(github.com/jcjohnson)
PyTorch 教程(github.com/MorvanZhou)
深度學習研究人員看的PyTorch教程(github.com/yunjey)
數學
乾貨 | 請收下這份2018學習清單:150個最好的機器學習,NLP和Python教程
1、機器學習中的數學 (ucsc.edu)
機器學習數學基礎(UMIACS CMSC422)
2、線性代數
線性代數簡明指南(betterexplained.com)
碼農眼中矩陣乘法 (betterexplained.com)
理解叉乘運算(betterexplained.com)
理解點乘運算(betterexplained.com)
機器學習中的線性代數(U. of Buffalo CSE574)
深度學習的線代小抄(medium.com)
複習線性代數與課後閱讀材料(Stanford CS229)
3、概率論
貝葉斯理論 (betterexplained.com)
理解貝葉斯概率理論(Stanford CS229)
複習機器學習中的概率論(Stanford CS229)
概率論(U. of Buffalo CSE574)
機器學習中的概率論(U. of Toronto CSC411)
4、計算方法(Calculus)
如何理解導數:求導法則,指數和算法(betterexplained.com)
如何理解導數,乘法,冪指數,鏈式法(betterexplained.com)
向量計算,理解梯度(betterexplained.com)
微分計算(Stanford CS224n)
計算方法概論(readthedocs.io)

留言

這個網誌中的熱門文章

2017通訊大賽「聯發科技物聯網開發競賽」決賽團隊29強出爐!作品都在11月24日頒獎典禮進行展示

2017通訊大賽「聯發科技物聯網開發競賽」決賽團隊29強出爐!作品都在11月24日頒獎典禮進行展示 LIS   發表於 2017年11月16日 10:31   收藏此文 2017通訊大賽「聯發科技物聯網開發競賽」決賽於11月4日在台北文創大樓舉行,共有29個隊伍進入決賽,角逐最後的大獎,並於11月24日進行頒獎,現場會有全部進入決賽團隊的展示攤位,總計約為100個,各種創意作品琳琅滿目,非常值得一看,這次錯過就要等一年。 「聯發科技物聯網開發競賽」決賽持續一整天,每個團隊都有15分鐘面對評審團做簡報與展示,並接受評審們的詢問。在所有團隊完成簡報與展示後,主辦單位便統計所有評審的分數,並由評審們進行審慎的討論,決定冠亞季軍及其他各獎項得主,結果將於11月24日的「2017通訊大賽頒獎典禮暨成果展」現場公佈並頒獎。 在「2017通訊大賽頒獎典禮暨成果展」現場,所有入圍決賽的團隊會設置攤位,總計約為100個,展示他們辛苦研發並實作的作品,無論是想觀摩別人的成品、了解物聯網應用有那些新的創意、尋找投資標的、尋找人才、尋求合作機會或是單純有興趣,都很適合花點時間到現場看看。 頒獎典禮暨成果展資訊如下: 日期:2017年11月24日(星期五) 地點:中油大樓國光廳(台北市信義區松仁路3號) 我要報名參加「2017通訊大賽頒獎典禮暨成果展」>>> 在參加「2017通訊大賽頒獎典禮暨成果展」之前,可以先在本文觀看各團隊的作品介紹。 決賽29強團隊如下: 長者安全救星 可隨意描繪或書寫之電子筆記系統 微觀天下 體適能訓練管理裝置 肌少症之行走速率檢測系統 Sugar Robot 賽亞人的飛機維修輔助器 iTemp你的溫度個人化管家 語音行動冰箱 MR模擬飛行 智慧防盜自行車 跨平台X-Y視覺馬達控制 Ironmet 菸消雲散 無人小艇 (Mini-USV) 救OK-緊急救援小幫手 穿戴式長照輔助系統 應用於教育之模組機器人教具 這味兒很台味 Aquarium Hub 發展遲緩兒童之擴增實境學習系統 蚊房四寶 車輛相控陣列聲納環境偵測系統 戶外團隊運動管理裝置 懷舊治療數位桌曆 SeeM智能眼罩 觸...
opencv4nodejs Asynchronous OpenCV 3.x Binding for node.js   122     2715     414   0   0 Author Contributors Repository https://github.com/justadudewhohacks/opencv4nodejs Wiki Page https://github.com/justadudewhohacks/opencv4nodejs/wiki Last Commit Mar. 8, 2019 Created Aug. 20, 2017 opencv4nodejs           By its nature, JavaScript lacks the performance to implement Computer Vision tasks efficiently. Therefore this package brings the performance of the native OpenCV library to your Node.js application. This project targets OpenCV 3 and provides an asynchronous as well as an synchronous API. The ultimate goal of this project is to provide a comprehensive collection of Node.js bindings to the API of OpenCV and the OpenCV-contrib modules. An overview of available bindings can be found in the  API Documentation . Furthermore, contribution is highly appreciated....

完形心理學!?讓我們了解“介面設計師”為什麼這樣設計

完形心理學!?讓我們了解“介面設計師”為什麼這樣設計 — 說服客戶與老闆、跟工程師溝通、強化設計概念的有感心理學 — 情況 1 : 為何要留那麼多空白? 害我還要滾動滑鼠(掀桌) 情況 2 : 為什麼不能直接用一頁展現? 把客戶的需求塞滿不就完工啦! (無言) 情況 3: 這種設計好像不錯,但是為什麼要這樣做? (直覺大神告訴我這樣設計,但我說不出來為什麼..) 雖然世界上有許多 GUI 已經走得又長又遠又厲害,但別以為這種古代人對話不會出現,一直以來我們只是習慣這些 GUI 被如此呈現,但為何要這樣設計我們卻不一定知道。 由於 完形心理學 歸納出人類大腦認知之普遍性的規則,因此無論是不是 UI/UX 設計師都很適合閱讀本篇文章。但還是想特別強調,若任職於傳統科技公司,需要對上說服老闆,需要平行說服(資深)工程師,那請把它收進最愛;而習慣套用設計好的 UI 套件,但不知道為何這樣設計的 IT 工程師,也可以透過本文來強化自己的產品說服力。 那就開始吧~(擊掌) 完形心理學,又稱作格式塔(Gestalt)心理學,於二十世紀初由德國心理學家提出 — 用以說明人類大腦如何解釋肉眼所觀察到的事物,並轉化為我們所認知的物件。它可說是現代認知心理學的基礎,其貫徹的概念就是「整體大於個體的總合 “The whole is other than the sum of the parts.” —  Kurt Koffka」。 若深究完整的理論將會使本文變得非常的艱澀,因此筆者直接抽取個人認為與 UI 設計較為相關的 7 個原則(如下),並搭配實際案例做說明。有興趣了解全部理論的話可以另外 Google。 1. 相似性 (Similarity)  — 我們的大腦會把相似的事物看成一體 如果數個元素具有類似的尺寸、體積、顏色,使用者會自動為它們建立起關聯。這是因為我們的眼睛和大腦較容易將相似的事物組織在一起。如下圖所示,當一連串方塊和一連串的圓形並排時,我們會看成(a)一列方塊和兩列圓形(b)一排圓形和兩排三角形。 對應用到介面設計上,FB 每則文章下方的按鈕圖標(按讚 Like / 留言Comment / 分享 Share)雖然功能各不相同,但由於它們在視覺上顏色、大小、排列上的相似性,用戶會將它們視認為...