小白學習Python數(shù)據(jù)挖掘
Python現(xiàn)已穩(wěn)坐機器學習的榜首言語(機器學習編程言語之爭,Python奪冠),尤其是深度學習結(jié)構(gòu)Torch宣告支撐Python以后。所以學習Python進行數(shù)據(jù)發(fā)掘是性價比是最高的(自己也拋棄了運用了3年多的R言語)。而運用Python進行數(shù)據(jù)發(fā)掘是最近幾年才開端火起來的,之前網(wǎng)上許多的資料都是對于Python網(wǎng)頁開發(fā)等。但運用Python進行數(shù)據(jù)發(fā)掘的側(cè)重點現(xiàn)已徹底不一樣了。自己即是浪費了許多時刻來篩選這些博客、書本。所以就有了這篇文章,希望能幫我們少走一點彎路。
本文章主要從數(shù)據(jù)挖掘的角度出發(fā),談談如何入門數(shù)據(jù)挖掘。本文不能保證你能成為大神,但是如果能踏踏實實地學習完,找一份年薪15w+的工作還是不太難的,考慮到市場上人才的稀缺。本人也是非計算機專業(yè),所以希望給非計算機的人一點參考。現(xiàn)在市場上數(shù)據(jù)挖掘的人才非常缺少,現(xiàn)在大一點的企業(yè)都需要數(shù)據(jù)分析、數(shù)據(jù)挖掘的人才,但是國目前只有3所大學開設了相關的本科專業(yè),計算機專業(yè)的人也不會搶這飯碗,因而,造成了數(shù)據(jù)挖掘市場上人才的供給不足,所以給了一大堆非科班出身人很多的機會。
一、Python 基礎語法學習
如果只推薦一本書,強烈推薦《跟老齊學Python》,Python中的核心概念做了非常棒的講解,深刻而不失幽默。
如果想系統(tǒng)的學習推薦密歇根大學的《學習使用Python編程并分析數(shù)據(jù)》系列課程。
廖雪峰Python教程 簡單易上手的Python基礎語法教程,值得學習, Python 2和Python 3版本都有。
二、 機器學習理論
基本經(jīng)典的機器學習書籍
機器學習入門(中/英)(谷歌大牛的課程)
機器學習(喬治亞理工大學計算機課程)
周志華的西瓜書《機器學習》
深入一些的可以考慮李航的《統(tǒng)計學習方法》
還有偏統(tǒng)計的斯坦福的教授寫的《統(tǒng)計學習導論》,深入版本的《The Elements of Statistical Learning》(英文影印版)
上面推薦的都是非常不錯機器學習的入門書籍,都是經(jīng)典了。
三、Python機器學習代碼學習
掌握Python語法的基礎上學習《Python for data analysis》是比較不錯的選擇,涵蓋了iPython notebook、Numpy、Scipy和Pandas包的使用。
《Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》介紹了使用Python進行數(shù)據(jù)挖掘的詳細案例,數(shù)據(jù)和代碼都可以下載,作為機器學習的進階學習是不錯的選擇(這本書也用對應的R語言和Matlab 版本)。
還有Udacity機器學習納米學位項目代碼(Github上有)
再推薦2本國外網(wǎng)站的書籍,還在early release階段《Python Data Science Handbook》和《Hands On Machine Learning with Scikit-Learn and TensorFlow》,非常好的代碼示范。注冊Safari Online,可以免費看10天。
四、優(yōu)秀博客和微信公眾號
我推薦的網(wǎng)站和微信公眾號都是我平時天天看的,那些水貨大多被我取消關注了,養(yǎng)成每周清理公眾號的好習慣。
1. 數(shù)據(jù)挖掘入門與實戰(zhàn) 全是干貨,代碼質(zhì)量非常高。
2. 機器學習研究會 我校老師組織的學習平臺,代碼加行業(yè)信息齊飛,質(zhì)量非常高。尤其是我校的AI公開課(有直播),中國頂尖人工智能大腕云集。
3. 新智元 人工智能方向行業(yè)觀點,對于自己把握技術(shù)方向非常重要,比如說自動駕駛這個坑能不能入?
4. 機器之心 技術(shù)前沿與重量級新聞。
還有一些其他的,下次再繼續(xù)補充。
還有幾個博客:
iPhone上可以使用Reeder閱讀器,Instapaper用來保存后稍后閱讀,因為信息量比較大。
No free Hunch Kaggle競賽平臺的官方博客,包括一些優(yōu)秀的代碼解讀以及高分選手的采訪,十分有用的經(jīng)驗(來自不同背景,不同年齡層次,不同職業(yè)的選手)
Analytics Community | Analytics Discussions | Big Data Discussion 干貨技術(shù)文章
新浪微博-愛可可 (北郵PRIS模式識別實驗室陳老師)
五、計算機書本下載網(wǎng)站
再增加幾個外文書本下載網(wǎng)址:
1. All IT eBooks 全,也許需求運用翻*墻下載,翻*墻辦法見文末
2. Library Genesis 各種書本,不局限于編程書本
3. Fox eBook - eBooks Free Download Site
4. Development / Programming / AvaxHome
馬哥學習交流群
馬哥教育-Python開發(fā)-1群 335068227
馬哥教育-Python開發(fā)-2群 608459685