Python數(shù)據(jù)挖掘入門與實踐完整版【高清電子書】
#學習資料 ·2026-01-26 10:44:25
本書是寫給那些想把數(shù)據(jù)挖掘技術(shù)應用到實際項目中,卻不知道怎么開始的程序員。如果你沒有編程經(jīng)歷,我強烈建議你在學習本書之前,至少先了解一下編程的基礎知識。本書直接略過這部分內(nèi)容,也不會把過多精力放在代碼的具體實現(xiàn)上。也就是說,簡要學習一下編程基礎知識再來學習本書就行。本書不對你的編程技能做過高要求,所以你沒必要先成為編程高手!

本書主要內(nèi)容:
第1章開始數(shù)據(jù)挖掘之旅,介紹我們即將用到的技術(shù),接著通過講解兩個基礎算法的實現(xiàn)方法達到熱身目的。
第2章用scikit-learn估計器分類,涵蓋了數(shù)據(jù)挖掘的一個重要主題——分類。這一章還會介紹將數(shù)據(jù)挖掘流程標準化的流水線結(jié)構(gòu),便于你管理實驗流程。
第3章用決策樹預測獲勝球隊,介紹決策樹和隨機森林兩個新算法。我們將通過抽取區(qū)分度高的特征來預測獲勝選手。
第4章用親和性分析方法推薦電影,思考根據(jù)以往消費記錄推薦產(chǎn)品的問題,介紹Apriori算法。
第5章用轉(zhuǎn)換器抽取特征,介紹不同類別特征的抽取方法及不同數(shù)據(jù)集的處理方法。
第6章使用樸素貝葉斯進行社會媒體挖掘,使用樸素貝葉斯算法自動分析來自社交網(wǎng)站Twitter的文本信息。
第7章用圖挖掘找到感興趣的人,采用聚類和網(wǎng)絡分析方法,發(fā)現(xiàn)社會媒體上感興趣的人。
第8章用神經(jīng)網(wǎng)絡破解驗證碼,從圖像中抽取信息,然后訓練神經(jīng)網(wǎng)絡,用來發(fā)現(xiàn)圖像中的單詞和字母。
第9章作者歸屬問題,通過抽取文本特征,使用支持向量機算法,找出文檔的作者。
第10章新聞語料分類,使用k-means聚類算法,根據(jù)新聞文章內(nèi)容進行分類。
第11章用深度學習方法為圖像中的物體進行分類,采用深度神經(jīng)網(wǎng)絡算法確定圖像中的物體。
第12章大數(shù)據(jù)處理,探討對大數(shù)據(jù)進行數(shù)據(jù)挖掘的流程及方法。附錄依次介紹各章的參考資料,便于讀者深入了解各章內(nèi)容。
點擊右側(cè)按鈕(獲取完整版文件內(nèi)容): 下載文件