機器學(xué)習(xí)系統(tǒng)設(shè)計是一本非常實用的機器學(xué)習(xí)教程,由美國機器學(xué)習(xí)和機器人學(xué)博士Willi Richert編著,手把手教你用Python設(shè)計機器學(xué)習(xí)系統(tǒng)。本書為讀者提供了大量的Python庫參考,全書用豐富的案例,教會讀者如何細析機器學(xué)習(xí)技巧與方法,帶你承襲正確的思維方式,非常適合需要機器學(xué)習(xí)技術(shù)的Python開發(fā)人員、計算機科學(xué)研究人員、數(shù)據(jù)科學(xué)家、人工智能程序員,以及統(tǒng)計程序員閱讀參考。
使用說明
1、下載并解壓,得出pdf文件
2、如果打不開本文件,請務(wù)必下載pdf閱讀器
3、安裝后,在打開解壓得出的pdf文件
4、雙擊進行閱讀試讀
內(nèi)容介紹
《機器學(xué)習(xí)系統(tǒng)設(shè)計》是實用的Python機器學(xué)習(xí)教程,結(jié)合大量案例,介紹了機器學(xué)習(xí)的各方面知識。本書不僅告訴你“怎么做”,還會分析“為什么”,力求幫助讀者掌握多種多樣的機器學(xué)習(xí)Python庫,學(xué)習(xí)構(gòu)建基于Python的機器學(xué)習(xí)系統(tǒng),并親身實踐和體驗機器學(xué)習(xí)系統(tǒng)的功能。
本書共分為12章:
第1章通過一個非常簡單的例子介紹機器學(xué)習(xí)的基本概念。盡管很簡單,但也可能會有過擬合的風(fēng)險,這對我們提出了挑戰(zhàn)。
第2章講解了使用真實數(shù)據(jù)解決分類問題的方法,在這里我們對計算機進行訓(xùn)練,使它能夠區(qū)分不同類型的花朵。
第3章講解了詞袋方法的威力,我們可以在沒有真正理解帖子內(nèi)容的情況下,用它來尋找相似的帖子。
第4章讓我們超越將每個帖子分配給單個簇的方式。由于真實的文本可以處理多個主題,我們可以看到如何把帖子分配到幾個主題上。
第5章講解了如何用邏輯回歸判定用戶的答案是好還是壞。在這個情景的背后,我們將學(xué)會用偏差-方差的折中調(diào)試機器學(xué)習(xí)模型。
第6章介紹了樸素貝葉斯的工作原理,以及如何用它對推文進行分類,來判斷推文中的情感是正面的還是負面的。
第7章討論了一個處理數(shù)據(jù)的經(jīng)典課題,但它在今天仍然有意義。我們用它構(gòu)建了一個推薦系統(tǒng),這個系統(tǒng)根據(jù)用戶所輸入的喜歡和不喜歡的信息,為用戶推薦新的商品。
第8章同時使用多種方法改進推薦效果。我們還可以看到如何只根據(jù)購物信息構(gòu)建推薦系統(tǒng),而不需要用戶的評分數(shù)據(jù)(用戶并不總會提供這一信息)。
第9章舉例說明,如果有人把我們收集而成的龐大音樂庫弄亂了,那么為歌曲建立次序的唯一希望就是讓機器來對歌曲分類。你會發(fā)現(xiàn),有時信任別人的專長比我們自己構(gòu)建特征更好。
第10章講解了如何在處理圖像這個特定情景下應(yīng)用分類方法。這個領(lǐng)域又叫做模式識別。
第11章告訴我們還有其他什么方法可以幫我們精簡數(shù)據(jù),使機器學(xué)習(xí)算法能夠處理它們。
第12章講解了不斷膨脹的數(shù)據(jù)規(guī)模,以及這為何會為數(shù)據(jù)分析造成難題。在本章中,我們利用多核或計算集群,探索了一些更大規(guī)模數(shù)據(jù)的處理方法。另外,我們還介紹了云計算(將亞馬遜的Web服務(wù)當(dāng)做云計算提供商)。
機器學(xué)習(xí)系統(tǒng)設(shè)計章節(jié)目錄
機器學(xué)習(xí)系統(tǒng)設(shè)計是一本非常實用的機器學(xué)習(xí)教程,由美國機器學(xué)習(xí)和機器人學(xué)博士Willi Richert編著,手把手教你用Python設(shè)計機器學(xué)習(xí)系統(tǒng)。本書為讀者提供了大量的Python庫參考,全書用豐富的案例,教會讀者如何細析機器學(xué)習(xí)技巧與方法,帶你承襲正確的思維方式,非常適合需要機器學(xué)習(xí)技術(shù)的Python開發(fā)人員、計算機科學(xué)研究人員、數(shù)據(jù)科學(xué)家、人工智能程序員,以及統(tǒng)計程序員閱讀參考。
使用說明
1、下載并解壓,得出pdf文件
2、如果打不開本文件,請務(wù)必下載pdf閱讀器
3、安裝后,在打開解壓得出的pdf文件
4、雙擊進行閱讀試讀
內(nèi)容介紹
《機器學(xué)習(xí)系統(tǒng)設(shè)計》是實用的Python機器學(xué)習(xí)教程,結(jié)合大量案例,介紹了機器學(xué)習(xí)的各方面知識。本書不僅告訴你“怎么做”,還會分析“為什么”,力求幫助讀者掌握多種多樣的機器學(xué)習(xí)Python庫,學(xué)習(xí)構(gòu)建基于Python的機器學(xué)習(xí)系統(tǒng),并親身實踐和體驗機器學(xué)習(xí)系統(tǒng)的功能。
本書共分為12章:
第1章通過一個非常簡單的例子介紹機器學(xué)習(xí)的基本概念。盡管很簡單,但也可能會有過擬合的風(fēng)險,這對我們提出了挑戰(zhàn)。
第2章講解了使用真實數(shù)據(jù)解決分類問題的方法,在這里我們對計算機進行訓(xùn)練,使它能夠區(qū)分不同類型的花朵。
第3章講解了詞袋方法的威力,我們可以在沒有真正理解帖子內(nèi)容的情況下,用它來尋找相似的帖子。
第4章讓我們超越將每個帖子分配給單個簇的方式。由于真實的文本可以處理多個主題,我們可以看到如何把帖子分配到幾個主題上。
第5章講解了如何用邏輯回歸判定用戶的答案是好還是壞。在這個情景的背后,我們將學(xué)會用偏差-方差的折中調(diào)試機器學(xué)習(xí)模型。
第6章介紹了樸素貝葉斯的工作原理,以及如何用它對推文進行分類,來判斷推文中的情感是正面的還是負面的。
第7章討論了一個處理數(shù)據(jù)的經(jīng)典課題,但它在今天仍然有意義。我們用它構(gòu)建了一個推薦系統(tǒng),這個系統(tǒng)根據(jù)用戶所輸入的喜歡和不喜歡的信息,為用戶推薦新的商品。
第8章同時使用多種方法改進推薦效果。我們還可以看到如何只根據(jù)購物信息構(gòu)建推薦系統(tǒng),而不需要用戶的評分數(shù)據(jù)(用戶并不總會提供這一信息)。
第9章舉例說明,如果有人把我們收集而成的龐大音樂庫弄亂了,那么為歌曲建立次序的唯一希望就是讓機器來對歌曲分類。你會發(fā)現(xiàn),有時信任別人的專長比我們自己構(gòu)建特征更好。
第10章講解了如何在處理圖像這個特定情景下應(yīng)用分類方法。這個領(lǐng)域又叫做模式識別。
第11章告訴我們還有其他什么方法可以幫我們精簡數(shù)據(jù),使機器學(xué)習(xí)算法能夠處理它們。
第12章講解了不斷膨脹的數(shù)據(jù)規(guī)模,以及這為何會為數(shù)據(jù)分析造成難題。在本章中,我們利用多核或計算集群,探索了一些更大規(guī)模數(shù)據(jù)的處理方法。另外,我們還介紹了云計算(將亞馬遜的Web服務(wù)當(dāng)做云計算提供商)。
機器學(xué)習(xí)系統(tǒng)設(shè)計章節(jié)目錄
目 錄
第1章 Python機器學(xué)習(xí)入門 1
1.1 夢之隊:機器學(xué)習(xí)與Python 1
1.2 這本書將教給你什么(以及不會教什么) 2
1.3 遇到困難的時候怎么辦 3
1.4 開始 4
1.4.1 NumPy、SciPy和Matplotlib簡介 4
1.4.2 安裝Python 5
1.4.3 使用NumPy和SciPy智能高效地處理數(shù)據(jù) 5
1.4.4 學(xué)習(xí)NumPy 5
1.4.5 學(xué)習(xí)SciPy 9
1.5 我們第一個(極小的)機器學(xué)習(xí)應(yīng)用 10
1.5.1 讀取數(shù)據(jù) 10
1.5.2 預(yù)處理和清洗數(shù)據(jù) 11
1.5.3 選擇正確的模型和學(xué)習(xí)算法 12
1.6 小結(jié) 20
第2章 如何對真實樣本分類 22
2.1 Iris數(shù)據(jù)集 22
2.1.1 第一步是可視化 23
2.1.2 構(gòu)建第一個分類模型 24
2.2 構(gòu)建更復(fù)雜的分類器 28
2.3 更復(fù)雜的數(shù)據(jù)集和更復(fù)雜的分類器 29
2.3.1 從Seeds數(shù)據(jù)集中學(xué)習(xí) 29
2.3.2 特征和特征工程 30
2.3.3 最鄰近分類 30
2.4 二分類和多分類 33
2.5 小結(jié) 34
第3章 聚類:尋找相關(guān)的帖子 35
3.1 評估帖子的關(guān)聯(lián)性 35
3.1.1 不應(yīng)該怎樣 36
3.1.2 應(yīng)該怎樣 36
3.2 預(yù)處理:用相近的公共詞語個數(shù)來衡量相似性 37
3.2.1 將原始文本轉(zhuǎn)化為詞袋 37
3.2.2 統(tǒng)計詞語 38
3.2.3 詞語頻次向量的歸一化 40
3.2.4 刪除不重要的詞語 41
3.2.5 詞干處理 42
3.2.6 停用詞興奮劑 44
3.2.7 我們的成果和目標 45
3.3 聚類 46
3.3.1 K均值 46
3.3.2 讓測試數(shù)據(jù)評估我們的想法 49
3.3.3 對帖子聚類 50
3.4 解決我們最初的難題 51
3.5 調(diào)整參數(shù) 54
3.6 小結(jié) 54
第4章 主題模型 55
4.1 潛在狄利克雷分配(LDA) 55
4.2 在主題空間比較相似度 59
4.3 選擇主題個數(shù) 64
4.4 小結(jié) 65
第5章 分類:檢測劣質(zhì)答案 67
5.1 路線圖概述 67
5.2 學(xué)習(xí)如何區(qū)分出優(yōu)秀的答案 68
5.2.1 調(diào)整樣本 68
5.2.2 調(diào)整分類器 68
5.3 獲取數(shù)據(jù) 68
5.3.1 將數(shù)據(jù)消減到可處理的程度 69
5.3.2 對屬性進行預(yù)選擇和處理 70
5.3.3 定義什么是優(yōu)質(zhì)答案 71
5.4 創(chuàng)建第一個分類器 71
5.4.1 從k鄰近(kNN)算法開始 71
5.4.2 特征工程 72
5.4.3 訓(xùn)練分類器 73
5.4.4 評估分類器的性能 74
5.4.5 設(shè)計更多的特征 74
5.5 決定怎樣提升效果 77
5.5.1 偏差?方差及其折中 77
5.5.2 解決高偏差 78
5.5.3 解決高方差 78
5.5.4 高偏差或低偏差 78
5.6 采用邏輯回歸 81
5.6.1 一點數(shù)學(xué)和一個小例子 81
5.6.2 在帖子分類問題上應(yīng)用邏輯回歸 83
5.7 觀察正確率的背后:準確率和召回率 84
5.8 為分類器瘦身 87
5.9 出貨 88
5.10 小結(jié) 88
第6章 分類II:情感分析 89
6.1 路線圖概述 89
6.2 獲取數(shù)據(jù) 89
6.3 樸素貝葉斯分類器介紹 90
6.3.1 了解貝葉斯定理 90
6.3.2 樸素 91
6.3.3 使用樸素貝葉斯進行分類 92
6.3.4 考慮未出現(xiàn)的詞語和其他古怪情況 94
6.3.5 考慮算術(shù)下溢 95
6.4 創(chuàng)建第一個分類器并調(diào)優(yōu) 97
6.4.1 先解決一個簡單問題 97
6.4.2 使用所有的類 99
6.4.3 對分類器的參數(shù)進行調(diào)優(yōu) 101
6.5 清洗推文 104
6.6 將詞語類型考慮進去 106
6.6.1 確定詞語的類型 106
6.6.2 用SentiWordNet成功地作弊 108
6.6.3 我們第一個估算器 110
6.6.4 把所有東西融合在一起 111
6.7 小結(jié) 112
第7章 回歸:推薦 113
7.1 用回歸預(yù)測房價 113
7.1.1 多維回歸 116
7.1.2 回歸里的交叉驗證 116
7.2 懲罰式回歸 117
7.2.1 L1和L2懲罰 117
7.2.2 在Scikit-learn中使用Lasso或彈性網(wǎng) 118
7.3 P大于N的情形 119
7.3.1 基于文本的例子 120
7.3.2 評分預(yù)測和推薦 122
7.4 小結(jié) 126
第8章 回歸:改進的推薦 127
8.1 改進的推薦 127
8.1.1 使用二值推薦矩陣 127
8.1.2 審視電影的近鄰 129
8.1.3 組合多種方法 130
8.2 購物籃分析 132
8.2.1 獲取有用的預(yù)測 133
8.2.2 分析超市購物籃 134
8.2.3 關(guān)聯(lián)規(guī)則挖掘 136
8.2.4 更多購物籃分析的高級話題 137
8.3 小結(jié) 138
第9章 分類III:音樂體裁分類 139
9.1 路線圖概述 139
9.2 獲取音樂數(shù)據(jù) 139
9.3 觀察音樂 140
9.4 用FFT構(gòu)建第一個分類器 143
9.4.1 增加實驗敏捷性 143
9.4.2 訓(xùn)練分類器 144
9.4.3 在多分類問題中用混淆矩陣評估正確率 144
9.4.4 另一種方式評估分類器效果:受試者工作特征曲線(ROC) 146
9.5 用梅爾倒頻譜系數(shù)(MFCC)提升分類效果 148
9.6 小結(jié) 152
第10章 計算機視覺:模式識別 154
10.1 圖像處理簡介 154
10.2 讀取和顯示圖像 155
10.2.1 圖像處理基礎(chǔ) 156
10.2.2 加入椒鹽噪聲 161
10.2.3 模式識別 163
10.2.4 計算圖像特征 163
10.2.5 設(shè)計你自己的特征 164
10.3 在更難的數(shù)據(jù)集上分類 166
10.4 局部特征表示 167
10.5 小結(jié) 170
第11章 降維 171
11.1 路線圖 171
11.2 選擇特征 172
11.2.1 用篩選器檢測冗余特征 172
11.2.2 用封裝器讓模型選擇特征 178
11.3 其他特征選擇方法 180
11.4 特征抽取 181
11.4.1 主成分分析(PCA) 181
11.4.2 PCA的局限性以及LDA會有什么幫助 183
11.5 多維標度法(MDS) 184
11.6 小結(jié) 187
第12章 大數(shù)據(jù) 188
12.1 了解大數(shù)據(jù) 188
12.2 用Jug程序包把你的處理流程分解成幾個任務(wù) 189
12.2.1 關(guān)于任務(wù) 189
12.2.2 復(fù)用部分結(jié)果 191
12.2.3 幕后的工作原理 192
12.2.4 用Jug分析數(shù)據(jù) 192
12.3 使用亞馬遜Web服務(wù)(AWS) 194
12.3.1 構(gòu)建你的第一臺機器 195
12.3.2 用starcluster自動創(chuàng)建集群 199
12.4 小結(jié) 202
附錄A 更多機器學(xué)習(xí)知識 203
A.1 在線資源 203
A.2 參考書 203
A.2.1 問答網(wǎng)站 203
A.2.2 博客 204
A.2.3 數(shù)據(jù)資源 205
A.2.4 競爭日益加劇 205
A.3 還剩下什么 205
A.4 小結(jié) 206
索引 207
- 下載地址
發(fā)表評論
0條評論軟件排行榜
熱門推薦
- 南方Plus電腦版 v11.8.027.22M / 簡體中文
- 得間免費小說電腦版 v5.2.7.172.56M / 簡體中文
- 未公開的Oracle數(shù)據(jù)庫秘密 迪貝斯pdf掃描版34.69M / 簡體中文
- PHP語言精粹電子書 pdf掃描版25.72M / 簡體中文
- linux常用命令大全 chm版1.48M / 簡體中文
- 本草綱目 5.34M / 簡體中文
- docker入門實戰(zhàn) pdf完整版1.38M / 簡體中文
- Scala程序設(shè)計第二版 pdf高清完整版15.83M / 簡體中文
- C++黑客編程揭秘與防范第2版 冀云pdf掃描版54.58M / 簡體中文
- HotSpot實戰(zhàn)(陳濤著) 中文pdf掃描版82M / 簡體中文