機(jī)器學(xué)習(xí)與R語言是一本涵蓋機(jī)器學(xué)習(xí)核心算法手冊(cè),由美國(guó)程序員布雷特·蘭茨編著。本書內(nèi)容豐富翔實(shí),通過豐富的實(shí)際案例來探索如何應(yīng)用r來進(jìn)行現(xiàn)實(shí)世界問題的機(jī)器學(xué)習(xí),如何從數(shù)據(jù)中獲取可以付諸行動(dòng)的洞察力。通過閱讀本書,你將學(xué)到:用r準(zhǔn)備用于機(jī)器學(xué)習(xí)的數(shù)據(jù),用r進(jìn)行數(shù)據(jù)探索和數(shù)據(jù)可視化,用k近領(lǐng)方法進(jìn)行數(shù)據(jù)分類,用線性回歸預(yù)測(cè)數(shù)值型數(shù)據(jù)等等,非常適合對(duì)機(jī)器學(xué)習(xí)和R語言感興趣的用戶下載閱讀。
內(nèi)容介紹
《機(jī)器學(xué)習(xí)與R語言》涵蓋的內(nèi)容第1章介紹了用來定義和區(qū)分機(jī)器學(xué)習(xí)算法的術(shù)語和概念,并給出了將學(xué)習(xí)任務(wù)與適當(dāng)算法相匹配的方法。第2章介紹如何應(yīng)用R來管理數(shù)據(jù),進(jìn)行數(shù)據(jù)的探索分析和數(shù)據(jù)可視化;第3~9章介紹典型的機(jī)器學(xué)習(xí)算法,包括k近鄰分類算法、樸素貝葉斯算法、決策樹和規(guī)則樹、回歸預(yù)測(cè)、黑盒算法——神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)、關(guān)聯(lián)分析、k均值聚類,并給出大量的實(shí)際案例和詳細(xì)的分析步驟,例如乳腺癌的判斷、垃圾短信的過濾、貸款違約的預(yù)測(cè)、毒蘑菇的判別、醫(yī)療費(fèi)用的預(yù)測(cè)、建筑用混凝土強(qiáng)度的預(yù)測(cè)、光學(xué)字符的識(shí)別、超市購(gòu)物籃關(guān)聯(lián)分析以及市場(chǎng)細(xì)分等;第10章介紹模型性能評(píng)價(jià)的原理和方法;第11章給出提高模型性能的幾種常用方法;第12章討論用R進(jìn)行機(jī)器學(xué)習(xí)時(shí)可能遇到的一些高級(jí)專題,如特殊形式的數(shù)據(jù)、大數(shù)據(jù)集的處理、并行計(jì)算和GPU計(jì)算等技術(shù)。章節(jié)目錄
推薦序
譯者序
前言
關(guān)于審稿人
第1章 機(jī)器學(xué)習(xí)簡(jiǎn)介1
1.1 機(jī)器學(xué)習(xí)的起源1
1.2 機(jī)器學(xué)習(xí)的使用與濫用3
1.2.1 機(jī)器學(xué)習(xí)的成功使用3
1.2.2 機(jī)器學(xué)習(xí)的限制4
1.2.3 機(jī)器學(xué)習(xí)的倫理方面5
1.3 機(jī)器如何學(xué)習(xí)6
1.3.1 數(shù)據(jù)存儲(chǔ)7
1.3.2 抽象化7
1.3.3 一般化9
1.3.4 評(píng)估10
1.4 實(shí)踐中的機(jī)器學(xué)習(xí)11
1.4.1 輸入數(shù)據(jù)的類型11
1.4.2 機(jī)器學(xué)習(xí)算法的類型12
1.4.3 為輸入數(shù)據(jù)匹配算法14
1.5 使用R進(jìn)行機(jī)器學(xué)習(xí)15
1.5.1 安裝R添加包15
1.5.2 載入和卸載R添加包16
1.6 總結(jié)16
第2章 數(shù)據(jù)的管理和理解18
2.1 R數(shù)據(jù)結(jié)構(gòu)18
2.1.1 向量18
2.1.2 因子20
2.1.3 列表21
2.1.4 數(shù)據(jù)框23
2.1.5 矩陣和數(shù)組25
2.2 用R管理數(shù)據(jù)27
2.2.1 保存、載入和移除R數(shù)據(jù)結(jié)構(gòu)27
2.2.2 用CSV文件導(dǎo)入和保存數(shù)據(jù)28
2.3 探索和理解數(shù)據(jù)29
2.3.1 探索數(shù)據(jù)的結(jié)構(gòu)29
2.3.2 探索數(shù)值變量30
2.3.3 探索分類變量38
2.3.4 探索變量之間的關(guān)系40
2.4 總結(jié)43
第3章 懶惰學(xué)習(xí)—使用近鄰分類44
3.1 理解近鄰分類44
3.1.1 kNN算法45
3.1.2 為什么kNN算法是懶惰的50
3.2 例子—用kNN算法診斷乳腺癌51
3.2.1 第1步—收集數(shù)據(jù)51
3.2.2 第2步—探索和準(zhǔn)備數(shù)據(jù)52
3.2.3 第3步—基于數(shù)據(jù)訓(xùn)練模型55
3.2.4 第4步—評(píng)估模型的性能56
3.2.5 第5步—提高模型的性能57
3.3 總結(jié)59
第4章 概率學(xué)習(xí)—樸素貝葉斯分類60
4.1 理解樸素貝葉斯60
4.1.1 貝葉斯方法的基本概念61
4.1.2 樸素貝葉斯算法65
4.2 例子—基于貝葉斯算法的手機(jī)垃圾短信過濾69
4.2.1 第1步—收集數(shù)據(jù)69
4.2.2 第2步—探索和準(zhǔn)備數(shù)據(jù)70
4.2.3 第3步—基于數(shù)據(jù)訓(xùn)練模型81
4.2.4 第4步—評(píng)估模型的性能82
4.2.5 第5步—提高模型的性能83
4.3 總結(jié)84
第5章 分而治之—應(yīng)用決策樹和規(guī)則進(jìn)行分類85
5.1 理解決策樹85
5.1.1 分而治之86
5.1.2 C5.0決策樹算法89
5.2 例子—使用C5.0決策樹識(shí)別高風(fēng)險(xiǎn)銀行貸款91
5.2.1 第1步—收集數(shù)據(jù)92
5.2.2 第2步—探索和準(zhǔn)備數(shù)據(jù)92
5.2.3 第3步—基于數(shù)據(jù)訓(xùn)練模型94
5.2.4 第4步—評(píng)估模型的性能97
5.2.5 第5步—提高模型的性能97
5.3 理解分類規(guī)則101
5.3.1 獨(dú)立而治之101
5.3.2 1R算法103
5.3.3 RIPPER算法104
5.3.4 來自決策樹的規(guī)則105
5.3.5 什么使決策樹和規(guī)則貪婪106
5.4 例子—應(yīng)用規(guī)則學(xué)習(xí)算法識(shí)別有毒的蘑菇108
5.4.1 第1步—收集數(shù)據(jù)108
5.4.2 第2步—探索和準(zhǔn)備數(shù)據(jù)108
5.4.3 第3步—基于數(shù)據(jù)訓(xùn)練模型109
5.4.4 第4步—評(píng)估模型的性能111
5.4.5 第5步—提高模型的性能112
5.5 總結(jié)114
第6章 預(yù)測(cè)數(shù)值型數(shù)據(jù)—回歸方法115
6.1 理解回歸115
6.1.1 簡(jiǎn)單線性回歸117
6.1.2 普通最小二乘估計(jì)119
6.1.3 相關(guān)性120
6.1.4 多元線性回歸121
6.2 例子—應(yīng)用線性回歸預(yù)測(cè)醫(yī)療費(fèi)用124
6.2.1 第1步—收集數(shù)據(jù)124
6.2.2 第2步—探索和準(zhǔn)備數(shù)據(jù)125
6.2.3 第3步—基于數(shù)據(jù)訓(xùn)練模型129
6.2.4 第4步—評(píng)估模型的性能131
6.2.5 第5步—提高模型的性能132
6.3 理解回歸樹和模型樹134
6.4 例子—用回歸樹和模型樹估計(jì)葡萄酒的質(zhì)量136
6.4.1 第1步—收集數(shù)據(jù)137
6.4.2 第2步—探索和準(zhǔn)備數(shù)據(jù)137
6.4.3 第3步—基于數(shù)據(jù)訓(xùn)練模型139
6.4.4 第4步—評(píng)估模型的性能142
6.4.5 第5步—提高模型的性能143
6.5 總結(jié)145
第7章 黑箱方法—神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)147
7.1理解神經(jīng)網(wǎng)絡(luò)147
7.1.1從生物神經(jīng)元到人工神經(jīng)元148
7.1.2激活函數(shù)149
7.1.3網(wǎng)絡(luò)拓?fù)?51
7.1.4用后向傳播訓(xùn)練神經(jīng)網(wǎng)絡(luò)154
7.2例子—用人工神經(jīng)網(wǎng)絡(luò)對(duì)混凝土的強(qiáng)度進(jìn)行建模155
7.2.1第1步—收集數(shù)據(jù)155
7.2.2第2步—探索和準(zhǔn)備數(shù)據(jù)156
7.2.3第3步—基于數(shù)據(jù)訓(xùn)練模型157
7.2.4第4步—評(píng)估模型的性能159
7.2.5第5步—提高模型的性能159
7.3理解支持向量機(jī)161
7.3.1用超平面分類161
7.3.2對(duì)非線性空間使用核函數(shù)164
7.4例子—用支持向量機(jī)進(jìn)行光學(xué)字符識(shí)別166
7.4.1第1步—收集數(shù)據(jù)166
7.4.2第2步—探索和準(zhǔn)備數(shù)據(jù)167
7.4.3第3步—基于數(shù)據(jù)訓(xùn)練模型168
7.4.4第4步—評(píng)估模型的性能170
7.4.5第5步—提高模型的性能171
7.5總結(jié)172
第8章 探尋模式—基于關(guān)聯(lián)規(guī)則的購(gòu)物籃分析173
8.1理解關(guān)聯(lián)規(guī)則173
8.1.1用于關(guān)聯(lián)規(guī)則學(xué)習(xí)的Apriori算法174
8.1.2度量規(guī)則興趣度—支持度和置信度175
8.1.3用Apriori原則建立規(guī)則176
8.2例子—用關(guān)聯(lián)規(guī)則確定經(jīng)常一起購(gòu)買的食品雜貨177
8.2.1第1步—收集數(shù)據(jù)177
8.2.2第2步—探索和準(zhǔn)備數(shù)據(jù)178
8.2.3第3步—基于數(shù)據(jù)訓(xùn)練模型183
8.2.4第4步—評(píng)估模型的性能185
8.2.5第5步—提高模型的性能187
8.3總結(jié)190
第9章 尋找數(shù)據(jù)的分組—k均值聚類191
9.1理解聚類191
9.1.1聚類—一種機(jī)器學(xué)習(xí)任務(wù)192
9.1.2k均值聚類算法193
9.2例子—用k均值聚類探尋青少年市場(chǎng)細(xì)分198
9.2.1第1步—收集數(shù)據(jù)199
9.2.2第2步—探索和準(zhǔn)備數(shù)據(jù)199
9.2.3第3步—基于數(shù)據(jù)訓(xùn)練模型203
9.2.4第4步—評(píng)估模型的性能205
9.2.5第5步—提高模型的性能207
9.3總結(jié)208
使用說明
1、下載并解壓,得出pdf文件
2、如果打不開本文件,請(qǐng)務(wù)必下載pdf閱讀器
3、安裝后,在打開解壓得出的pdf文件
4、雙擊進(jìn)行閱讀
- 下載地址
- 本地下載通道:
- 浙江電信下載
- 北京聯(lián)通下載
- 江蘇電信下載
- 廣東電信下載
有問題? 點(diǎn)此報(bào)錯(cuò)
發(fā)表評(píng)論
0條評(píng)論軟件排行榜
熱門推薦
- 網(wǎng)易新聞電腦版 v112.697.63M / 簡(jiǎn)體中文
- 瀟湘書院電腦版 v2.3.11.888官方版49.65M / 簡(jiǎn)體中文
- 數(shù)據(jù)挖掘?qū)д?官方版61.61M / 簡(jiǎn)體中文
- 吉利博瑞用戶手冊(cè) pdf高清版57.89M / 簡(jiǎn)體中文
- 京東讀書電腦版 v1.13.4官方版1.98M / 簡(jiǎn)體中文
- PHP語言精粹電子書 pdf掃描版25.72M / 簡(jiǎn)體中文
- linux常用命令大全 chm版1.48M / 簡(jiǎn)體中文
- 本草綱目 5.34M / 簡(jiǎn)體中文
- Scala程序設(shè)計(jì)第二版 pdf高清完整版15.83M / 簡(jiǎn)體中文
- C++黑客編程揭秘與防范第2版 冀云pdf掃描版54.58M / 簡(jiǎn)體中文