數(shù)據(jù)挖掘:概念模型方法和算法(第2版)是一本數(shù)據(jù)挖掘原理講解書籍,由[美]坎塔爾季奇Mehmed Kantardzic著,王曉海,吳志剛共同翻譯。全書講解了DBSCAN、BIRCH和分布式DBSCAN的聚類算法,介紹了貝葉斯網(wǎng)絡(luò),并討論了圖形中的Betweeness和Centrality參數(shù)測(cè)量算法,分析在建立決策樹時(shí)使用的cart算法和基尼指數(shù),討論relief以及pagerank算法,更詳細(xì)地講解數(shù)據(jù)挖掘技術(shù)商業(yè)、隱私、安全和法律方面的內(nèi)容等等,能夠適用于在校生,畢業(yè)生,研究人員閱讀。
內(nèi)容介紹
隨著數(shù)據(jù)集規(guī)模和復(fù)雜度的持續(xù)上升,分析員必須利用更高級(jí)的軟件工具來(lái)執(zhí)行間接的、自動(dòng)的智能化數(shù)據(jù)分析?!稊?shù)據(jù)挖掘:概念模型方法和算法(第2版)》介紹了通過(guò)分析高維數(shù)據(jù)空間中的海量原始數(shù)據(jù)來(lái)提取用于決策的新信息的尖端技術(shù)和方法。本書開篇闡述數(shù)據(jù)挖掘原理,此后在示例的引導(dǎo)下詳細(xì)講解起源于統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、模糊邏輯和演化計(jì)算等學(xué)科的具有代表性的、最前沿的挖掘方法和算法。本書還著重描述如何恰當(dāng)?shù)剡x擇方法和數(shù)據(jù)分析軟件并合理地調(diào)整參數(shù)。每章末尾附有復(fù)習(xí)題。
本書主要用作計(jì)算機(jī)科學(xué)、計(jì)算機(jī)工程和計(jì)算機(jī)信息系統(tǒng)專業(yè)的研究生數(shù)據(jù)挖掘教材,高年級(jí)本科生或具備同等教育背景的讀者也完全可以理解本書的所有主題。
使用說(shuō)明
1、下載并解壓,得出pdf文件
2、如果打不開本文件,請(qǐng)務(wù)必下載pdf閱讀器
3、安裝后,在打開解壓得出的pdf文件
4、雙擊進(jìn)行閱讀試讀
數(shù)據(jù)挖掘:概念模型方法和算法(第2版)章節(jié)目錄
第1章 數(shù)據(jù)挖掘的概念
1.1 概述
1.2 數(shù)據(jù)挖掘的起源
1.3 數(shù)據(jù)挖掘過(guò)程
1.4 大型數(shù)據(jù)集
1.5 數(shù)據(jù)倉(cāng)庫(kù)
1.6 數(shù)據(jù)挖掘的商業(yè)方面:為什么數(shù)據(jù)挖掘項(xiàng)目會(huì)失敗
1.7 本書結(jié)構(gòu)安排
1.8 復(fù)習(xí)題
1.9 參考書
第2章 數(shù)據(jù)準(zhǔn)備
2.1 原始數(shù)據(jù)的表述
2.2 原始數(shù)據(jù)的特性
2.3 原始數(shù)據(jù)的轉(zhuǎn)換
2.3.1 標(biāo)準(zhǔn)化
2.3.2 數(shù)據(jù)平整
2.3.3 差值和比率
2.4 丟失數(shù)據(jù)
2.5 時(shí)間相關(guān)數(shù)據(jù)
2.6 異常點(diǎn)分析
2.7 復(fù)習(xí)題
2.8 參考書目
第3章 數(shù)據(jù)歸約
3.1 大型數(shù)據(jù)集的維度
3.2 特征歸約
3.2.1 特征選擇
3 .2.2 特征提取
3.3 Relief算法
3.4 特征排列的熵度量
3.5 主成分分析
3.6 值歸約
3.7 特征離散化ChiMerge技術(shù)
3.8 案例歸約
3.9 復(fù)習(xí)題
3.10 參考書目
第4章 從數(shù)據(jù)中學(xué)習(xí)
4.1 學(xué)習(xí)機(jī)器
4.2 統(tǒng)計(jì)學(xué)習(xí)原理
4.3 學(xué)習(xí)方法的類型
4.4 常見(jiàn)的學(xué)習(xí)任務(wù)
4.5 支持向量機(jī)
4.6 kNN:最近鄰分類器
4.7 模型選擇與泛化
4.8 模型的評(píng)估
4.9 90%準(zhǔn)確的情形
4.9.1 保險(xiǎn)欺詐檢測(cè)
4.9.2 改進(jìn)心臟護(hù)理
4.10 復(fù)習(xí)題
4.11 參考書目
第5章 統(tǒng)計(jì)方法
5.1 統(tǒng)計(jì)推斷
5.2 評(píng)測(cè)數(shù)據(jù)集的差異
5.3 貝葉斯定理
5.4 預(yù)測(cè)回歸
5.5 方差分析
5.6 對(duì)數(shù)回歸
5.7 對(duì)數(shù)-線性模型
5.8 線性判別分析
5.9 復(fù)習(xí)題
5.10 參考書目
第6章 決策樹和決策規(guī)則
6.1 決策樹
6.2 C4.5算法:生成決策樹
6.3 未知屬性值
6.4 修剪決策樹
6.5 C4.5算法:生成決策規(guī)則
6.6 CART算法和Gini指標(biāo)
6.7 決策樹和決策規(guī)則的局限性
6.8 復(fù)習(xí)題
6.9 參考書目
第7章 人工神經(jīng)網(wǎng)絡(luò)
7.1 人工神經(jīng)元的模型
7.2 人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
7.3 學(xué)習(xí)過(guò)程
7.4 使用ANN完成的學(xué)習(xí)任務(wù)
7.4.1 模式聯(lián)想
7.4.2 模式識(shí)別
7.5 多層感知機(jī)
7.6 競(jìng)爭(zhēng)網(wǎng)絡(luò)和競(jìng)爭(zhēng)學(xué)習(xí)
7.7 SoM
7.8 復(fù)習(xí)題
7.9 參考書目
第8章 集成學(xué)習(xí)
8.1 集成學(xué)習(xí)方法論
8.2 多學(xué)習(xí)器組合方案
8.3 bagging和boosting
8.4 AdaBoost算法
8.5 復(fù)習(xí)題
8.6 參考書目
第9章 聚類分析
9.1 聚類的概念
9.2 相似度的度量
9.3 凝聚層次聚類
9.4 分區(qū)聚類
9.5 增量聚類
9.6 DBSCAN箅法
9.7 BIRCH算法
9.8 聚類驗(yàn)證
9.9 復(fù)習(xí)題
9.10 參考書目
第10章 關(guān)聯(lián)規(guī)則
10.1 購(gòu)物籃分析
10.2 Apriori算法
10.3 從頻繁項(xiàng)集中得到關(guān)聯(lián)規(guī)則
10.4 提高Apriori算法的效率
10.5 FP增長(zhǎng)方法
10.6 關(guān)聯(lián)分類方法
10.7 多維關(guān)聯(lián)規(guī)則挖掘
10.8 復(fù)習(xí)題
10.9 參考書目
第11章 Web挖掘和文本挖掘
11.1Web挖掘
11.2 Web內(nèi)容、結(jié)構(gòu)與使用挖掘
11.3 HITS和LOGSOM算法
11.4 挖掘路徑遍歷模式
11.5 PageRank算法
11.6 文本挖掘
11.7 潛在語(yǔ)義分析
11.8 復(fù)習(xí)題
11.9 參考書目
第12章 數(shù)據(jù)挖掘高級(jí)技術(shù)
12.1 圖挖掘
第13章 遺傳算法
第14章 模糊集和模糊邏輯
第15章 可視化方法
附錄A 數(shù)據(jù)挖掘工具
附錄B 數(shù)據(jù)挖掘應(yīng)用
- 下載地址
- 本地下載通道:
- 浙江電信下載
- 北京聯(lián)通下載
- 江蘇電信下載
- 廣東電信下載
有問(wèn)題? 點(diǎn)此報(bào)錯(cuò)
發(fā)表評(píng)論
1人參與,1條評(píng)論- 第1樓河南省新鄉(xiāng)市移動(dòng)網(wǎng)友發(fā)表于: 2020-04-01 14:11:48
- 很棒啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊0蓋樓(回復(fù))
軟件排行榜
熱門推薦
- 得間免費(fèi)小說(shuō)電腦版 v5.2.7.172.56M / 簡(jiǎn)體中文
- 網(wǎng)易新聞電腦版 v112.697.63M / 簡(jiǎn)體中文
- 瀟湘書院電腦版 v2.3.11.888官方版49.65M / 簡(jiǎn)體中文
- 數(shù)據(jù)挖掘?qū)д?官方版61.61M / 簡(jiǎn)體中文
- 吉利博瑞用戶手冊(cè) pdf高清版57.89M / 簡(jiǎn)體中文
- 開源閱讀電腦版 v3.2517.96M / 簡(jiǎn)體中文
- 未公開的Oracle數(shù)據(jù)庫(kù)秘密 迪貝斯pdf掃描版34.69M / 簡(jiǎn)體中文
- PHP語(yǔ)言精粹電子書 pdf掃描版25.72M / 簡(jiǎn)體中文
- linux常用命令大全 chm版1.48M / 簡(jiǎn)體中文
- 本草綱目 5.34M / 簡(jiǎn)體中文