內(nèi)容介紹
算法是解決問題的一系列步驟,為實現(xiàn)有價值的Web應(yīng)用(如推薦引擎、智能化搜索、內(nèi)容組織系統(tǒng)等),《智能Web算法》提供了清晰的、精心組織過的算法模式。利用這些技術(shù),你可以捕獲用戶原始而重要的信息,并把它們應(yīng)用于實踐中以獲取相應(yīng)的收益。本書涵蓋了五類重要的智能算法:搜索、推薦、聚類、分類和分類器組合,并結(jié)合具體的案例討論了它們在Web應(yīng)用中的角色及要注意的問題。除了第1章的概要性介紹以及第7章對所有技術(shù)的整合應(yīng)用外,第2~6章以代碼示例的形式分別對這五類算法進行了介紹。章節(jié)目錄
1 什么是智能Web?1.1 智能Web應(yīng)用實例
1.2 智能應(yīng)用的基本要素
1.3 什么應(yīng)用會受益于智能?
1.3.1 社交網(wǎng)絡(luò)
1.3.2 Mashup
1.3.3 門戶網(wǎng)站
1.3.4 維基
1.3.5 文件分享網(wǎng)站
1.3.6 網(wǎng)絡(luò)游戲
1.4 如何構(gòu)建智能應(yīng)用?
1.4.1 檢查功能和數(shù)據(jù)
1.4.2 獲取更多的數(shù)據(jù)
1.5 機器學(xué)習(xí)、數(shù)據(jù)挖掘及其他
1.6 智能應(yīng)用中八個常見的誤區(qū)
1.6.1 誤區(qū)1:數(shù)據(jù)是可靠的
1.6.2 誤區(qū)2:計算能馬上完成
1.6.3 誤區(qū)3:不用考慮數(shù)據(jù)規(guī)模
1.6.4 誤區(qū)4:不考慮解決方案的可擴展性
1.6.5 誤區(qū)5:隨處使用同樣的方法
1.6.6 誤區(qū)6:總是能知道計算時間
1.6.7 誤區(qū)7:復(fù)雜的模型更好
1.6.8 誤區(qū)8:存在無偏見的模型
1.7 小結(jié)
1.8 參考資料
2 搜索
2.1 用Lucene實現(xiàn)搜索
2.1.1 理解Lucene代碼
2.1.2 搜索的基本步驟
2.2 為什么搜索不僅僅是索引?
2.3 用鏈接分析改進搜索結(jié)果
2.3.1 Page Rank簡介
2.3.2 計算Page Rank向量
2.3.3 alpha:網(wǎng)頁間跳轉(zhuǎn)的影響
2.3.4 理解冪方法
2.3.5 結(jié)合索引分值和Page Rank分值
2.4 根據(jù)用戶點擊改進搜索結(jié)果
2.4.1 用戶點擊初探
2.4.2 樸素貝葉斯分類器的使用
2.4.3 整合Lucene索引、Page Rank和用戶點擊
2.5 Word、PDF等無鏈接文檔的排序
2.5.1 Doc Rank算法簡介
2.5.2 Doc Rank的原理
2.6 大規(guī)模實現(xiàn)的有關(guān)問題
2.7 用戶得到了想要的結(jié)果嗎?精確度和查全率
2.8 總結(jié)
2.9 To Do
2.10 參考資料
3 推薦系統(tǒng)
3.1 一個在線音樂商店:基本概念
3.1.1 距離與相似度的概念
3.1.2 走近相似度的計算
3.1.3 什么才是最好的相似度計算公式?
3.2 推薦引擎是怎么工作的
3.2.1 基于相似用戶的推薦
3.2.2 基于相似條目的推薦
3.2.3 基于內(nèi)容的推薦
3.3 推薦朋友、文章與新聞報道
3.3.1 MyDiggSpace.com簡介
3.3.2 發(fā)現(xiàn)朋友
3.3.3 Digg Delphi的內(nèi)部工作機制
3.4 學(xué)習(xí)推薦電影
3.4.1 電影數(shù)據(jù)集的介紹及推薦器
3.4.2 數(shù)據(jù)標準化與相關(guān)系數(shù)
3.5 大規(guī)模的實現(xiàn)與評估
3.6 總結(jié)
3.7 To Do
3.8 參考資料
4 聚類:事物的分組
4.1 聚類的需求
4.1.1 網(wǎng)站中的用戶組:案例研究
4.1.2 用SQL order by子句分組
4.1.3 用數(shù)組排序分組
4.2 聚類算法概述
4.2.1 基于分組結(jié)構(gòu)的聚類算法分類
4.2.2 基于數(shù)據(jù)類型和結(jié)構(gòu)的聚類算法分類
4.2.3 根據(jù)數(shù)據(jù)規(guī)模的聚類算法分類
4.3 基于鏈接的算法
4.3.1 樹狀圖:基本的聚類數(shù)據(jù)結(jié)構(gòu)
4.3.2 基于鏈接的算法概況
4.3.3 單鏈接算法
4.3.4 平均鏈接算法
4.3.5 最小生成樹算法
4.4 k-means算法
4.4.1 初識k-means算法
4.4.2 k-means的內(nèi)部原理
4.5 魯棒的鏈接型聚類(ROCK)
4.5.1 ROCK簡介
4.5.2 為什么ROCK這么強大?
4.6 DBSCAN
4.6.1 基于密度的算法簡介
4.6.2 DBSCAN的原理
4.7 超大規(guī)模數(shù)據(jù)聚類
4.7.1 計算復(fù)雜性
4.7.2 高維度
4.8 總結(jié)
4.9 To Do
4.10 參考資料
5 分類:把事物放到它該在的地方
5.1 對分類的需求
5.2 分類器的概述
5.2.1 結(jié)構(gòu)分類算法
5.2.2 統(tǒng)計分類算法
5.2.3 分類器的生命周期
5.3 郵件的自動歸類與垃圾郵件過濾
5.3.1 樸素貝葉斯分類
5.3.2 基于規(guī)則的分類
5.4 用神經(jīng)網(wǎng)絡(luò)做欺詐檢測
5.4.1 交易數(shù)據(jù)中關(guān)于欺詐檢測的一個用例
5.4.2 神經(jīng)網(wǎng)絡(luò)概覽
5.4.3 一個可用的神經(jīng)網(wǎng)絡(luò)欺詐檢測器
5.4.4 神經(jīng)網(wǎng)絡(luò)欺詐檢測器剖析
5.4.5 創(chuàng)建通用神經(jīng)網(wǎng)絡(luò)的基類
5.5 你的結(jié)果可信嗎?
5.6 大數(shù)據(jù)集的分類
5.7 總結(jié)
5.8 To Do
5.9 參考資料
6 分類器組合
6.1 信貸價值:分類器組合案例研究
6.1.1 數(shù)據(jù)的簡要說明
6.1.2 為真實問題生成人工數(shù)據(jù)
6.2 用單分類器做信用評估
6.2.1 樸素貝葉斯的基準線
6.2.2 決策樹基準線
6.2.3 神經(jīng)網(wǎng)絡(luò)基線
6.3 在同一個數(shù)據(jù)集中比較多個分類器
6.3.1 Mc Nemar檢驗
6.3.2 差額比例檢驗
6.3.3 Cochran Q檢驗與F檢驗
6.4 Bagging: bootstrap聚合(bootstrap aggregating)
6.4.1 bagging實例
6.4.2 bagging分類器底層細節(jié)
6.4.3 分類器集成
6.5 Boosting:一種迭代提高的方法
6.5.1 boosting分類器實例
6.5.2 boosting分類器底層細節(jié)
6.6 總結(jié)
6.7 To Do
6.8 參考資料
7 智能技術(shù)大匯集:一個智能新聞門戶
7.1 功能概覽
7.2 獲取并清洗內(nèi)容
7.2.1 各就位、預(yù)備、開抓!
7.2.2 搜索預(yù)備知識回顧
7.2.3 一個抓取并處理好的新聞數(shù)據(jù)集
7.3 搜索新聞
7.4 分配新聞類別
7.4.1 順序問題
7.4.2 使用News Processor類進行分類
7.4.3 分類器
7.4.4 分類策略:超越底層的分類
7.5 用News Processor類創(chuàng)建新聞分組
7.5.1 聚類全部文章
7.5.2 在一個新聞類別中聚類文章
7.6 基于用戶評分的動態(tài)內(nèi)容展示
7.7 總結(jié)
7.8 To Do
7.9 參考資料
附錄A Bean Shell簡介
A.1 什么是Bean Shell?
A.2 為什么使用Bean Shell?
A.3 運行Bean Shell
A.4 參考資料
附錄B 網(wǎng)絡(luò)采集
B.1 爬蟲組件概況
B.1.1 采集的步驟
B.1.2 我們的簡單爬蟲
B.1.3 開源Web爬蟲
B.2 參考資料
附錄C 數(shù)學(xué)知識回顧
C.1 向量和矩陣
C.2 距離的度量
C.3 高級矩陣方法
C.4 參考資料
附錄D 自然語言處理
D.1 參考資料
附錄E 神經(jīng)網(wǎng)絡(luò)
E.1 參考資料
索引
免責聲明:
來源于網(wǎng)絡(luò),僅用于分享知識,學(xué)習(xí)和交流!請下載完在24小時內(nèi)刪除。
禁用于商業(yè)用途!請購買正版,謝謝合作。
使用說明
1、下載并解壓,得出pdf文件
2、如果在電腦上打不開pdf文件,別著急,那么您需要先在電腦上下載一個pdf閱讀軟件
3、有pdf閱讀文件直接雙擊即可打開pdf文件
- 下載地址
發(fā)表評論
0條評論軟件排行榜
熱門推薦
- 得間免費小說電腦版 v5.2.7.172.56M / 簡體中文
- 網(wǎng)易新聞電腦版 v112.697.63M / 簡體中文
- 瀟湘書院電腦版 v2.3.11.888官方版49.65M / 簡體中文
- 數(shù)據(jù)挖掘?qū)д?官方版61.61M / 簡體中文
- 吉利博瑞用戶手冊 pdf高清版57.89M / 簡體中文
- 開源閱讀電腦版 v3.2517.96M / 簡體中文
- 京東讀書電腦版 v1.13.4官方版1.98M / 簡體中文
- cnki全球?qū)W術(shù)快報電腦版 v0.2.3495.79M / 簡體中文
- docker入門實戰(zhàn) pdf完整版1.38M / 簡體中文
- Scala程序設(shè)計第二版 pdf高清完整版15.83M / 簡體中文