资源名称:数据挖掘十大算法

内容简介:

《世界著名计算机教材精选:数据挖掘十大算法》详细介绍了在实际中用途最广、影响最大的十种数据挖掘算法,这十种算法是数据挖掘领域的顶级专家进行投票筛选的,覆盖了分类、聚类、统计学习、关联分析和链接分析等重要的数据挖掘研究和发展主题。《世界著名计算机教材精选:数据挖掘十大算法》对每一种算法都进行了多个角度的深入剖析,包括算法历史、算法过程、算法特性、软件实现、前沿发展等,此外,在每章最后还给出了丰富的习题和精挑细选的参考文献,对于读者掌握算法基本知识和进一步研究都非常有价值,对数据挖掘、机器学习和人工智能等学科的课程的设计有指导意义。

资源目录:

第1章C4.5 1

1.1引言2

1.2算法描述3

1.3算法特性6

1.3.1决策树剪枝6

1.3.2连续型属性8

1.3.3缺失值处理8

1.3.4规则集诱导9

1.4软件实现10

1.5示例10

1.5.1 Golf数据集10

1.5.2 Soybean数据集11

1.6高级主题11

1.6.1二级存储12

1.6.2斜决策树12

1.6.3特征选择12

1.6.4集成方法12

1.6.5分类规则13

1.6.6模型重述13

1.7习题14

参考文献15

第2章k-means18

2.1引言19

2.2算法描述19

2.3可用软件22

2.4示例23

2.5高级主题27

2.6小结28

2.7习题28

参考文献29

第3章SVM: 支持向量机31

3.1支持向量分类器32

3.2支持向量分类器的软间隔优化34

3.3核技巧35

3.4理论基础38

3.5支持向量回归器40

3.6软件实现41

3.7当前和未来的研究41

3.7.1计算效率41

3.7.2核的选择41

3.7.3泛化分析42

3.7.4结构化支持向量机的学习42

3.8习题43

参考文献44

第4章Apriori47

4.1引言48

4.2算法描述48

4.2.1挖掘频繁模式和关联规则48

4.2.2挖掘序列模式52

4.2.3讨论53

4.3软件实现54

4.4示例55

4.4.1可行示例55

4.4.2性能评估60

4.5高级主题61

4.5.1改进Apriori类型的频繁模式挖掘61

4.5.2无候选的频繁模式挖掘62

4.5.3增量式方法63

4.5.4稠密表示: 闭合模式和最大模式63

4.5.5量化的关联规则64

4.5.6其他的重要性/兴趣度度量方法65

4.5.7类别关联规则66

4.5.8使用更丰富的形式: 序列、树和图66

4.6小结67

4.7习题67

参考文献68

第5章EM72

5.1引言73

5.2算法描述74

5.3软件实现74

5.4示例75

5.4.1例5.1: 多元正态混合75

5.4.2例5.2: 混合因子分析78

5.5高级主题80

5.6习题81

参考文献87

第6章PageRank90

6.1引言91

6.2算法描述92

6.3一个扩展: Timed-PageRank95

6.4小结96

6.5习题96

参考文献97

第7章AdaBoost98

7.1引言99

7.2算法描述99

7.2.1符号定义99

7.2.2通用推举过程100

7.2.3AdaBoost算法101

7.3示例103

7.3.1异或问题求解103

7.3.2真实数据上的性能104

7.4实际应用105

7.5高级主题107

7.5.1理论问题107

7.5.2多类别AdaBoost110

7.5.3其他高级主题111

7.6软件实现111

7.7习题112

参考文献113

第8章kNN: k-最近邻115

8.1引言116

8.2算法描述116

8.2.1宏观描述116

8.2.2若干议题117

8.2.3软件实现118

8.3示例118

8.4高级主题120

8.5习题121

致谢121

参考文献122

第9章Naive Bayes124

9.1引言125

9.2算法描述125

9.3独立给力127

9.4模型扩展128

9.5软件实现130

9.6示例130

9.6.1例1130

9.6.2例2132

9.7高级主题133

9.8习题133

参考文献134

第10章CART: 分类和回归树136

10.1前身137

10.2概述138

10.3示例138

10.4算法描述140

10.5分裂准则141

10.6先验概率和类别均衡142

10.7缺失值的处理144

10.8属性的重要度145

10.9动态特征构造146

10.10代价敏感学习147

10.11停止准则、剪枝、树序列和树选择147

10.12概率树149

10.13理论基础150

10.14 CART之后的相关研究150

10.15可用软件151

10.16习题152

参考文献153

资源截图:

数据挖掘十大算法