版权信息
内容简介
自序
前言
第1章 引言
1.1 机器学习的目的:从数据到知识
1.2 机器学习的基本框架
1.2.1 数据集合与对象特性表示
1.2.2 学习判据
1.2.3 学习算法
1.3 机器学习思想简论
延伸阅读
习题
第2章 归类理论
2.1 类表示公理
2.2 归类公理
2.3 归类结果分类
2.4 归类方法设计准则
2.4.1 类一致性准则
2.4.2 类紧致性准则
2.4.3 类分离性准则
2.4.4 奥卡姆剃刀准则
讨论
延伸阅读
习题
参考文献
第3章 密度估计
3.1 密度估计的参数方法
3.1.1 最大似然估计
3.1.2 贝叶斯估计
3.2 密度估计的非参数方法
3.2.1 直方图
3.2.2 核密度估计
3.2.3 K近邻密度估计法
延伸阅读
习题
第4章 回归
4.1 线性回归
4.2 岭回归
4.3 Lasso回归
讨论
习题
第5章 单类数据降维
5.1 主成分分析
5.2 非负矩阵分解
5.3 字典学习与稀疏表示
5.4 局部线性嵌入
5.5 典型关联分析
5.6 多维度尺度分析与等距映射
讨论
习题
参考文献
第6章 聚类理论
6.1 聚类问题表示及相关定义
6.2 聚类算法设计准则
6.2.1 类紧致性准则和聚类不等式
6.2.2 类分离性准则和重合类非稳定假设
6.2.3 类一致性准则和迭代型聚类算法
6.3 聚类有效性
6.3.1 外部方法
6.3.2 内蕴方法
延伸阅读
习题
第7章 聚类算法
7.1 样例理论:层次聚类算法
7.2 原型理论:点原型聚类算法
7.2.1 C均值算法
7.2.2 模糊C均值
7.3 基于密度估计的聚类算法
7.3.1 基于参数密度估计的聚类算法
7.3.2 基于无参数密度估计的聚类算法
延伸阅读
习题
第8章 分类理论
8.1 分类及相关定义
8.2 从归类理论到经典分类理论
8.2.1 PAC理论
8.2.2 统计学习理论
8.3 分类测试公理
讨论
习题
第9章 基于单类的分类算法:神经网络
9.1 分类问题的回归表示
9.2 人工神经网络
9.2.1 人工神经网络相关介绍
9.2.2 前馈神经网络
9.3 从参数密度估计到受限玻耳兹曼机
9.4 深度学习
9.4.1 自编码器
9.4.2 卷积神经网络
讨论
习题
参考文献
第10章 K近邻分类模型
10.1 K近邻算法
10.1.1 K近邻算法问题表示
10.1.2 K近邻分类算法
10.1.3 K近邻分类算法的理论错误率
10.2 距离加权最近邻算法
10.3 K近邻算法加速策略
10.4 kd树
10.5 K近邻算法中的参数问题
延伸阅读
习题
第11章 线性分类模型
11.1 判别函数和判别模型
11.2 线性判别函数
11.3 线性感知机算法
11.3.1 感知机数据表示
11.3.2 感知机算法的归类判据
11.3.3 感知机分类算法
11.4 支持向量机
11.4.1 线性可分支持向量机
11.4.2 近似线性可分支持向量机
11.4.3 多类分类问题
讨论
习题
参考文献
第12章 对数线性分类模型
12.1 Softmax回归
12.2 Logistic回归
讨论
习题
参考文献
第13章 贝叶斯决策
13.1 贝叶斯分类器
13.2 朴素贝叶斯分类
13.2.1 最大似然估计
13.2.2 贝叶斯估计
13.3 最小化风险分类
13.4 效用最大化分类
讨论
习题
第14章 决策树
14.1 决策树的类表示
14.2 信息增益与ID3算法
14.3 增益比率与C4.5算法
14.4 Gini指数与CART算法
14.5 决策树的剪枝
讨论
习题
参考文献
第15章 多类数据降维
15.1 有监督特征选择模型
15.1.1 过滤式特征选择
15.1.2 包裹式特征选择
15.1.3 嵌入式特征选择
15.2 有监督特征提取模型
15.2.1 线性判别分析
15.2.2 二分类线性判别分析问题
15.2.3 二分类线性判别分析
15.2.4 二分类线性判别分析优化算法
15.2.5 多分类线性判别分析
延伸阅读
习题
参考文献
第16章 多类数据升维:核方法
16.1 核方法
16.2 非线性支持向量机
16.2.1 特征空间
16.2.2 核函数
16.2.3 常用核函数
16.2.4 非线性支持向量机
16.3 多核方法
讨论
习题
参考文献
第17章 多源数据学习
17.1 多源数据学习的分类
17.2 单类多源数据学习
17.2.1 完整视角下的单类多源数据学习
17.2.2 不完整视角下的单类多源数据学习
17.3 多类多源数据学习
17.4 多源数据学习中的基本假设
讨论
习题
后记
索引