机械工业出版社本教材首先介绍了数据分析的基本概念和方法,然后通过大量实例介绍了如何使用Matlab实现数据分析,并深入浅出地介绍了数据建模过程中的有关方法。本教材共分8章,主要内容包括:数据的基本概念及其应用、Matlab基础、随机模拟、数据预处理、数据探索与分析、多元线性回归模型、聚类分析和分类。本教材可作为职业院校计算机相关专业的教学用书,也可供相关技术人员参考。
前言
第1章数据的基本概念及其应用
11数据与数据处理
111数据的相关基本概念
112数据处理的主要概念
113数据处理的流程
114数据处理的误区
12数据处理涉及的主要领域
121统计学
122数据挖掘
123云计算
13数据处理的主要方法
131数据采集
132数据预处理
133数据分析
134数据挖掘算法
第2章Matlab基础
21Matlab简介
211Matlab的特点
212Matlab窗口简介
22数组及其运算
221变量和数组
222变量的初始化
223多维数组
224子数组
225单元阵列
226显示输出数据
227数据文件
228数组运算和矩阵运算
229内置函数
23作图入门
231简单的直角坐标系作图
232作图的附加特性
24Matlab程序设计
241关系运算符和逻辑运算符
242选择结构
243循环结构
25自定义函数
第3章随 机 模 拟
31随机数的生成
32蒙特卡罗模拟
321蒙特卡罗模拟估计面积
322蒙特卡罗模拟寻求近似圆周率
323蒙特卡罗模拟解决生日问题
33随机行为的模拟
34蒙特卡罗模拟应用案例:理发店系统研究
Matlab数据分析第1章数据的基本概念及其应用第4章数据预处理
41认识数据
411属性
412离散属性和连续属性
42数据预处理概述
421数据清洗
422数据集成
423数据归约
424数据变换
43Matlab与Excel的数据交互
431以交互方式导入数据
432读取和写入表
433大型文件和大型数据简介
434数据的清理、平滑和分组等
第5章数据探索与分析
51数据的特征统计量
511中心度量趋势:均值、中位数、众数
512常用的变异程度度量
513分布形态
52基本统计描述的可视化
521分类型数据频数分布及其可视化
522直方图
523分位数图和经验累计分布函数
524分位数分位数图——qq图
525箱形图
526散点图
53度量数据的相似性和相异性
531数据矩阵、相异性矩阵、相似性矩阵
532数值属性的相似性:相关系数
533数值属性的相异性:距离
54数据降维——主成分分析
第6章多元线性回归模型
61概述
62一元曲线拟合
621案例1——百货商场销售额
622确定最优拟合
623导出模型到工作空间
63多元线性回归模型
631案例2——牙膏的销售量
632案例3——自变量含有分类变量的处理
64逐步回归模型
第7章聚 类 分 析
71简介
711聚类分析的类型
712聚类分析的依据
72谱系聚类
73k均值聚类
731k均值聚类概述
732k均值聚类算法的Matlab函数
733k均值聚类算法的特点
734k均值聚类算法综合应用
74层次聚类
741概述
742层次聚类算法的Matlab实现
743层次聚类算法的特点
75高斯混合模型聚类
751简介
752高斯混合模型聚类算法的Matlab实现
第8章分类
81分类算法简介
811逻辑回归分类算法
812K近邻分类算法
813支持向量机分类算法
814人工神经网络分类算法
815朴素贝叶斯分类算法
816判别分析分类算法
817决策树分类算法
818集成学习分类算法
82分类的评判
821评判指标
822ROC曲线和AUC
83判别分析分类的具体应用
831判别分析的定义、特点和类型
832距离判别
833贝叶斯判别
84使用Classification Learner App实现分类
参 考 文 献