大数据技术是一个面向实际应用的技术。从大数据中获取有价值信息是大数据技术的精髓。本书详细介绍了数据科学与大数据技术的主要内容,全书分为15章,主要包括数据科学与大数据技术概述、数据处理与存储、数据抽取技术、数据清洗技术、数据转换技术、大数据约简技术、数据集成技术、数据分析技术、数据挖掘技术、分析结果解释、大数据机器学习、大数据推荐技术、社会网络、大数据离线计算、大数据流式计算等。本书在内容上,注重概念、方法介绍,实例丰富、语言精练、逻辑层次清晰,可作为大学《数据科学与大数据技术》专业和相近专业的教材,也可以作为科技人员的参考书。
注重基本内容与基本方法的介绍 走进数据科学和大数据技术的大门
1.本书在体例的设计方面,以大数据技术为核心展开。2.在内容的描述方面,注重大数据技术的主要概念、结构和方法的清晰描述。3.在结构上为积木状,各章内容独立地概念性与方法性论述。
陈明,博士生导师,曾任吉林大学计算机科学系副教授、教研室主任;大连理工大学计算机科学与工程系教授、系主任;中国石油大学(北京)计算机科学与技术系教授、系主任。北京高校计算机与信息类专业群专家委员会委员兼教学协作委员会委员。
第1章概述
第2章 大数据获取与存储管理技术
第3章 大数据抽取技术
第4章 大数据清洗技术
第5章 大数据去燥与标准化
第6章 大数据约简技术
第7章 大数据集成技术
第8章 大数据分析
第9章 大数据挖掘技术
第10章 大数据分析结果解释
第11章大数据机器学习
第12章大数据推荐技术
第13章社会网络
第14章 大数据离线计算技术
第15章 大数据流式计算技术
参考文献