定 价:49 元
丛书名:职业教育大数据技术与应用专业产教融合系列教材
- 作者:工业和信息化部教育与考试中心 组编谭志彬 邓立 吴子颖 主编
- 出版时间:2020/11/1
- ISBN:9787111661030
- 出 版 社:机械工业出版社
- 中图法分类:TP274
- 页码:236
- 纸张:
- 版次:
- 开本:16开
本书以某市出租车行业为背景介绍大数据技术在项目中的应用。全书共10章,第1章交通大数据概述,第2章某市出租车实战案例部署,第3章某市出租车项目设计,第4章Python语言基础,第5章数据提取,第6章数据清洗,第7章数据存储,第8章数据分析处理,第9章ECharts的应用,第10章某市出租车综合编程实践。
本书适合作为各类职业院校大数据及相关专业的教材,也可作为大数据开发工程师及其他科技工作者的参考用书。
本书配有电子课件、源代码,选用本书作为授课教材的教师可登录机械工业出版社教育服务网(www.cmpedu.com)注册后免费下载。
前 言
第1章 交通大数据概述........................................1
1.1 大数据概述.......................................................................................3
1.2 大数据处理过程................................................................................5
1.3 交通大数据的来源............................................................................7
1.4 交通大数据的应用............................................................................9
1.5 交通大数据发展面临的挑战.............................................................10
1.6 思考练习........................................................................................11
第2章 某市出租车项目实战案例部署.....................13
2.1 项目背景........................................................................................15
2.2 主要流程........................................................................................15
2.3 项目难点分析.................................................................................16
2.4 数据加载........................................................................................16
2.5 本地开发环境搭建..........................................................................20
2.6 发布Tomcat可视化页面.................................................................31
2.7 数据可视化效果展示.......................................................................34
2.8 思考练习........................................................................................44
第3章 某市出租车项目设计................................45
3.1 数据源...........................................................................................47
3.2 项目整体架构设计..........................................................................48
3.3 选择所需软件.................................................................................49
3.4 Hadoop集群规划...........................................................................49
3.5 大数据ETL过程..............................................................................50
3.6 思考练习........................................................................................53
第4章 Python语言基础...................................55
4.1 Python语言概述............................................................................57
4.2 PyCharm概述...............................................................................58
4.3 Python基础...................................................................................64
4.4 思考练习........................................................................................72
第5章 数据提取...............................................73
5.1 数据爬虫........................................................................................75
5.2 文件数据提取.................................................................................86
5.3 思考练习........................................................................................93
第6章 数据清洗..............................................95
6.1 数据清洗过滤.................................................................................97
6.2 各类格式文件的数据输出..............................................................105
6.3 思考练习......................................................................................110
第7章 数据存储..............................................111
7.1 HDFS加载存储............................................................................113
7.2 Sqoop加载存储...........................................................................116
7.3 思考练习......................................................................................120
第8章 数据分析处理.......................................121
8.1 MapReduce概述.........................................................................123
8.2 MapReduce体系结构..................................................................125
8.3 MapReduce工作流程..................................................................125
8.4 MapReduce开发环境配置...........................................................127
8.5 统计求和......................................................................................139
8.6 全排序.........................................................................................147
8.7 二次排序......................................................................................150
8.8 最值.............................................................................................156
8.9 连接.............................................................................................160
8.10 思考练习....................................................................................163
第9章 ECharts的应用...................................165
9.1 ECharts的基本概念.....................................................................167
9.2 ECharts快速上手........................................................................170
9.3 思考练习......................................................................................190
第10章 某市出租车项目综合编程实践.................193
10.1 项目整体需求分析......................................................................195
10.2 项目架构....................................................................................196
10.3 数据Extract—— 提取格式转换....................................................197
10.4 数据Transform—— 数据过滤.....................................................198
10.5 数据Transform—— 补充空数据..................................................201
10.6 数据Load—— 文件HDFS存储....................................................203
10.7 数据Transform—— MapReduce...............................................204
10.8 数据Load—— Sqoop导出数据...................................................218
10.9 数据可视化................................................................................220
10.10 思考练习..................................................................................229
参考文献......................................................230