欢迎来到传智教育旗下图书库

大数据项目实战

黑马程序员/编著
定价:¥39.00

出版社:清华大学出版社

ISBN:978-7-302-55093-8

图书种类:高校教材

出版日期:2020-03

所属学科:大数据

页数:142

咨询客服 查看配套资源

关注获取新书发布信息

内容简介

本书贯穿讲解了一个大数据综合项目——招聘网站职位分析。全书共分为6章,分别是项目概述、搭建大数据集群环境、数据采集、数据预处理、数据分析与数据可视化。

适合群体

本书适用于高等院校本、专科计算机相关专业学校大数据项目实训课程的教学,书中的具体项目,有助于读者综合运用大数据课程知识及各种工具软件,实现大数据分析全流程操作。

图书特色

本书旨在令读者具备Hadoop生态系统的分析能力,并能够构建强大的解决方案来执行大数据分析,同时毫不费力地从大数据分析结果中获得敏锐的洞察力。本书涉及Java语言、HadoopHiveSqoop的综合运用,同时实现了大数据分析的可视化结果。本书适合Hadoop的初学者阅读,也可以作为高等院校相关课程的教学参考书。读者不仅能够通过项目实战巩固基础知识的学习效果,还能学习商业智能系统的开发过程。

特色1 完整呈现大数据项目开发整体流程

特色2:模拟真实项目的设计过程

特色3:代码内容详细讲解,使读者更易理解

特色4:从原始的杂乱数据到最终的可视化数据展示

特色5:教材、资源、服务三合一

配套资源
图书目录
第1章	项目概述
1.1	项目需求和目标
1.2	预备知识
1.3	项目架构设计及技术选取
1.4	开发环境和开发工具介绍
1.5	项目开发流程
1.6	本章小结

第2章 搭建大数据集群环境
2.1	安装准备
2.1.1虚拟机安装与克隆
2.1.2虚拟机网络配置
2.1.3SSH服务配置
2.2	Hadoop集群搭建
2.2.1 JDK安装
2.2.2Hadoop安装
2.2.3Hadoop集群配置
2.2.4Hadoop集群测试
2.2.5通过UI界面查看Hadoop运行状态
2.3	Hive安装
2.3.1Hive的安装模式
2.3.2Hive的安装
2.4	Sqoop安装
2.5	本章小结

第3章	数据采集
3.1	知识概要
3.1.1	数据源分类
3.1.2	HTTP请求过程
3.1.3	认识HttpClient
3.2	分析与准备
3.2.1 分析网页数据结构
3.2.2 数据采集环境准备
3.3	采集网页数据
3.3.1 创建响应结果JavaBean类
3.3.2 封装HTTP请求的工具类
3.3.3 封装存储在HDFS数据工具类
3.3.4 实现网页数据采集
3.4	本章小结

第4章	数据预处理
4.1	分析预处理数据
4.2	设计数据预处理方案
4.3	实现数据的预处理
4.3.1	数据预处理环境准备
4.3.2	创建数据转换类
4.3.3	创建实现Map任务的Mapper类
4.3.4	创建MapReduce程序执行程序
4.4	将数据预处理程序提交到集群中运行
4.5	本章小结

第5章	数据分析
5.1	数据分析概述
5.2	Hive数据仓库
5.2.1	什么是Hive
5.2.2	设计Hive数据仓库
5.2.3	实现数据仓库
5.3	分析数据
5.3.1	职位区域分析
5.3.2	职位薪资分析
5.3.3	公司福利分析
5.3.4	职位技能要求分析
5.4	本章小结

第6章	数据可视化
6.1	平台概述
6.1.1	系统介绍
6.1.2	系统架构
6.2	数据迁移
6.2.1	创建关系型数据库
6.2.2	通过Sqoop实现数据迁移
6.3 平台环境搭建
6.3.1	新建Maven项目
6.3.2	配置pom.xml文件
6.3.3	项目组织结构
6.3.4	编辑配置文件
6.4 实现图形化展示功能
6.4.1	实现职位区域分布展示
6.4.2	实现薪资分布展示
6.4.3	实现福利标签词云图
6.4.4	实现技能标签词云图
6.4.5	平台可视化展示
6.5 本章小结

展开全部内容

热销图书推荐

HBase基础入门

清华大学出版社

定价:¥59.00 咨询客服

Java程序设计任务驱动教程

高等教育出版社

定价:¥55.00 咨询客服

C语言程序设计项目化教程

高等教育出版社

定价:¥55.00 咨询客服