零基础大数据就业课程(零到大神一“部”之遥)

零基础大数据就业课程

默认教学计划
(5人评价)
价格 ¥2400.00 ¥ 4800.00 5折
活动
教学计划
课程介绍

本套课程是风舞烟老师团队历时四个月打造的一套完整系列大数据就业课程!从零到大神,您只差这一‘部’之遥!

 

官方唯一指定风舞烟大数据课程VIP答疑交流QQ群:651173191(付费学员请联系网站客服申请入群)

 

一、课程大纲:
课程分2大模块,14个课程,65章,共计856课时!

一、Java模块课程
课程一、【大数据必知必会】- Java负基础扫盲篇
01、Java基础语法、变量、数据类型和运算符
02、选择结构
03、循环结构
04、循环结构进阶
05、数组

 

课程二、【大数据必知必会】- Java OOP面向对象编程
06、类和对象、方法
07、项目人机猜拳
08、项目DVD管理系统
09、继承、封装、多态
10、多态、接口
11、项目实战:劲舞团
12、异常、日期类、集合、泛型集合
13、Java IO流技术 & XML操作


课程三、【大数据必知必会】- MySQL数据库开发
14、MySQL数据库--初始MySQL
15、MySQL数据库--SQL进阶
16、MySQL数据库--多表查询及存储过程

 

课程四、【大数据必知必会】- Java核心编程
17、Java中利用JDBC操作数据库
18、项目案例:基于JDBC+MySQL实现图书管理系统
19、多线程编程基础
20、多线程高级编程
21、网络编程

 

课程五、【大数据必知必会】- Java高级特性
22、Java高级特性-反射、序列化
23、项目案例(5):即时聊天系统
24、Git版本控制系统、Maven项目管理构建工具
25、项目实战:小型商品进销存管理系统

 

二、大数据模块课程
课程六、【大数据开发基础】- LINUX 课程
26、环境及基本操作
27、Linux 常见命令的使用
28、Linux 软件安装及Shell编程


课程七、【大数据分布式基础架构】- HADOOP详解
29、Hadoop介绍及伪分布式环境
30、MapReduce编程及运行流程
31、网站案例分析及Hadoop分布式集群环境
32、MapReduceShuffle及Zookeeper框架
33、HDFS HA及二次排序
34、YARN 资源管理及MapReduce Join

 

课程八、【大数据仓库】- HIVE 详解
35、Hive 基本架构及环境部署
36、Hive 常用DML、UDF及连接方式
37、Sqoop Sqoop及用户行为分析案例
38、Hive 复杂用户行为案例分析及优化
39、Zeus 任务资源调度工具

 

课程九、【大数据分布式开源数据】- HBASE从入门到精通
40、Hbase  基本使用及存储设计
41、Hbase  企业应用及与MapReduce集成
42、案例:Hbase的设计及企业优化

 

课程十、【大数据可视化技术】- Echarts详解
43、大数据可视化技术:可视化技术概述与Echarts入门
44、大数据可视化技术:Echarts图表详解
45、大数据可视化技术:Echarts高级与综合案例实战

 

课程十一、【HADOOP 项目实战】
46、大数据离线项目:企业大数据项目业务及设计
47、大数据离线项目:数据采集框架Flume
48、大数据离线项目:Nginx+Flume实现数据采集
49、大数据离线项目:ETL的业务分析及实现(一)
50、大数据离线项目:ETL的业务分析及实现(二)
51、大数据离线项目:数据分析的思路及代码实现
52、大数据离线项目:Hourly分析及可视化展示

 

课程十二、【Spark从入门到上手实战】 - Spark课程
53、SPARK 数据分析:SCALA编程(一)
54、SPARK 数据分析:SCALA编程(二)
55、SPARK 数据分析:Spark Core(一)
56、SPARK 数据分析:Spark Core(二)
57、SPARK 数据分析:Spark SQL
58、SPARK 数据分析:Spark Streaming及Kafka
59、SPARK 数据分析:基于Java和Python的Spark编程

 

课程十三、【实时流式计算框架】- Storm技术详解
60、storm:架构、环境及使用
61、storm:Trident使用
62、storm:电商实时销售统计

 

课程十四、【大数据企业平台应用】
63、高薪面试:企业大数据平台(一)
64、高薪面试:企业大数据平台(二)
65、高薪面试:大数据面试


课程详细目录:

第1章: Java基础语法、变量、数据类型和运算符
任务1: 大纲
任务2: Java光速入门引言
任务3: Java简介
任务4: Java程序开发工具及环境
任务5: 开发Java程序步骤
任务6: 使用记事本开发Java程序
任务7: 从控制台输出信息
任务8: 使用Eclipse开发Java程序
任务9: 总结
任务10: 变量数据类型和运算符前言
任务11: 数据类型
任务12: 变量
任务13: 运算符
任务14: 类型转换
任务15: 总结及作业


第2章: 选择结构
任务16: 选择结构前言 
任务17: boolean类型
任务18: 关系运算符
任务19: 选择结构简介
任务20: 单分支结构
任务21: 复合条件选择结构
任务22: 双分支选择结构
任务23: 三目运算符
任务24: 基本if选择结构小结
任务25: 多重if选择结构
任务26: 嵌套if选择结构
任务27: switch选择结构
任务28: 总结及作业


第3章: 循环结构
任务29: 循环结构前言
任务30: 为什么需要循环
任务31: 循环结构简介
任务32: while循环结构
任务33: 程序调试
任务34: while小结 
任务35: do-while循环
任务36: dowhile小结
任务37: for循环结构
任务38: for小结
任务39: break语句
任务40: continue语句
任务41: 循环总结


第4章: 循环结构进阶
任务42: 循环结构进阶前言 
任务43: 为什么使用二重循环及二重循环概念
任务44: 如何使用二重循环
任务45: 在二重循环中使用continue
任务46: 在二重循环中使用break
任务47: 二重循环补充案例
任务48: 二重循环总结及作业


第5章: 数组
任务49: 数组前言 
任务50: 学习数组的原因及数组的概念
任务51: 如何使用数组
任务52: 数组应用-1
任务53: 数组应用-2
任务54: 数组应用-3
任务55: 数组应用-4
任务56: 一维数组小结
任务57: 二维数组简介及定义
任务58: 遍历和使用二维数组
任务59: 数组总结


第6章: 类和对象、方法
任务60: 类对象方法导入
任务61: 对象
任务62: 类的创建和对象的创建-1
任务63: 类的创建和对象的创建-2
任务64: 课堂练习1和2
任务65: 课堂练习3和4
任务66: 类小结
任务67: 类的方法-1
任务68: 类的方法-2
任务69: 成员变量和局部变量
任务70: 有参方法-1
任务71: 有参方法-2
任务72: 有参方法小结
任务73: 本章总结


第7章: 项目人机猜拳
任务74: 阶段练习1
任务75: 阶段练习2
任务76: 阶段练习3
任务77: 阶段练习4
任务78: 阶段练习5及6


第8章: 项目DVD管理系统
任务79: 阶段练习1
任务80: 阶段练习2
任务81: 阶段练习3
任务82: 阶段练习4
任务83: 阶段练习5
任务84: 阶段练习6
任务85: 阶段练习7


第9章: 继承、封装、多态
任务86: 引言
任务87: 封装
任务88: 构造方法
任务89: 重载
任务90: 继承-1
任务91: 继承-2
任务92: 继承-3
任务93: 继承-4
任务94: 抽象类-1
任务95: 抽象类-2
任务96: 抽象类-3
任务97: 重写
任务98: 综合案例-1
任务99: 综合案例-2


第10章: 多态、接口
任务100: 为什么使用多态
任务101: 多态的概念及使用
任务102: 为什么使用接口及接口的概念
任务103: 接口的使用


第11章: 项目实战:劲舞团
任务104: 项目需求及效果展示
任务105: 第一关:游戏输出字符串设计
任务106: 第二关:各级别游戏参考初始化
任务107: 第三关:玩家闯关
任务108: 第四关:最终闯关结果确认
任务109: 项目总结


第12章: 异常、日期类、集合、泛型集合
任务110: Java中的枚举
任务111: Java中的包装类(上)
任务112: Java中的包装类(下)
任务113: Java中的String类详解
任务114: Java中的StringBuffer类详解
任务115: Java中的如何操作日期时间
任务116: 什么是Java中的异常
任务117: Java中的异常处理(上)
任务118: Java中的异常处理(下)
任务119: 实例演示Java中的异常处理
任务120: Java异常的分类及throw的异常处理
任务121: 常见Java集合框架概述
任务122: List接口及方法说明
任务123: ArrayList及LinkedList详解
任务124: 实例演示ArrayList及LinkedList的异同
任务125: Map接口与HashMap
任务126: 集合的迭代器与泛型集合初探
任务127: 集合综合实例与练习
任务128: 泛型简介
任务129: 如何定义与调用一个泛型类及泛型方法
任务130: 泛型类及泛型方法的使用实例
任务131: 如何定义一个泛型集合
任务132: 泛型集合实例_新闻发布系统01
任务133: 泛型集合实例_新闻发布系统02
任务134: 泛型集合实例_新闻发布系统03
任务135: 泛型集合之Map接口与HashMap类
任务136: 泛型集合之Map接口与HashMap类的遍历
任务137: 泛型总结


第13章: Java IO流技术 & XML操作
任务138: 本章简介
任务139: JAVA IO流之Properties类操作环境变量及系统变量
任务140: JAVA IO流之Properties类读写properties类型配置文件
任务141: JAVA IO流之Properties类读写xml类型配置文件
任务142: JAVA IO流之File类操作文件API精讲
任务143: JAVA IO流之File类操作目录API精讲
任务144: JAVA IO流之利用FilenameFilter类实现文件名过滤
任务145: JAVA IO流之利用RandomAccessFile类实现随机文件访问
任务146: JAVA IO流之体系结构总括
任务147: JAVA IO流-字符流之利用FileReader类读取数据
任务148: JAVA IO流-字符流之利用FileWriter类写入数据
任务149: JAVA IO流-字符流之利用LineNumberReader行式读取数据并自动编号
任务150: JAVA IO流-字节流之利用FileInputStream按指定编码读取数据
任务151: 字节流之利用DataInputStream&DataOutputStream操作数据
任务152: 字节流之利用ObjectInputStream&ObjectOutputStream操作数据
任务153: JAVA IO流-字节流之装饰(包装)流简介
任务154: 包装流之实例演示字符包装流对文本文件的读写文件操作
任务155: 包装流之实例演示字节包装流对二进制文件的读写操作
任务156: JAVA IO流小结
任务157: JAVA操作XML之总括
任务158: JAVA操作XML之Dom解析实例演示
任务159: JAVA操作XML之Sax解析简述
任务160: JAVA操作XML之Sax解析实例演示
任务161: JAVA操作XML之Dom与Sax解析的优缺点比较
任务162: JAVA操作XML小结


第14章: MySQL数据库--初始MySQL
任务163: 安装MySQL
任务164: 使用CMD登录mysql
任务165: 数据库数据类型
任务166: 约束
任务167: navicat介绍
任务168: navicat创建数据库
任务169: navicat填充数据
任务170: 课后作业介绍
任务171: 新建数据库


第15章: MySQL数据库--SQL进阶
任务172: 创建数据表
任务173: insert_into
任务174: delete_from
任务175: update
任务176: select
任务177: where
任务178: orderby
任务179: groupby
任务180: 课后练习


第16章: MySQL数据库--多表查询及存储过程
任务181: 连接查询
任务182: 子查询
任务183: 存储过程
任务184: 课后练习


第17章: Java中利用JDBC操作数据库
任务185: JDBC工作原理
任务186: JDBC连结MySQL数据库
任务187: 使用JDBC的Statement对象添加数据
任务188: 使用JDBC的Statement对象修改及删除数据
任务189: 使用JDBC的Statement和ResultSet对象实现数据的查询
任务190: Staement及ResultSet小结
任务191: 利用PreparedStaement操作数据
任务192: 本章总结


第18章: 项目案例:基于JDBC+MySQL实现图书管理系统
任务193: 项目简介
任务194: 数据库的设计与实现
任务195: 项目整体代码框架搭建
任务196: 系统通用工具包类的实现
任务197: 封装系统实体类
任务198: 系统访问层接口的设计
任务199: SQLHelp数据访问层工具类
任务200: 封装用户表的数据访问类
任务201: 封装图书表的数据访问类
任务202: 用户管理的业务逻辑层代码实现
任务203: 图书管理的业务逻辑层代码实现
任务204: 视图功能_实现用户登录权限菜单显示
任务205: 视图功能_实现图书入库操作
任务206: 视图功能_实现图书出库操作
任务207: 视图功能_根据图书的ISBN号进行查询操作
任务208: 视图功能_获取系统所有图书信息
任务209: 本章总结


第19章: 多线程编程基础
任务210: 进程与线程的概念及原理简介
任务211: 扩展Thread类实现多线程
任务212: 通过Runnable接口实现Thread类创建
任务213: Java多线程Thread与Runnable的区别
任务214: 关于多线程的创建启动的常见问题
任务215: 线程的生命周期概述
任务216: 线程睡眠(Sleep)方法示例
任务217: 线程让步(yield)方法示例
任务218: 线程插队(join)方法示例
任务219: 线程状态转换小结

 

第20章: 多线程高级编程
任务220: 利用synchronized同步解决多线程冲突问题
任务221: 线程的同步与锁的注意事项
任务222: 线程的静态方法同步
任务223: 线程的死锁现象及注意事项
任务224: 线程的同步小结
任务225: 线程的等待、通知模型使用示例1
任务226: 线程的等待、通知模型使用示例2
任务227: 线程协作之经典场景:生产者消费者模型
任务228: 线程调度之守护线程
任务229: Java线程新特性-线程池-固定大小的线程池
任务230: Java线程新特性-线程池-单任务线程池
任务231: Java线程新特性-线程池-可变尺寸的线程池
任务232: Java线程新特性-线程池-延迟线程池
任务233: Java线程新特性-线程池-自定义线程池
任务234: Java线程新特性-有返回值类型的线程
任务235: Java线程新特性-利用锁实现线程防并发操作
任务236: Java线程新特性-利用读写锁实现线程防并发操作
任务237: Java线程新特性-阻塞队列&阻塞栈
任务238: 本章总结

 

第21章: 网络编程
任务239: 本章目标及任务
任务240: 网络编程理论基础01
任务241: 网络编程理论基础02
任务242: Java网络编程入门_InetAddress类
任务243: Java网络编程入门_Url类mp4
任务244: 编写Socket程序的一般步骤
任务245: Socket编程简单示例
任务246: Socket编程复杂示例
任务247: 文件传输示例
任务248: Socket编程_聊天小程序
任务249: UDP编程_基于UDP实现的数据通信范例
任务250: 本章总结

 

第22章: Java高级特性-反射、序列化
任务251: 什么是序列化及为什么需要序列化?
任务252: seriaVersionUID的作用与动态生成
任务253: Java中的二进制序列化反序列化实例演示
任务254: Java中的利用xStream进行Xml序列化与反序列化实例演示
任务255: Java中的利用Externalizable接口实现对象的序列化控制
任务256: Java反射概述
任务257: Java中如何进行反射操作相关类简介
任务258: Java反射Class类的使用示例
任务259: Java反射Constructor类的使用示例
任务260: Java反射Field类的使用示例
任务261: Java反射Method类的使用示例
任务262: Java反射综合案例01_通用ToStringUtil类
任务263: Java反射综合案例02_利用反身实现Java类的反编译
任务264: Java反射综合案例03_利用反射实现多数据库切换
任务265: 本章小节

 

第23章: 项目案例(5):即时聊天系统
任务266: 项目案例:即时聊天系统_项目需求
任务267: 项目案例:即时聊天系统_原理剖析
任务268: 项目案例:即时聊天系统_代码实现_编写服务端代码框架
任务269: 代码实现_服务器端登记客户端线程操作
任务270: 代码实现_服务器端ServerThread初始化输入输出流
任务271: 代码实现_服务器端向客户端群发消息
任务272: 代码实现_客户端代码框架实现
任务273: 代码实现_客户端向服务器发送消息
任务274: 代码实现_客户端读取服务器消息
任务275: 项目案例_总结


第24章: Git版本控制系统、Maven项目管理构建工具
任务276: 本章目标
任务277: Git版本控制工具_什么是Git及版本控制的概念
任务278: Git与SVN的比较
任务279: Git的下载与安装
任务280: Git命令代码补全及帮助查看
任务281: Git基本全局配置
任务282: 为Git命令配置别名
任务283: Git基本的工作原理
任务284: Git实战案例(1)_初始化Git仓库并提交内容
任务285: Git实战案例(2)_修改本地内容并向本地服务器提交
任务286: Git实战案例(3)_演示版本回退操作
任务287: Git实战案例(4)_演示代码的撤消修改操作
任务288: Git实战案例(5)_演示文件的删除及还原操作
任务289: GitHub专题_课题导入
任务290: GitHub专题_帐号创建
任务291: 为远程数据仓库配置SSH Key
任务292: Git本地仓库关联远程服务器
任务293: 克隆远程仓库到本地
任务294: Gihub上如何参与开源项目?
任务295: Git总结
任务296: Maven项目构建工具_Maven简介
任务297: Maven项目构建工具_Maven基本工作原理
任务298: Maven安装配置
任务299: Maven常用命令与实例快速上手
任务300: Maven基本配置与简单依赖关系
任务301: Eclipse中Maven插件的安装配置
任务302: Eclipse中如何创建及导入Maven项目
任务303: Eclipse中如何运行Maven命令完成自动化构建
任务304: Maven总结

 

第25章: 项目实战:小型商品进销存管理系统
任务305: 项目实战:小型商品进销存管理系统_项目需求
任务306: 技术分析
任务307: 数据库设计
任务308: Excel原始数据导入MySQL
任务309: 员工信息管理_员工入职操作
任务310: 员工信息管理_开除与员工加薪操作
任务311: 员工信息管理_复杂嵌套子查询操作
任务312: 员工信息查询_实现员工信息统计分析及分页查询
任务313: 员工信息查询_实战分组、聚合、过滤与排序
任务314: 查询比平均单价高的产品
任务315: 查询哪些客户没有购买记录
任务316: 查询销售数量最多的产品信息
任务317: 查询销售额最多的产品并扩展复杂多表查询
任务318: 为签单最多的员工做加薪操作
任务319: 订单详细信息展示(六表复杂关联演示)
任务320: 查询采购金额最多的前三名客户(多表关联&嵌套子查询)
任务321: 对客户按订单数量进行排序操作
任务322: 对产品种类统计数量并排序
任务323: 代码实现_实体类编写
任务324: 代码实现_项目框架搭建及ViewModel构建
任务325: 代码实现_数据访问层代码实现(一)
任务326: 代码实现_数据访问层代码实现(二)
任务327: 代码实现_数据访问层代码实现(三)
任务328: 代码实现_业务逻辑层代码实现(一)
任务329: 代码实现_业务逻辑层代码实现(二)
任务330: 代码实现_界面层代码实现(一)
任务331: 代码实现_界面层代码实现(二)
任务332: 代码实现_界面层代码实现(三)
任务333: 代码实现_界面层代码实现(四)
任务334: 项目总结

 

第26章: Linux 环境及基本操作
任务335: Linux的发展及其介绍
任务336: Linux系统安装的环境准备
任务337: Centos6.4的安装过程
任务338: Linux中主机名的修改
任务339: Linux中网络的配置
任务340: Linux与Windows本地网络映射的配置
任务341: 远程工具-SecureCRT与FileZilla的使用
任务342: 远程工具-Notepad++与Xmanager的使用
任务343: Linux文件系统的目录结构
任务344: Linux基本操作命令
任务345: Linux文件管理-创建、删除
任务346: Linux文件管理-复制、剪切、查看
任务347: Linux用户及用户组管理
任务348: Linux权限管理
任务349: Linux中修改用户及用户组及常见符号

 

第27章: Linux 常见命令的使用
任务350: 文本编辑工具vim的介绍
任务351: 文本编辑工具vim的常见操作
任务352: 帮助命令man与文件检索命令find的使用
任务353: visudo的配置及使用讲解
任务354: Linux中硬盘与存储结构的讲解
任务355: 磁盘管理-创建主分区并挂载可用
任务356: 磁盘管理-创建逻辑分区并挂载可用
任务357: 网络管理及进程管理命令
任务358: Linux中的压缩管理
任务359: 关机与虚拟机的克隆

 

第28章: Linux软件安装及Shell编程
任务360: Linux软件安装-RPM
任务361: Linux软件安装-YUM
任务362: Shell编程-环境变量与位置变量
任务363: Shell编程-预定义变量与自定义变量
任务364: Shell编程-通配符与正则表达式
任务365: Shell编程-逻辑关联符号及数值运算
任务366: Shell编程-内置判断表达式及date命令
任务367: Shell编程-for循环的使用
任务368: Shell编程-while循环的使用及read命令
任务369: Shell编程-if判断语句及case语句
任务370: Linux定时任务at与crontab

 

第29章: Hadoop介绍及伪分布式环境
任务371: 学习大数据HADOOP框架重点及培养三大能力
任务372: 大数据是什么及HADOOP发展史及企业架构
任务373: HADOOP诞生、组件概览及版本说明
任务374: 分布式概念及HDFS架构存储详解
任务375: YARN架构及MapReduce编程模型、运行在YARN上的过程详解
任务376: HADOOP部署三种模式及企业集群配置、HADOOP下载地址
任务377: HADOOP安装前Linux系统环境配置及JDK安装
任务378: 伪分布式:hadoop安装目录及配置HDFS详解
任务379: 伪分布式:启动HDFS服务、熟悉DFS文件操作命令及测试
任务380: 伪分布式:配置YARN及启动服务
任务381: 伪分布式:配置MapReduce的WordCount运行在YARN及查看结果

 

 


第30章: MapReduce编程及运行流程
任务382: Hadoop伪分布式环境部署要点、常见错误详解及如何查看日志信息
任务383: HDFS中NameNode启动过程及SNN功能详解
任务384: HADOOP默认配置文件及常见属性配置
任务385: MapReduce中的历史服务启动配置及启动YARN的日志聚集功能
任务386: 配置SSH无秘钥登录及start-dfs和start-yarn启动服务
任务387: Hadoop默认本地库的替换及源码编译
任务388: HDFS概念深入及Client访问数据流程
任务389: Linux环境下安装Maven和Eclipse、创建Maven工程及配置
任务390: NameNode启动过程中的SafeMode详解
任务391: MapReduce框架的编程模型(以WordCount为例)
任务392: 编写MapReduce编程模板(Mapper、Reducer及Driver)
任务393: 编程实现WordCount程序及本地测试
任务394: 打包测试运行WordCount程序在YARN及总结开发MapReduce程序的步骤

 


第31章: 网站案例分析及Hadoop分布式集群环境
任务395: MapReduce框架处理数据的流程及几点注意
任务396: 编写MapReduce编程模块
任务397: MapReduce数据类型及自定义数据类型
任务398: 案例:网站基本指标分析(一)
任务399: 案例:网站基本指标分析(二)
任务400: 分布式安装部署:克隆虚拟机及配置网络
任务401: 分布式安装部署:集群基本配置及服务运行规划
任务402: 分布式安装部署:集群机器时间同步
任务403: 分布式安装部署:依据规划配置与分发安装包
任务404: 分布式安装部署:启动HDFS、YARN服务及测试程序
任务405: 分布式安装部署:配置主从节点之间的SSH无密钥登录

 

 

第32章: MapReduceShuffle及Zookeeper框架
任务406: MapReduce框架处理数据五步走详解
任务407: MapReduce Shuffle过程详解(结合案例)
任务408: MapReduceShuffle优化设置及Combiner和Compress设置
任务409: MapReduce程序设置Reduce Number为0详解
任务410: YARN运行Application原理内核详解
任务411: HADOOP Client详解(配置信息分类)
任务412: Zookeeper介绍及单机模式安装启动测试
任务413: 分布式集群安装部署测试

 

 

第33章: HDFS HA及二次排序
任务414: Hadoop高级课程说明及企业级HDFS集群架构
任务415: HDFS HA架构详解(作图说明)
任务416: 依据官方文档对HDFS HA.进行配置、部署和分发
任务417: 配置HDFS HA自动故障转移及测试
任务418: HADOOP 2.x中其他特性说明(HDFS Federation及RM HA)
任务419: 引出二次排序及实现二次排序的思路
任务420: 编程实现自定义数据类型PairWritable、自定义分区类及自定分组比较器
任务421: 编写二次排序的MapReduce及测试(设置多个ReduceTask)

 


第34章: YARN 资源管理及MapReduce Join
任务422: 分布式资源框架YARN深入详解(对于HADOOP 1.x的MapReduce框架)
任务423: YARN资源管理配置(CPU及Memory)和Schedule策略
任务424: MapReduceJoin总览及Map Join思路和实现详解
任务425: 结合案例讲解Reduce Join及测试运行
任务426: 企业级MapReduce面试题(去哪儿网)及数据分析流程
任务427: 使用XMind思维导图复习HADOOP知识点

 

 

第35章: Hive基本架构及环境部署
任务428: MapReduce分析与SQL分析对比
任务429: Hive的介绍及其发展
任务430: Hive的安装部署及启动
任务431: Hive的基本架构讲解
任务432: 安装MySQL作为元数据库存储
任务433: 配置Hive使用MySQL作为元数据库存储
任务434: Hive中基本命令的使用
任务435: Hive中常用的属性配置
任务436: Hive中常用的交互式命令
任务437: Hive中数据库的管理与使用
任务438: Hive中表的管理与使用
任务439: Hive中外部表的使用

 

 

第36章: Hive常用DML、UDF及连接方式
任务440: Hive中分区表的介绍
任务441: Hive中分区表的创建及使用
任务442: Hive中数据导入的6种方式及其应用场景
任务443: Hive中数据导出的4种方式及表的导入导出
任务444: Hive中HQL的基本语法(一)
任务445: Hive中HQL的基本语法(二)
任务446: Hive中order by、sort by、distribute by与cluster by的使用
任务447: Hive中分析函数与窗口函数
任务448: Hive中UDF的介绍
任务449: Hive中使用自定义UDF实现日期格式转换
任务450: HiveServer2的介绍及三种连接方式
任务451: Hive元数据、fetch task和严格模式的介绍

 

 

第37章: Sqoop Sqoop及用户行为分析案例
任务452: CDH版本框架的介绍
任务453: CDH版本框架的环境部署
任务454: Sqoop的介绍及其实现原理
任务455: Sqoop的安装部署及连接测试
任务456: Sqoop将MySQL数据导入到HDFS(一)
任务457: Sqoop将MySQL数据导入到HDFS(二)
任务458: Sqoop中的增量导入与Sqoop job
任务459: Sqoop将MySQL数据导入Hive表中
任务460: Sqoop的导出及脚本中使用的方式
任务461: 案例分析-动态分区的实现
任务462: 案例分析-源表的分区加载创建
任务463: 案例分析-指标分析使用Sqoop导出

 

 

第38章: Hive复杂用户行为案例分析及优化
任务464: 自动批量加载数据到hive
任务465: Hive表批量加载数据的脚本实现(一)
任务466: Hive表批量加载数据的脚本实现(二)
任务467: HIve中的case when、cast及unix_timestamp的使用
任务468: 复杂日志分析-需求分析
任务469: 复杂日志分析-需求字段讲解及过滤
任务470: 复杂日志分析-字段提取及临时表的创建
任务471: 复杂日志分析-指标结果的分析实现
任务472: Hive中数据文件的存储格式介绍及对比
任务473: 常见的压缩格式及MapReduce的压缩介绍
任务474: Hadoop中编译配置Snappy压缩
任务475: Hadoop及Hive配置支持snappy压缩
任务476: Hive中的常见调优
任务477: Hive中的数据倾斜及解决方案-三种join方式
任务478: Hive中的数据倾斜及解决方案-group by
任务479: Hive中使用正则加载数据
任务480: Hive中使用Python脚本进行预处理

 

 

第39章: Zeus任务资源调度工具
任务481: 资源任务调度框架介绍
任务482: 企业中常见的任务调度框架
任务483: Zeus的介绍及基本实现原理
任务484: Zeus安装部署-基本环境配置
任务485: Zeus安装部署-配置文件的修改
任务486: Zeus安装部署-编译打包
任务487: Zeus平台的调度使用
任务488: Zeus平台实现任务调度应用(一)
任务489: Zeus平台实现任务调度应用(二)
任务490: Zeus平台实现任务调度应用(三)

 

 

第40章: Hbase基本使用及存储设计
任务491: Hbase的介绍及其发展
任务492: Hbase中的特殊概念
任务493: Hbase与MYSQL的存储比较
任务494: Hbase部署环境准备
任务495: Hbase伪分布式配置文件的修改
任务496: Hbase伪分布式的启动及hbase命令的使用
任务497: Hbase shell中namespace的常用操作
任务498: Hbase shell中表的DDL操作
任务499: Hbase shell中表的DML操作(一)
任务500: Hbase shell中表的DML操作(二)
任务501: Hbase的物理模型
任务502: Hbase的存储模型
任务503: Hbase的namespace表和meta表
任务504: Hbase的读写流程
任务505: Hbase中各组件的功能介绍

 


第41章: Hbase企业应用及与MapReduce集成
任务506: Hbase Java API-环境配置
任务507: Hbase Java API-通过get读取Hbase表中数据
任务508: Hbase Java API-put、delete
任务509: Hbase Java API-Scan和过滤器
任务510: Hbase与MapReduce集成-环境变量的配置
任务511: Hbase与MapReduce集成-rowcounter测试
任务512: Hbase与MapReduce集成-代码实现自定义需求(一)
任务513: Hbase与MapReduce集成-代码实现自定义需求(二)
任务514: Hbase与MapReduce集成-importTSV工具
任务515: Hbase与MapReduce集成-Bulk Load
任务516: Hbase完全分布式集群的部署配置
任务517: Hbase完全分布式集群启动及Backup Master的配置

 


第42章: 案例:Hbase的设计及企业优化
任务518: Hbase表的设计
任务519: Hbase表中rowkey及列簇的设计
任务520: Hbase表设计-微博案例的表设计
任务521: Hbase表设计-微博案例的业务实现
任务522: Hbase列簇属性的介绍
任务523: Hbase性能优化-GC调优
任务524: Hbase性能优化-内存管理
任务525: Hbase性能优化-flush、compact、split
任务526: Hbase性能优化-配置snappy压缩
任务527: Hbase中索引的介绍
任务528: PHoenix的编译及安装部署
任务529: PHoenix与Hbase表的关联使用

 

 

第43章: 大数据可视化技术:可视化技术概述与Echarts入门
任务530: 课程目标
任务531: 数据可视化概述
任务532: 什么是数据可视化?
任务533: 经典可视化案例
任务534: 大数据可视化的价值
任务535: 数据可视化工具、案例、书籍
任务536: Echarts概述
任务537: Echarts特性介绍
任务538: 如何快速上手开发一个Echarts可视化图表
任务539: 如何阅读Echarts官方文档
任务540: Echarts学习必备基础知识
任务541: Echarts3.x与Echarts2.x的区别
任务542: Echarts基础架构与常见名词术语
任务543: Echarts标准开发模板
任务544: Echarts 柱状图(bar)详解
任务545: 授人以渔01_Echarts 配置项查看技巧
任务546: Echarts 拆线图(line)详解_基本配置
任务547: Echarts 拆线图(line)详解_动态数据展示
任务548: 授人以渔02_定制输出数据视图(dataView)的内容
任务549: 授人以渔03_利用百度图说实现Echarts的可视化配置
任务550: 授人以渔04_Echarts图表标准配置图示技巧

 

 

第44章: 大数据可视化技术:Echarts图表详解
任务551: 饼图(pie)详解_标准饼图
任务552: 小技巧01_辅助线的作用及Echart3.x与2.x中的区别
任务553: 小技巧02_托动自动计算(calculable)功能实现及Echart3.x与2.x中的区别
任务554: 饼图(pie)高级_环形图
任务555: 饼图(pie)高级_嵌套环形图
任务556: 散点图(scatter)详解_标准散点图
任务557: 散点图(scatter)高级_提示信息及坐标轴的自定义
任务558: 气泡图(bubble)详解
任务559: 雷达图(radar)详解
任务560: 地图(map)详解
任务561: 漏斗图(funnel)详解
任务562: 词云(wordCloud)详解
任务563: 仪表盘(gauge)详解_基础配置
任务564: 十大常见图表_小结

 

 

第45章: 大数据可视化技术:Echarts高级与综合案例实战
任务565: 仪表盘(gauge)详解_多仪表盘高级配置
任务566: Echarts图表高级_混搭折线与柱状图+双轴 01
任务567: Echarts图表高级_混搭折线与柱状图+双轴 02
任务568: Echarts图表高级_多图表联动
任务569: Echarts图表高级_如何自定义并动态切换主题
任务570: Echarts图表高级_Echarts异步数据加载
任务571: Echarts图表高级_Echarts异步数据加载并显示Loading动画进度
任务572: Echarts图表高级_Echarts数据动态更新
任务573: Echarts图表高级_Echarts事件与行为概述
任务574: Echarts图表高级_Echarts事件与行为_鼠标事件处理
任务575: Echarts图表高级_Echarts事件与行为_鼠标点击位置判断及技巧
任务576: Echarts图表高级_Echarts事件与行为_点击事件+异步获取数据明细
任务577: 动态图表联动(事件驱动)
任务578: 组件交互行为事件
任务579: Echarts图表高级_小结
任务580: 北上广最佳前10航行路线图_案例分析
任务581: 北上广最佳前10航行路线图_代码实现01
任务582: 北上广最佳前10航行路线图_代码实现02
任务583: 北上广最佳前10航行路线图_代码实现03
任务584: 北上广最佳前10航行路线图_代码实现04
任务585: 北上广最佳前10航行路线图_重构实现数据动态异常加载_思路分析 
任务586: 北上广最佳前10航行路线图_重构实现数据动态异常加载_代码实现
任务587: 豆瓣最新热映电影排名分析_案例分析
任务588: 豆瓣最新热映电影排名分析_豆瓣API简介&案例思路分析
任务589: 豆瓣最新热映电影排名分析_框架代码实现剖析
任务590: 豆瓣最新热映电影排名分析_实现异步跨域获取数据并本地缓存
任务591: 豆瓣最新热映电影排名分析_三种类型图形堆叠技巧实现
任务592: 豆瓣最新热映电影排名分析_电影海报显示功能的实现
任务593: 豆瓣最新热映电影排名分析_点击查看电影明细
任务594: 图表适用场景概述
任务595: 图表适用场景_柱状图、条形图、拆线图、饼图
任务596: 图表适用场景_地图、雷达图、漏斗图、词云、散点图、双轴图
任务597: 数据可视化方法
任务598: 数据可视化误区
任务599: 课程总结

 

第46章: 大数据离线项目:企业大数据项目业务及设计
任务600: 大数据项目的开发流程
任务601: 大数据的应用领域(一)
任务602: 大数据的应用领域(二)
任务603: 大数据分析平台(一)
任务604: 大数据分析平台(二)
任务605: 数据量及集群规模的规划(一)
任务606: 数据量及集群规模的规划(二)
任务607: 企业常见数据分析需求(一)
任务608: 企业常见数据分析需求(二)

 


第47章: 大数据离线项目:数据采集框架Flume
任务609: Flume的介绍及其架构组成
任务610: Flume的安装部署
任务611: Flume的测试运行
任务612: Flume中配置使用file channel及HDFS sink
任务613: Flume中配置HDFS文件生成大小及时间分区
任务614: Flume中配置Spooling Dir的使用
任务615: Flume中配置Spooling Dir的文件过滤
任务616: Flume中配置扇入架构的介绍
任务617: Flume中配置扇入架构的测试实现
任务618: Flume中配置扇出架构的实现
任务619: Flume中Taildir的介绍及编译
任务620: Flume中Taildir的配置及测试使用

 

第48章: 大数据离线项目:Nginx+Flume实现数据采集
任务621: 项目技术架构介绍
任务622: 项目技术架构图
任务623: 项目中框架的技术选型
任务624: Tengine的介绍及源码编译
任务625: Tengine的启动及测试
任务626: 配置使用service命令管理nginx服务
任务627: SDK与Nginx关联测试
任务628: SDK的设计思路及重要事件类型的介绍
任务629: JS SDK 与 JAVA SDK的代码实现
任务630: Nginx中配置自定义收集方案
任务631: Flume进行数据采集
任务632: Flume的负载均衡及故障转移及美团的使用案例


 

第49章: 大数据离线项目:ETL的业务分析及实现(一)
任务633: Nginx日志分割脚本的实现(一)
任务634: Nginx日志分割脚本的实现(二)
任务635: Nginx日志上传脚本的实现
任务636: ETL的流程分析
任务637: 数据分析项目的导入
任务638: 日志解析类的实现(一)
任务639: 日志解析类的实现(二)
任务640: 日志解析类的实现(三)
任务641: 日志解析类的实现(四)
任务642: ETL具体代码流程分析
任务643: 项目中Hbase表的设计

 

第50章: 大数据离线项目:ETL的业务分析及实现(二)
任务644: ETL的Map类的实现(一)
任务645: ETL的Map类的实现(二)
任务646: ETL的Driver类的实现(一)
任务647: ETL的Driver类的实现(二)
任务648: ETL的Driver类的实现(三)
任务649: ETL的本地运行测试
任务650: ETL的集群运行测试

 

第51章: 大数据离线项目:数据分析的思路及代码实现
任务651: 新增访客的统计分析实现思路(一)
任务652: 新增访客的统计分析实现思路(二)
任务653: 使用MapReduce实现思路分析
任务654: Hbase中值和字段的过滤(一)
任务655: Hbase中值和字段的过滤(二)
任务656: Hbase中值和字段的过滤(三)
任务657: 新增用户统计Map代码的实现(一)
任务658: 新增用户统计Map代码的实现(二)
任务659: 新增用户统计Map代码的实现(三)
任务660: 新增用户统计Reduce及Driver代码的实现(一)
任务661: 新增用户统计Reduce及Driver代码的实现(二)

 

第52章: 大数据离线项目:Hourly分析及可视化展示
任务662: MapReduce中自定义输入输出
任务663: 新增用户统计代码的讲解(一)
任务664: 新增用户统计代码的讲解(二)
任务665: hourly分析-hbase与hive的集成
任务666: hourly分析-活跃用户的分析
任务667: hourly分析-会话长度的分析
任务668: hourly分析-平均访问时长分析及sqoop导出
任务669: 使用zeus实现项目任务调度(一)
任务670: 使用zeus实现项目任务调度(二)
任务671: 使用zeus实现项目任务调度(三)
任务672: 使用zeus实现项目任务调度(四)
任务673: 数据展示层及Highcharts的使用讲解(一)
任务674: 数据展示层及Highcharts的使用讲解(二) 
任务675: 项目总结(一)
任务676: 项目总结(二)

 

第53章: SPARK 数据分析:SCALA编程(一)
任务677: 大数据分析框架概要、Spark课程学习计划及建议
任务678: 为什么学习SCALA语言及SCALA语言介绍和学习提纲
任务679: SCALA环境搭建及IDEA安装配置(JAVA安装、SCALA安装及IDEA安装)
任务680: SCALA语言HelloWorld及安装总结(作业LINUX系统安装)
任务681: SCALA中变量的声明(两种方式)
任务682: SCALA中数据类型及操作符
任务683: IF语句及WHILE循环、循环表达式及FOR基本使用
任务684: FOR循环深入讲解及yield功能
任务685: SCALA中的Breaks使用
任务686: 函数的定义(如何确定一个函数)
任务687: 函数的定义(各种情况下函数定义与使用)
任务688: 函数的作用域、默认参数函数和名称参数函数使用详解
任务689: 变长参数函数和内部函数使用详解
任务690: 匿名函数定义与使用
任务691: 高阶函数定义与使用
任务692: 深入高阶函数的使用

 

第54章: SPARK 数据分析:SCALA编程(二)
任务693: 数组Array和ArrayBuffer
任务694: SCALA中集合类Collections概要讲解(对比JAVA中集合类)
任务695: 集合类之List和ListBuffer创建与基本操作
任务696: 集合List中常见高阶函数使用详解(一)
任务697: 集合List中常见高阶函数使用详解(二)
任务698: SCALA中元组创建与使用
任务699: 集合类之Set及常见函数使用
任务700: 集合类之Map创建与遍历
任务701: 集合类综合应用:实现WordCount词频统计
任务702: 类Class的定义与创建对象
任务703: 对象object及apply方法
任务704: 类class的构造方法(主构造方法和附属构造方法)
任务705: SCALA中的Trait初步使用
任务706: SCALA中异常的处理及模式匹配初步使用
任务707: 模式匹配之匹配类型、元组
任务708: CaseClass及在模式匹配中使用
任务709: Option(Some、Node)及模式匹配使用
任务710: SCALA中隐式转换详解(结合案例)
任务711: SCALA中隐式参数详解(结合案例)
任务712: 综合回顾复习SCALA的所有知识要点

 

第55章: SPARK 数据分析:Spark Core(一)
任务713: SPARK框架学习的基础及与Spark初步认识(比较MapReduce框架)
任务714: Spark Feature详解及处理数据三步走策略
任务715: Spark 学习资源、源码下载及编译详解
任务716: SPARK 安装目录及使用的方便优点
任务717: Local Mode配置、启动spark-shell及运行程序测试
任务718: 编程实现WordCount程序(类比MapReduce实现思路)
任务719: Spark Local Mode深入剖析详解
任务720: 使用IDEA创建MAVEN工程及配置依赖
任务721: 编写Spark Application开发模板
任务722: 深入WordCount程序分析(sortByKey和top函数使用)
任务723: 如何导入Spark源码至IDEA中(Windows下)
任务724: Spark Standalone 集群架构、配置、启动深入详解及运行spark-shell测试
任务725: 浅析Spark Application运行Cluster组成及spark-submit提交应用
任务726: 深入剖析Spark Application中Job、Stage和Task关系
任务727: 案例:对原始数据进行清洗过滤及实现每日浏览量统计
任务728: 案例:实现每日访客数统计及使用HiveQL进行结果验证、打包运行SparkStandalone集群

 


第56章: SPARK 数据分析:Spark Core(二)
任务729: Spark Application运行的Deploy Mode详解(结合案例演示)
任务730: 使用spark-submit提交应用运行Standalone集群及性能调优
任务731: Spark Application运行的EventLog启用
任务732: Spark HistoryServer配置及使用
任务733: RDD是什么及创建方式
任务734: RDD操作类型及持久化详解
任务735: RDD中常用的Transformation和Action详解(一)
任务736: RDD中常用的Transformation和Action详解(二)
任务737: 案例:分组排序TopKey实现及如何处理数据倾斜(分阶段聚合)
任务738: SparkOnYarn:运行SparkApplication在YARN上(编写脚本)
任务739: 配置HIstoryServer及运行在YARN的两种Deploy Mode架构
任务740: 官方案例:读取日志数据及正则解析(CASE CLASS)
任务741: 官方案例:依据业务编码实现及熟悉RDD API
任务742: 方案例:其他业务编码实现测试及过滤数据
任务743: 官方案例:RDD#top函数使用(自定义排序规则)及提交运行YARN集群
任务744: 内核调度:Spark Job Scheduler详解(一)
任务745: 内核调度:Spark Job Scheduler详解(二)

 

第57章: SPARK 数据分析:Spark SQL
任务746: SparkSQL的重要性及Spark2.x的生态圈
任务747: SparkSQL前世今生(Hive、Shark、SparkSQL)及初步使用说明
任务748: 案例分析:基于DataFrame和SQL分析数据(一)
任务749: 案例分析:基于DataFrame和SQL分析数据(二)
任务750: SparkSQL Introduction及处理数据的方式
任务751: SparkSQL与Hive集成配置详解
任务752: 基于SQL和DSL方式分析处理Hive表的数据
任务753: SparkSQL中提供的spark-sql命令行的使用(与Hive类比)
任务754: SparkSQL中ThriftServer配置使用详解
任务755: SparkSQL性能优化及DataFrame是什么
任务756: SparkSQL读取多种数据数据实例
任务757: DataFrame实现多数据源数据的关联分析(MySQL与Hive表数据)
任务758: SparkSQL读取AVRO格式数据详解
任务759: SparkSQL读取CSV或TSV格式数据详解
任务760: 自定义schema的方式转换RDD为DataFrame及直接运行SQL在数据文件上
任务761: SparkSQL中自带函数的使用及如何自定义UDF、注册和使用
任务762: Spark 2.x中SparkSQL基本使用(一)
任务763: Spark 2.x中SparkSQL基本使用(二)

 

第58章: SPARK 数据分析:Spark Streaming及Kafka
任务764: 大数据处理的类型、流式计算的框架及Streaming内容概要
任务765: SparkStreaming是什么、使用案例及数据处理流程
任务766: 官方Example案例:词频统计运行详解
任务767: SparkStreaming编程实现从Socket读取数据实时统计分析
任务768: 深入SparkStreaming运行的工作原理
任务769: 深度剖析batch interval和block interval及性能优化
任务770: 编程模型:从源码深入剖析DStream(StreamingContext、DStream操作)
任务771: 深入详解DStream#foreachRDD使用
任务772: Apache Kafka介绍及架构详解
任务773: Apache Kafka安装、部署、启动
任务774: 创建Topic、发送和消费数据及深入理解KAFKA数据的存储
任务775: 剖析分享Kafka企业技术架构及使用(结合Kafka Meetup分享)
任务776: SparkStreaming与Flume和Kafka两种集成方式详解
任务777: 采用Pull方式与Kafka集成进行数据分析处理
任务778: 状态Stateful实时统计updataStateByKey使用
任务779: SparkStreaming实时分析应用的高可用性
任务780: 实时窗口Window统计详解(reduceByKeyAndWindow使用)

 

第59章: SPARK 数据分析:基于Java和Python的Spark编程
任务781: 基于Java和Python语言的Spark开发的提纲及学习方式
任务782: 基于JAVA语言编写Spark Application编程模板、读取数据及测试监控
任务783: 案例WordCount:结合源码编码实现JAVA语言编程
任务784: 案例WordCount:对统计的词频进行降序排序(涉及TopKey)及作业说明
任务785: 案例分析:基于JAVA实现如何将RDD转换为DataFrame
任务786: 案例分析:使用SQL进行数据分析
任务787: 案例分析:使用DSL进行数据分析及自定义UDF注册使用
任务788: SparkStreaming基于JAVA实现从Socket读取数据WordCount统计及测试
任务789: 结合案例实现JAVA编程DStream#foreachRDD和从KAFKA读取数据
任务790: 结合案例讲解基于JAVA的updateState和window编程及作业
任务791: Python介绍、Windows下2.7的安装及测试
任务792: PyCharm安装、设置及创建工程和测试
任务793: PySpark第三方包的安装配置
任务794: 基于Python的SparkCore编程模板
任务795: 并行化本地集合创建RDD及RDD初步使用
任务796: Python中函数的定义及匿名函数lambda使用
任务797: PySpark实现WordCount程序及测试
任务798: PySpark实现从HDFS读取数据实现WordCount(属性配置)
任务799: 深入WordCount程序之SortByKey
任务800: 深入WordCount程序之TopKey
任务801: Anaconda2版本、安装、配置、使用及测试(针对pyspark编程)
任务802: Spark自带交互式pyspark命令的使用
任务803: pyspark底层架构及如何提交pyspark程序运行

 


第60章: storm:架构、环境及使用
任务804: storm下载及环境搭建介绍
任务805: storm启动前各参数配置详解
任务806: 进程启动实践
任务807: 运行架构解析
任务808: 自带案例wordcount的测试运行与架构详解
任务809: 框架组件之kafkaSpout完成kafka数据读取功能
任务810: 框架组件之splitbolt完成单词切割功能
任务811: 框架组件之countbolt完成词频统计功能
任务812: 框架组件之hbasebolt完成将结果写入hbase功能
任务813: 集群整体运行测试及回顾

 

第61章: storm:Trident使用
任务814: 逻辑的抽象-Trident介绍
任务815: Trident中spout创建及测试数据读取
任务816: 遍历所有tuple请使用each方法
任务817: 只保留我想保留的-filter过滤器
任务818: 逻辑功能的完成方法-function实现字符串切割
任务819: 系统提供tuple过滤功能project方法
任务820: 利用function实现词频统计
任务821: 项目打包集群运行
任务822: 多个execute以及分组操作
任务823: 逻辑功能实现同一批次内局部统计
任务824: 逻辑功能实现全局统计
任务825: 对数据重分区操作
任务826: 远程调用查询DRPC服务

 

第62章: storm:电商实时销售统计
任务827: 实战案例需求介绍
任务828: 实现需求测试类介绍
任务829: 完成kafkaSpout从测试类中读取数据
任务830: 利用Trident架构解析订单记录
任务831: 完成计算每天销售额
任务832: DRPC查询每天销售额
任务833: 分流统计不同的分析指标
任务834: 多字段统计销售数据

 


第63章: 【附赠】高薪面试:企业大数据平台(一)
任务835: 企业大数据平台基本组件及集群大小和Zookeeper集群的节点数设置
任务836: Cloudera Manager 5.x的几种安装方式及优缺点
任务837: 大数据平台集群机器环境准备配置讲解一
任务838: 大数据平台集群机器环境准备配置讲解二
任务839: 配置集群机器的时间同步
任务840: 安装CM 5.3.x前准备工作(搭建基于http的本地源及安装postgresql数据库)
任务841: 使用本地源安装CM 5.3.x
任务842: 使用CM 5.3.x添加主机到集群中
任务843: 解决CM 5.3.x检查集群中各个机器出现的问题

 

第64章: 【附赠】高薪面试:企业大数据平台(二)
任务844: 使用CM 5.3.x安装Zookeeper服务组件及CDH 安装软件目录讲解
任务845: CDH5.x安装服务日志查看及服务组件的客户端配置和目录
任务846: 使用CM 5.3.x安装HDFS组件、测试及一些注意细节
任务847: CM5.x如何配置部署启动HDFS HA及健康HDFS组件运行时各个指标
任务848: CM5.x安装YARN、运行WordCount程序测试和每个服务对应各自用户

课程目标
  • 了解 Hadoop 的历史及目前发展的现状、以及 Hadoop 的技术特点
  • 把握分布式计算框架及未来发展方向,在大数据时代能为企业的技术选型及架构设计提供决策参考。
  • 对大数据整个生态系统常用的大数据技术有清晰全面的认识
  • 可以独立规划及部署生产环境的Hadoop 集群,掌握 Hadoop 基本运维思路和方法,对 Hadoop 集群进行管理和优化
  • 能够利用大数据技术对企业的大数据进行基本数据存储,管理,分析,最终为企业单位创建价值
适合人群
  • 在校计算机相关专业的大学生
  • 有兴趣从事大数据开发的在职工作人员

授课教师

学途无忧网金牌合作讲师

课程特色

视频(856)