基于微博数据应用的HBase实战开发

默认教学计划
(5人评价)
价格 ¥699.00
教学计划
课程介绍

温馨提示:

本课程VIP答疑QQ群:450057595,本群拒绝主动添加!购买课程之后,联系客服(QQ:2327819118)申请入群,课程代码、PPT和相关资料在群文件里面下载。

一、讲师介绍:
IT技术宅男。2009年11月不小心获得中国首批软考-系统架构设计师认证;2014年在某信息安全中心的大数据与智能分析实验室工作,因个性较宅,整天泡在实验室研发行业大数据(全球能源)、情报协同分析大数据(公共安全)、航班安全大数据(公共安全)、互联网大数据(网络舆情)等等,做过PB级大数据架构、设计过数据挖掘算法、打过大规模数据可视化代码、讲过大数据系列课程;如今在中科院软件所进行光电大数据研究工作,研究方向为大规模机器学习、自然语言处理。

二、课程用到的软件
1.centos6.7
2.apache-tomcat-7.0.47
3.solr-5.5
4.zookeeper 3.4.6
5.eclipse-jee-neon-R-win32-x86_64 
6.jdk1.7_49
7.HBase1.2.2
8.Ganglia3.7.2
9.Sqoop1.99.7
10.Hadoop2.7.2

三、课程目标
当数据量达到TB或PB级的时候,传统关系型数据型已力不从心。在大数据热潮中,推出了NoSQL数据库,这种天生就为分布式存储而设计的技术,尤其以Apache HBase为代表,占领海量数据存储技术的大半壁江山。本教视从实战角度出来,向学员们手把手掌握HBase使用精髓,让学员达到如下目标:
1. 了解分布式存储的原理及架构。 
2. 掌握如何使用HBase实现海量数据存储与检索。 
3. 掌握HBase在开发中常见的技术大坑与调优技术。

四、适用人群
开发人员、架构师、对分布式存储有兴趣的朋友。

五、课程内容及目录

课时1:HBase简介与部署
课时2:HBase架构与索引算法剖析
课时3:HBase建库建表与CRUD实战 
课时4:基于HBase Client API的CRUD实战 
课时5:批处理与扫描器实战 
课时6:使用Ganglia监控HBase
课时7:过滤器实战之比较过滤器
课时8:过滤器实战之专用过滤器与FilterList
课时9:过滤器实战之自定义过滤器 
课时10:Observer协处理器实战之Master级别原理剖析
课时11:Observer协处理器实战之Region级别原理剖析
课时12:Observer协处理器实战之表复制应用实战 
课时13:Endpoint协处理器实战之原理剖析
课时14:Endpoint协处理器实战之数据统计应用实战
课时15:使用API管理HBase之核心理论
课时16:使用API管理HBase之编程实战 
课时17:使用API管理HBase之编程实战(续)
课时18:搭建分布式HBase集群之Hadoop部署 
课时19:搭建分布式HBase集群之HBase部署 
课时20:sqoop2部署 
课时21:使用sqoop2将mysql数据导入到HBase 
课时22:集群管理之节点管理与数据任务
课时23:Rowkey设计与集群常见故障处理 
课时24:集群调优经验分享 
课时25:项目介绍与Solr环境搭建 
课时26:数据层设计与中文分词器配置
课时27:Spring集成HBase之核心操作
课时28:Spring集成HBase之核心操作(续)
课时29:基于dom4j进行数据文件解析 
课时30:数据层设计与实现之二级索引开发
课时31:数据层设计与实现之二级索引开发(续) 
课时32:Spring集成Solrj之入门操作
课时33:Spring集成Solrj之高级操作
课时34:高亮查询功能开发之一
课时35:高亮查询功能开发之二
课时36:课程总结


六、佛罗米老师其他课程推荐:
基于微博数据检测的Solr5.5实战开发http://www.xuetuwuyou.com/course/145

课程目标
  • 了解分布式存储的原理及架构
  • 掌握如何使用HBase实现海量数据存储与检索
  • 掌握HBase在开发中常见的技术大坑与调优技术
适合人群
  • 开发人员、架构师、对分布式存储有兴趣的朋友。