(0人评价)
Impala大数据分析引擎
价格 ¥ 319.20 ¥399.00 8折
活动
课程介绍
Black老师:
曾担任某知名共享单车大数据部门负责人,现担任某知名广告公司大数据高级架构师,有丰富的企业内部技术分享、技术培训和技术讲座的经验。近年来一直致力于研究大数据领域技术。擅长Hadoop、Spark、Kudu、HBase、Impala、Flume等。负责过多个大型大数据系统的开发和架构,包含大数据离线分析平台,大数据实时分析平台(实时,准实时)等。

Impala由Cloudera公司主导开发的大数据实时查询分析工具,宣称比原来基于MapReduce的HiveSQL查询速度提升3~90倍,且更加灵活易用。提供类SQL的查询语句,能够查询存储在Hadoop的HDFS、Kudu、HBase(实际生产环境中不用)中的PB级大数据。查询速度快是其最大的卖点。简言之impala作为大数据实时查询分析工具,具有查询速度快,灵活性高,易整合,可伸缩性强等特点。


但是在一些实时性要求很高的场景中,一方面满足实时性要求,一方面提升用户体验。Impala因其快速的响应能力当之无愧作为首选查询分析工具。

    

编程简单:适用于所有的etl开发工作者,sql几乎通用

 

高性能:轻松的应用复杂的分析场景

 

查询速度快:中间结果不写入磁盘,及时通过网络以流的形式传递,大大降低的节点的IO开销

 

灵活性高:可以直接查询存储在HDFS上的原生数据,也可以查询Kudu的数据原生数据

 

易整合:很容易和hadoop系统整合,并使用Hadoop生态系统的资源和优势,不需要将数据迁移到特定的存储系统就能满足查询分析的要求

 

可伸缩性:可以很好的与一些BI应用系统协同工作,如Cboard、Tableau等

 

可扩展: 随着业务发展,数据量和计算量越来越大,系统可水平扩展

 

容错:单个节点挂了不影响应用

 

适用人群

1、零基础学员
2、大数据爱好者
3、对Impala技术感兴趣的大数据开发人员

课程使用软件版本

CentOS-7.4-X86_64
Apache-maven-3.5.3
JDK-8u181-linux-x64
Impala-2.12.0
Kudu-1.7.0

 

  1. 阐述了Impala的产生背景和应用场景
  1. 由浅入深的剖析了Impala的基础架构、服务进程
  1. 手把手的搭建了Impala和Kudu的分布式集群
  1. 详细的介绍了Impala的读写流程、部署模式、执行计划
  1. 深刻的剖析了Impala和Hive的对比、同步Hive的元数据
  1. 详细的介绍官方文档
  1. 对企业级实战sql,进行了深刻的剖析
  1. 详细的介绍了聚合函数、窗口分析函数、性能调优
  1. 帮助同学们掌握基础的Linux常用命令

 

授课教师

大数据资深讲师

课程特色

视频(27)
下载资料(1)