您所在的位置:首页 > 厂商培训

                                                                                    Hadoop CCAH 认证

 

取得证书: CLoudera  CCAH证书      

CCAH 培训周期:32-40学时      

授课形式: 讲授、分组活动与练习等相互结合                                                

 Hadoop CCAH 课程背景:   

   Hadoop已成为业界大数据标准平台,通过培训学员会收获以下知识:

   Hadoop分布式文件系统(HDFS)和MapReduce的工作原理
         如何优化Hadoop机群所需要的硬件配置
         ·搭建Hadoop机群所需要考虑的网络因素
         ·如何利用Hadoop配置选项进行系统性能调优
         ·如何利用FairScheduler为多用户提供服务级别保障
         ·Hadoop机群维护和监控
         ·如何使用Flume从动态生成的文件加载数据到Hadoop
         ·如何使用Sqoop从关系型数据库加载数据
         ·使用其他Hadoop相关系统工具(如Hive,Pig和HBase)所涉及到的系统管理问题 

Hadoop CCAH 课程大纲:        

1.关于 Apache Hadoop

> 为什么是Hadoop?

> Hadoop 的核心部件

> 基础概念

2.HDFS

> HDFS 特性

> 读,写文件

> NameNode内存的考虑

> HDFS 安全性简介

> 使用 Namenode Web 用户界面

> 使用Hadoop 文件 Shell

3.YARN 和MapReduce

> 什么是 MapReduce?

> MapReduce基本概念

> YARN 集群的架构

> 资源分配

> 故障恢复

> 使用 YARN Web 用户界面

> MapReduce 版本 1

4.为你的Hadoop 集群做计划

> 通用计划的考虑

> 选择正确的硬件

> 对网络的考虑

> 配置节点

> 为集群管理做计划

5.Hadoop 安装和初始配置

> 部署的类型

> 安装Hadoop

> 具体化Hadoop的配置

> 执行 HDFS 的初始配置

> 执行YARN 和 MapReduce 的初始配置

> Hadoop 日志系统

6.安装配置Hive, Impala和 Pig

> Hive

> Impala

> Pig

7.Hadoop 客户端

> 什么是Hadoop 客户端?

> 安装配置Hadoop 客户端

> 安装配置 Hue

> Hue 授权和认证 集群的

8.Cloudera 管理器

> Cloudera 管理器的动机

> Cloudera 管理器的特性

> 快速版和企业版

> Cloudera 管理器拓扑

> 安装Cloudera 管理器

> 用Cloudera 管理器安装hadoop

> 用Cloudera 管理器执行基本的管理任务

9.集群的高级配置

> 高级配置参数

> 配置Hadoop 端口

> 显性地添加或移除主机

> 配置HDFS 的机架认知

> 配置HDFS 高可用性

10.Hadoop的安全方案

>Hadoop的安全性的重要

>Hadoop的安全系统的概念

>Kerberos是什么,它如何工作

>用Kerberos来守卫Hadoop集群

11.管理, 计划工作任务

> 管理正在运行的工作

> 计划Hadoop 工作

> 配置 FairScheduler

> Impala 的查询计划

12.集群的维护

> 检查HDFS 状态

> 在不同集群间拷贝数据

> 添加和挪去集群的节点

> 重新平衡

13.集群的监控和故障诊断

> 通用系统监控

> 监控Hadoop 集群

> 常见的Hadoop Clusters