您所在的位置:首页>厂商培训

Hadoop CCA 认证课程

取得证书: CLoudera CCA证书
CCA培训周期:24学时
授课形式: 讲授、分组活动与练习等相互结合

 

课程背景:

Hadoop已成为业界大数据标准平台,通过培训讲授以下知识:

Hadoop分布式文件系统(HDFS)和MapReduce的工作原理
如何优化Hadoop机群所需要的硬件配置
搭建Hadoop机群所需要考虑的网络因素
如何利用Hadoop配置选项进行系统性能调优
如何利用FairScheduler为多用户提供服务级别保障
Hadoop机群维护和监控
如何使用Flume从动态生成的文件加载数据到Hadoop
如何使用Sqoop从关系型数据库加载数据
使用其他Hadoop相关系统工具(如Hive,Pig和HBase)所涉及到的系统管理问题;

 

课程大纲:

1.关于 Apache Hadoop

为什么是Hadoop?

Hadoop 的核心部件

基础概念

2.HDFS

HDFS 特性

读,写文件

NameNode内存的考虑

HDFS 安全性简介

使用 Namenode Web 用户界面

使用Hadoop 文件 Shell

3.YARN 和MapReduce

什么是 MapReduce?

MapReduce基本概念

YARN 集群的架构

资源分配

故障恢复

使用 YARN Web 用户界面

MapReduce 版本 1

4.为你的Hadoop 集群做计划

通用计划的考虑

选择正确的硬件

对网络的考虑

配置节点

为集群管理做计划

5.Hadoop 安装和初始配置

部署的类型

安装Hadoop

具体化Hadoop的配置

执行 HDFS 的初始配置

执行YARN 和 MapReduce 的初始配置

Hadoop 日志系统

6.安装配置Hive, Impala和 Pig

Hive

Impala

Pig

7.Hadoop 客户端

什么是Hadoop 客户端?

安装配置Hadoop 客户端

安装配置 Hue

Hue 授权和认证 集群的

8.Cloudera 管理器

Cloudera 管理器的动机

Cloudera 管理器的特性

快速版和企业版

Cloudera 管理器拓扑

安装Cloudera 管理器

用Cloudera 管理器安装hadoop

用Cloudera 管理器执行基本的管理任务

9.集群的高级配置

高级配置参数

配置Hadoop 端口

显性地添加或移除主机

配置HDFS 的机架认知

配置HDFS 高可用性

10.Hadoop的安全方案

Hadoop的安全性的重要

Hadoop的安全系统的概念

Kerberos是什么,它如何工作

用Kerberos来守卫Hadoop集群

11.管理, 计划工作任务

管理正在运行的工作

计划Hadoop 工作

配置 FairScheduler

Impala 的查询计划

12.集群的维护

检查HDFS 状态

在不同集群间拷贝数据

添加和挪去集群的节点

重新平衡

13.集群的监控和故障诊断

通用系统监控

监控Hadoop 集群

常见的Hadoop Clusters

<

金源在线客服

QQ在线咨询

咨询电话
010-83650488

在线咨询

在线咨询

电话咨询