特色项目 – 数据分析

项目简介

这个项目帮助学员学习如何去存储、管理、处理和分析大量非结构化数据,通过课程获得竞争优势、懂得选择和实施正确的大数据存储方案、运用先进的分析技术和工具对大数据进行分析。塑造学员对大数据的清洗的概念、扎实的技术功底和产品化能力。

课程将对如何计划和实施大数据项目、大数据相关的各类新技术进行系统的讲解。在课程中会结合很多大数据系统的实际案例进行教学。案例主要基于java语言,但课程的主要目标将围绕如何基于大数据进行开发实践而展开。

完成所有的课程后,将会进行一个Hadoop大数据认证测试,通过测试的学院讲获得相应的认证证书。

课程内容

这个模块的课程包含一下培训内容

时间:

全日培训: 5 天

课程目标

学员讲得到以下方面的能力增强

学员将使用Hadoop平台学习下列实验内容:

课程大纲

核心模块:

计算环境 当下各种复杂多变的计算资源和需求需要类似Apache Hadoop这样的技术
Hadoop分布式文件管理系统 文件信息如何在HDFS中存储和管理; 支持HDFS的基础结构介绍
MapReduce 执行一个MapReducer任务的相关框架和各个执行阶段。熟悉基于一系列map和reducer及分布式存储文件的执行任务特性
Hadoop API Apache Hadoop为执行MapReduce任务开发的程序员提供了JAVA类接口
Hadoop 平台 基本目标:将Hadoop Streaming, fuse-dfs, Apache Hive, Apache Pig, Apache Flume, Apache Sqoop, Apache HBase, Apache Oozie和Hue可视化工具等纳入系统平台的设计和操作,从而增强Apache Hadoop核心功能。

授课方式

可申请人:新加坡公民或永久居民

课程有2种授课模式:

全日制模式: