[size=font-size:14.0pt,14.0pt][font="]ClouderaData Analyst Training: Using Pig, Hive, and Impala([size=font-size:14.0pt,14.0pt][font="]数据分析师课程)
[size=font-size:10.5pt,10.5pt][font="]建议学员[size=font-size:10.5pt,10.5pt][font="]:数据分析师和业务分析师
课时:3天
[size=font-size:10.5pt,10.5pt][font="]Cloudera[size=font-size:10.5pt,10.5pt][font="]的3天数据分析师课程专注于 Apache Pig, Hive 和 Cloudera Impala, 教授你将传统数据分析方法和商业智能的技巧运用到大数据里。Cloudera 展示了数据专家结合SQL和熟悉的脚本语言,用来访问,操纵和分析复杂数据组的工具。
[size=font-size:10.5pt,10.5pt][font="]提升你生态圈的经验:[size=font-size:10.5pt,10.5pt][font="]ApacheHive [size=font-size:10.5pt,10.5pt][font="]支持分析师,数据库管理员和其他没有Java编程经验的人访问多种结构的数据。 Apache Pig 对Hadoop集群应用了熟悉的基础的脚本语言。 Cloudera Impala 支持对存放在Hadoop里的数据通过原生SQL进行实时互动式分析。
[font="]【课程内容:】
[font="]1[font="]、Hadoop生态圈、实验场景介绍、用Hadoop工具导入数据;
[font="]2[font="]、pig的特性、使用案例、和pig交互、pig Latin语法、Field定义、用pig执行ETL流程;
[font="]3[font="]、pig处理复杂数据,复杂/nested嵌套的数据类型、用pig分析广告战役的数据
4、pig的多数据组操作,pig链接多数据组、用pig分析离散的数据组;
[font="]5[font="]、用流处理和UDFs扩展pig,Macros和Imports、contributed functions,用其他语言和pig一起处理数据;
[font="]6[font="]、pig故障排查和优化,用web界面排查一个故障的任务、Data采样和故障排查、理解执行计划、提高pig任务性能;
[font="]7[font="]、hive表结构和数据储存、对比hive和传统数据库、hive vs.pig、hive使用案例;
[font="]8[font="]、hive的关系数据分析、数据管理、文本处理、优化及扩展,在shell、脚本和hue上运行hive查询;
[font="] 9[font="]、impala和hive、pig、关系数据库的不同、使用impala shell;
[font="] 10[font="]、采样impala分析数据,过滤、排序and limiting results,提升impala性能,impala的交互式分析;
[font="] 11[font="]、对比map reduce、pig、hive、impala和关系数据库;
[size=font-size:12.0pt,12.0pt][font="]Cloudera
[size=font-size:12.0pt,12.0pt][font="]官方授权认证培训机构:北京精准数源信息技术有限公司
[size=font-size:12.0pt,12.0pt][font="](原厂讲师、原厂课程、同步轨迹最新的课程体系、全球最具权威的大数据国际认证)
[font="]【学员基础:】[font="]该课程适合有SQL经验和基本Unix和Linux命令的数据分析师、业务分析师和管理员。无需Java和Apache Hadoop经验
[font="]【授课形式:】[font="]面对面案例教学+上机实操
[font="]
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。