鸿初_个人页

鸿初

文章

问答

视频

个人介绍

阿里云-EMR团队成员，致力于推广开源大数据在云上的应用

擅长的技术

获得更多能力

通用技术能力：

暂时未有相关通用技术能力~

云产品技术能力：

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明

高分内容

最新动态

文章
问答
视频

发表了文章 2018-05-11

都是default惹的祸-yarn调度（一）-fair调度器drf调度策略作业不执行问题的调查和源码分析

问题背景 yarn的fair类型资源池，是企业级hadoop用户常用的资源池类型。该资源池默认的队列调度策略是fair，即分配资源时只考虑内存限制。对一个多个团队混合使用的大集群来说，如果想要在分配资源时同时考虑内存和cpu限制，需要指定调度策略为drf。
发表了文章 2018-04-15

为什么要写技术文章-我对写作收获的理解

为了迎接更好的自己。过去的止步不前程序员最反感别人没写文档，最不喜欢自己写文档。我一直很认同技术人员应该持续写技术文章，可以总结经验，打造个人品牌，等等。但加上公司内部分享，实际也没写多少篇，这可能也是很多技术人员的通病吧。
发表了文章 2018-04-11

hive在E-MapReduce集群的实践（一）hive异常排查入门

hive是hadoop集群最常用的数据分析工具，只要运行sql就可以分析海量数据。初学者在使用hive时，经常会遇到各种问题，不知道该怎么解决。本文是hive实践系列的第一篇，以E-MapReduce集群环境为例，介绍常见的hive执行异常，定位和解决方法，以及hive日志查看方法。
发表了文章 2018-03-13

Step by step，学习EMR集群的fair类型资源池
发表了文章 2018-03-06

hive在E-MapReduce集群的实践（二）集群hive参数优化

本文介绍一些常见的集群跑hive作业参数优化，可以根据业务需要来使用。提高hdfs性能修改hdfs-site，注意重启hdfs服务 dfs.client.read.shortcircuit=true //直读 dfs.
发表了文章 2018-01-18

自建hadoop集群迁移到EMR之数据迁移篇

自建集群要迁移到EMR集群，往往需要迁移已有数据。本文主要介绍hdfs数据和hive meta数据如何迁移。前置已按需求创建好EMR集群。迁移hdfs数据主要依靠distcp,核心是打通网络，确定hdfs参数和要迁移内容，测速，迁移。
发表了文章 2017-11-02

用集群脚本功能安装大象医生优化你的大数据作业
提交了问题 2016-11-28

E-MapReduce创建集群时没有勾选presto 现在想启动presto
发表了文章 2016-09-26

E-MapReduce集群脚本-包年包月集群修改软件环境的利器

集群，特别是包年报月集群，在使用过程中，可能会有新的安装第三方软件，修改集群运行环境的需求。 E-MapReduce控制台1.5.0版本提供了集群脚本的功能，可以在集群创建好后批量选择节点，运行您指定的脚本，以实现个性化的需求。
发表了文章 2016-09-26

E-MapReduce的Presto组件默认支持访问oss数据

阿里云E-MapReduce从EMR-2.1.0版本镜像开始，Presto组件默认就支持访问oss数据了，不再需要引导操作额外支持。
发表了文章 2016-08-07

20160808北京云栖大会workshop-EMapReduce分析网站数据

目标了解E-MapReduce创建集群流程；熟悉端口转发访问集群可视化组件zeppelin；完成用zeppelin分析热播数据的示例。创建集群集群包括一组ecs实例和运行在实例上的分布式计算框架(Hadoop,Spark等)，管控程序，是运行计算任务的资源基础。下面带大家熟悉创建
发表了文章 2016-06-28

Presto实现原理（转）

Presto架构 Presto查询引擎是一个Master-Slave的架构，由一个Coordinator节点，一个Discovery Server节点，多个Worker节点组成，Discovery Server通常内嵌于Coordinator节点中。Coordinator负责解析SQL语句，生
提交了问题 2016-06-14

E-MR spark 本地测试读写odps 会默认限制数据条数吗
提交了问题 2016-06-14

EMR创建完后网页上支持升级到新的EMR版本么
提交了问题 2016-06-14

创建完EMR集群之后可以对单独的组件进行配置更改或者版本升级么？可以添加自定义的组件之类的么？
提交了问题 2016-06-14

如何登陆E-MapReduce的core节点
发表了文章 2016-06-03

【转】Spark 2.0 技术预览版:更简单、更快速、更智
发表了文章 2016-05-27

使用E-MapReduce集群sqoop组件同步云外Oracle数据库数据到集群hive
提交了问题 2016-05-27

用E-MapReduce sqoop同步私有公网数据库为什么要创建VPC集群
提交了问题 2016-05-27

用E-MapReduce sqoop产品导入数据后为什么hdfs目录是空的
提交了问题 2016-05-27

E-MapReduce产品用sqoop同步数据hdfs目录要提前创建好么
提交了问题 2016-05-25

sqoop还有哪些参数可以设置
提交了问题 2016-05-25

E-MapReduce产品 hive有客户端吗，就类似pl/sql的窗口那样
提交了问题 2016-05-25

E-MapReduce产品sqoop同步外网数据库还需要core节点访问外网？
提交了问题 2016-05-25

E-MapReduce产品用sqoop同步数据，hive创建表的结构一定要和数据库结构一样吗
提交了问题 2016-05-25

E-MapReduce产品sqoop把数据导入hdfs一个目录还是hive的一个表中，这两种有区别吗
提交了问题 2016-05-25

E-MapReduce的sqoop可以不指定--target-dir参数吗
提交了问题 2016-05-25

E-MapReduce 1.3版本用的是sqoop2吗
发表了文章 2016-05-05

在Aliyun E-MapReduce集群上使用sqoop高级特性

sqoop简介 sqoop是什么 Sqoop是一款开源的软件工具，提供了Hadoop和关系型数据库中的数据相互转移的功能。可以将一个关系型数据库（例如： MySQL）中的数据导进到Hadoop的HDFS中，也可以将HDFS的数据导进到关系型数据库中。在E-MapReduce集群中使用sqo

暂无更多信息

发表了文章 2018-05-11

都是default惹的祸-yarn调度（一）-fair调度器drf调度策略作业不执行问题的调查和源码分析
发表了文章 2018-04-15

为什么要写技术文章-我对写作收获的理解
发表了文章 2018-04-11

hive在E-MapReduce集群的实践（一）hive异常排查入门
发表了文章 2018-03-13

Step by step，学习EMR集群的fair类型资源池
发表了文章 2018-03-06

hive在E-MapReduce集群的实践（二）集群hive参数优化
发表了文章 2018-01-18

自建hadoop集群迁移到EMR之数据迁移篇
发表了文章 2017-11-02

用集群脚本功能安装大象医生优化你的大数据作业
发表了文章 2016-09-26

E-MapReduce集群脚本-包年包月集群修改软件环境的利器
发表了文章 2016-09-26

E-MapReduce的Presto组件默认支持访问oss数据
发表了文章 2016-08-07

20160808北京云栖大会workshop-EMapReduce分析网站数据
发表了文章 2016-06-28

Presto实现原理（转）
发表了文章 2016-06-03

【转】Spark 2.0 技术预览版:更简单、更快速、更智
发表了文章 2016-05-27

使用E-MapReduce集群sqoop组件同步云外Oracle数据库数据到集群hive
发表了文章 2016-05-05

在Aliyun E-MapReduce集群上使用sqoop高级特性

正在加载, 请稍后...

滑动查看更多

提交了问题 2016-11-28

E-MapReduce创建集群时没有勾选presto 现在想启动presto
回答了问题 2019-07-17

E-MapReduce创建集群时没有勾选presto 现在想启动presto

presto安装目录是/usr/lib/presto-current日志目录是/mnt/disk1/log/presto先初始化，再启动初始化：每个节点的/usr/local/emr/emr-bin/script/presto/init.sh，先改masterIp=#master_ip#，将#master_ip#改为emr-header-1节点的内网ip再执行该脚本启动命令：emr-header-1 用su -l hdfs -c '/usr/lib/presto-current/bin/launcher --config=/usr/lib/presto-current/etc/coordinator-config.properties start'其他节点用su -l hdfs -c '/usr/lib/presto-current/bin/launcher --config=/usr/lib/presto-current/etc/worker-config.properties start'

赞2 踩1 评论0
提交了问题 2016-06-14

E-MR spark 本地测试读写odps 会默认限制数据条数吗
提交了问题 2016-06-14

EMR创建完后网页上支持升级到新的EMR版本么
提交了问题 2016-06-14

创建完EMR集群之后可以对单独的组件进行配置更改或者版本升级么？可以添加自定义的组件之类的么？
提交了问题 2016-06-14

如何登陆E-MapReduce的core节点
回答了问题 2019-07-17

E-MR spark 本地测试读写odps 会默认限制数据条数吗

没有

赞1 踩1 评论0
回答了问题 2019-07-17

EMR创建完后网页上支持升级到新的EMR版本么

目前emr版本不支持升级

赞1 踩1 评论0
回答了问题 2019-07-17

创建完EMR集群之后可以对单独的组件进行配置更改或者版本升级么？可以添加自定义的组件之类的么？

创建时可以用软件配置和引导操作更改配置，添加自定义组件,创建完成后目前只能登陆ecs手工修改安装

赞0 踩1 评论0
回答了问题 2019-07-17

如何登陆E-MapReduce的core节点

可以先ssh master，再用hadoop账户ssh上去，已经打通master到core节点hadoop账户免密码ssh了

赞1 踩1 评论0
提交了问题 2016-05-27

用E-MapReduce sqoop同步私有公网数据库为什么要创建VPC集群
提交了问题 2016-05-27

用E-MapReduce sqoop产品导入数据后为什么hdfs目录是空的
提交了问题 2016-05-27

E-MapReduce产品用sqoop同步数据hdfs目录要提前创建好么
回答了问题 2019-07-17

用E-MapReduce sqoop同步私有公网数据库为什么要创建VPC集群

sqoop是用map任务同步数据，由于经典网络EMR集群只有master节点可以访问公网，sqoop是用map任务同步数据可能在任意节点上运行，所以需要创建VPC集群同步私有公网数据库https://yq.aliyun.com/articles/43799?spm=5176.team18.teamshow1.61.uLsfCq

赞0 踩1 评论0
回答了问题 2019-07-17

用E-MapReduce sqoop产品导入数据后为什么hdfs目录是空的

这是因为指定了导入到hive的表里，hive 表有自己的hdfs目录sqoop会先先导入到指定的hdfs目录然后mv进hive自己的目录里

赞1 踩1 评论0
回答了问题 2019-07-17

E-MapReduce产品用sqoop同步数据hdfs目录要提前创建好么

为了避免脏数据，默认的用法，指定的目录不能存在，存在会报错，sqoop会创建这个目录并把数据文件放进去。如果需要往已存在的目录导入，要用--apend参数，可以参考 https://yq.aliyun.com/articles/38620

赞0 踩1 评论0
提交了问题 2016-05-25

sqoop还有哪些参数可以设置
提交了问题 2016-05-25

E-MapReduce产品 hive有客户端吗，就类似pl/sql的窗口那样
提交了问题 2016-05-25

E-MapReduce产品sqoop同步外网数据库还需要core节点访问外网？
提交了问题 2016-05-25

E-MapReduce产品用sqoop同步数据，hive创建表的结构一定要和数据库结构一样吗

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

鸿初_个人页

个人介绍

擅长的技术

都是default惹的祸-yarn调度（一）-fair调度器drf调度策略作业不执行问题的调查和源码分析

为什么要写技术文章-我对写作收获的理解

hive在E-MapReduce集群的实践（一）hive异常排查入门

Step by step，学习EMR集群的fair类型资源池

hive在E-MapReduce集群的实践（二）集群hive参数优化

自建hadoop集群迁移到EMR之数据迁移篇

用集群脚本功能安装大象医生优化你的大数据作业

E-MapReduce创建集群时没有勾选presto 现在想启动presto

E-MapReduce集群脚本-包年包月集群修改软件环境的利器

E-MapReduce的Presto组件默认支持访问oss数据

20160808北京云栖大会workshop-EMapReduce分析网站数据

Presto实现原理（转）

E-MR spark 本地测试读写odps 会默认限制数据条数吗

EMR创建完后网页上支持升级到新的EMR版本么

创建完EMR集群之后可以对单独的组件进行配置更改或者版本升级么？可以添加自定义的组件之类的么？

如何登陆E-MapReduce的core节点

【转】Spark 2.0 技术预览版:更简单、更快速、更智

使用E-MapReduce集群sqoop组件同步云外Oracle数据库数据到集群hive

用E-MapReduce sqoop同步私有公网数据库为什么要创建VPC集群

用E-MapReduce sqoop产品导入数据后为什么hdfs目录是空的

E-MapReduce产品用sqoop同步数据hdfs目录要提前创建好么

sqoop还有哪些参数可以设置

E-MapReduce产品 hive有客户端吗，就类似pl/sql的窗口那样

E-MapReduce产品sqoop同步外网数据库还需要core节点访问外网？

E-MapReduce产品用sqoop同步数据，hive创建表的结构一定要和数据库结构一样吗

E-MapReduce产品sqoop把数据导入hdfs一个目录还是hive的一个表中，这两种有区别吗

E-MapReduce的sqoop可以不指定--target-dir参数吗

E-MapReduce 1.3版本用的是sqoop2吗

在Aliyun E-MapReduce集群上 使用sqoop高级特性

都是default惹的祸-yarn调度（一）-fair调度器drf调度策略作业不执行问题的调查和源码分析

为什么要写技术文章-我对写作收获的理解

hive在E-MapReduce集群的实践（一）hive异常排查入门

Step by step，学习EMR集群的fair类型资源池

hive在E-MapReduce集群的实践（二）集群hive参数优化

自建hadoop集群迁移到EMR之数据迁移篇

用集群脚本功能安装大象医生优化你的大数据作业

E-MapReduce集群脚本-包年包月集群修改软件环境的利器

E-MapReduce的Presto组件默认支持访问oss数据

20160808北京云栖大会workshop-EMapReduce分析网站数据

Presto实现原理（转）

【转】Spark 2.0 技术预览版:更简单、更快速、更智

使用E-MapReduce集群sqoop组件同步云外Oracle数据库数据到集群hive

在Aliyun E-MapReduce集群上 使用sqoop高级特性

E-MapReduce创建集群时没有勾选presto 现在想启动presto

E-MapReduce创建集群时没有勾选presto 现在想启动presto

E-MR spark 本地测试读写odps 会默认限制数据条数吗

EMR创建完后网页上支持升级到新的EMR版本么

创建完EMR集群之后可以对单独的组件进行配置更改或者版本升级么？可以添加自定义的组件之类的么？

如何登陆E-MapReduce的core节点

E-MR spark 本地测试读写odps 会默认限制数据条数吗

EMR创建完后网页上支持升级到新的EMR版本么

创建完EMR集群之后可以对单独的组件进行配置更改或者版本升级么？可以添加自定义的组件之类的么？

如何登陆E-MapReduce的core节点

用E-MapReduce sqoop同步私有公网数据库为什么要创建VPC集群

用E-MapReduce sqoop产品导入数据后为什么hdfs目录是空的

E-MapReduce产品用sqoop同步数据hdfs目录要提前创建好么

用E-MapReduce sqoop同步私有公网数据库为什么要创建VPC集群

用E-MapReduce sqoop产品导入数据后为什么hdfs目录是空的

E-MapReduce产品用sqoop同步数据hdfs目录要提前创建好么

sqoop还有哪些参数可以设置

E-MapReduce产品 hive有客户端吗，就类似pl/sql的窗口那样

在Aliyun E-MapReduce集群上使用sqoop高级特性

在Aliyun E-MapReduce集群上使用sqoop高级特性