开源大数据EMR_个人页

开源大数据EMR

文章

262

问答

视频

个人介绍

暂无个人介绍

擅长的技术

Java
Python
前端开发
Linux
数据库

获得更多能力

通用技术能力：

暂时未有相关通用技术能力~

云产品技术能力：

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明

高分内容

最新动态

文章
问答
视频

发表了文章 2017-07-27

开源大数据周刊-第62期
发表了文章 2017-07-21

开源大数据周刊-第61期
发表了文章 2017-07-07

开源大数据周刊-第58期

阿里云E-Mapreduce动态: EMR即将在新的版本中支持本地盘机型，大幅降低集群的存储成本。资讯借助亚马逊AWS Sno大数据如何改变垂直电商? 垂直电商仍旧将是平台电商们在未来极其有力的竞争者和合作者。
发表了文章 2017-06-20

开源大数据周刊-第57期

ECM功能上线北京region，用户可以通过EMR-3.2.0版本创建新集群体验，ECM提供组件的配置修改/起停等操作
发表了文章 2017-06-09

开源大数据周刊-第56期

阿里云E-Mapreduce实践: 使用hadoop restful api实现对集群信息的统计资讯全球因Hadoop服务器配置不当导致的数据泄露或达5120TB 网络犯罪分子近期开始针对配置不当的 Hadoop Clusters 与 CouchDB 服务器展开攻击活动。
发表了文章 2017-06-02

开源大数据周刊-第55期

云HBase新增支持深圳、上海区域、支持超过2个节点及高配节点。
发表了文章 2017-05-25

开源大数据周刊-第54期
发表了文章 2017-05-11

开源大数据周刊-第52期

利用yarn capacity scheduler在EMR集群上实现大集群的多租户的集群资源隔离和quota限制本文结合EMR集群，讲述了如何利用yarn capacity scheduler在EMR集群上实现大集群的多租户的集群资源quota限制与管控。
发表了文章 2017-05-05

开源大数据周刊-第51期
发表了文章 2017-04-27

开源大数据周刊-第50期

本周刊的内容包括人工智能在软件和硬件上的最新进展，以及Kylin、Kudu等开源软件的实践和实现原理分析
发表了文章 2017-04-21

开源大数据周刊-第49期

开源大数据周刊-第49期
发表了文章 2017-04-17

开源大数据周刊-第48期
发表了文章 2017-03-23

开源大数据周刊-第46期
发表了文章 2017-03-17

开源大数据周刊-第45期

阿里云E-MapReduce实践云HBase助力物联网建设物联网最大的特点写入量大，要求延迟低，且数据存量巨大。云HBase非常满足物联网存储需求，存储数P甚至百P的空间存储需求，延迟稳定在数毫秒之内，跟Hadoop分析体系有较为深入的结合，满足分析类的需求。
发表了文章 2017-03-03

开源大数据周刊-第43期

阿里云E-MapReduce动态 E-MapReduce发布新版本，可以在控制台管理meta表结构。资讯人脸识别，要靠哪些技术支撑，是否会泄露个人隐私？本文介绍人脸识别用到哪些技术，讨论如何保护用户隐私一图看懂AI阵营：学习AI 站错队可导致自取灭亡本文介绍现在AI技术阵营，对AI各流派进行细分，梳理了17种方法，并用图直观展现。
发表了文章 2017-02-24

开源大数据周刊-第42期

阿里云E-MapReduce动态阿里云HBase支持PB级别的分布式数据库即将开始公测资讯云时代的大数据存储-云HBase 纵观数据库发展的几十年，从网状数据库、层次数据库到RDBMS数据库，在最近几年的NewSQL的兴起，加上开源的运动，再加上云的特性，可以说是日新月异。
发表了文章 2017-02-24

开源大数据周刊-第41期

云数据库HBase公测开始 EMR产品价格全面优惠，价格和ECS自建一致
发表了文章 2017-02-09

开源大数据周刊-第40期

阿里云HBase支持PB级别的分布式数据库即将开始公测
发表了文章 2017-01-25

开源大数据周刊-第39期
发表了文章 2017-01-19

开源大数据周刊-第38期

本期关注：梨视频基于阿里云E-MapReduce搭建视频推荐系统的实践，Apache Eagle成为新的顶级项目，英特尔开源的分布式深度学习库BigDL，Hadoop 3.0新功能测评
发表了文章 2017-01-16

开源大数据周刊-第37期

[阿里云E-MapReduce动态] E-MapReduce 2.3.1镜像主版本发布基础镜像CentOS 6.5内核版本升级到2.6.32-642；并支持job failover 资讯 2017年数据领域的八大发展趋势在2017年数据社区将会有大量的机会出现，并伴随一些危机性的挑战，
发表了文章 2017-01-16

梨视频：基于阿里云E-MapReduce搭建视频推荐系统的实践

梨视频由前澎湃新闻掌门人邱兵创立。在上线之前，它就获得了黎瑞刚华人文化近1亿美元投资，旗下《微辣》栏目总播放量已经超过4亿，并在上线1个月后获得“年度视频新媒体”大奖。这样一款脱胎于传统媒体的创业型短视频软件，在视频领域异军突起，不仅让内人士在感叹梨视频内容生产力之强大的同时，也诧异于是谁在
发表了文章 2016-12-29

开源大数据周刊-第36期

阿里云E-MapReduce1.6.0版本上线，增加交互式工作台、支持独享机型；国际站上线，海外用户可以购买E-MapReduce服务
发表了文章 2016-12-29

首次揭秘|为6.4亿人次出行提供无线网络的技术架构

借助“互联网+大数据+机场”三轮驱动，掌慧纵盈每年为6.4亿人次出行提供无线网络连接服务。随着业务的拓展，随之后来的挑战是数据量的暴增。 2016年，掌慧纵盈（股票代码：835736）通过阿里云产品，率先构建了业界领先的大数据平台。本文阐述了一家物联网企业的业务架构和数据架构，以及技术选型
发表了文章 2016-12-22

开源大数据周刊-第35期
发表了文章 2016-11-24

开源大数据周刊-第31期

数据生态治理要啃硬骨头、将人类送上火星、大数据框架对比、SQL on Hadoop
发表了文章 2016-11-10

开源大数据周刊-第29期
发表了文章 2016-10-20

开源大数据周刊-第26期

云栖社区开源大数据专题回顾、后Hadoop时代圆桌讨论、Hadoop上云的冰与火、Flink的未来、城市大脑、大数据时代几个关键问题剖析
发表了文章 2016-10-13

开源大数据周刊-第25期

云栖大会开源大数据分享、空间大数据、银行大数据、Hbase迁移到EMR、机器学习python、R及TensorFlow深度学习
发表了文章 2016-09-29

开源大数据周刊-第24期

本周关注：意图搜索、hadoop3.0、大数据架构BI、大数据农业应用
发表了文章 2016-09-13

开源大数据周刊-第22期

本周关注：大数据部门、数据科学家、机器学习发展与机遇、spark2.0 Structured Streaming、Hbase运维、Sqoop、Flink的第一本书籍。
发表了文章 2016-09-07

开源大数据周刊-第21期

本周关注：大数据教育、翻译行业应用，大数据与管理的关系、hadoop与mpp的关系、Facebook 60T+的spark应用
发表了文章 2016-08-22

开源大数据周刊-第19期

本周关注：马云谈云计算、大数据、人工智能未来三十年，E-MapReduce存储计算分离，真实的大数据故事，spark session及spark mmlib、presto+oss
发表了文章 2016-08-01

开源大数据周刊-第16期

spark2.0已经发布，本期整理了一些spark的好文（包括最佳实践、原理等）推荐给大家。
提交了问题 2016-07-21

自己搭建的hadoop集群要迁移到EMR，数据怎么导上来呢？
发表了文章 2016-07-18

开源大数据周刊-第14期

大数据人才状况；大数据平台相关：数据采集、数据指标的量化、大数据平台建设的选型；性能优化相关：hive、hbase、jvm gc的优化；
发表了文章 2016-07-04

开源大数据周刊-第12期

本周包括全景洞察大数据全貌、数据分析师的职业规划、打造智能聊天机器人、E-Mapreduce的相关实践及动态、最近值得关注的大数据会议。
发表了文章 2016-06-20

开源大数据周刊-第10期

云上Hadoop之最佳实践
发表了文章 2016-06-06

开源大数据周刊-第8期

阿里云李津谈布局专有云的深层用意，2016年杭州第四次spark meetup见闻
发表了文章 2016-05-30

开源大数据周刊-第7期

运行于云端的Hadoop——数据即服务的论证，预先知晓Hadoop3.0新特性。
提交了问题 2016-05-28

E-Mapreduce的Spark软件安装目录
发表了文章 2016-05-23

开源大数据周刊-第6期

大数据的未来就像在沙子里淘金
提交了问题 2016-05-20

怎么登陆emapreduce的master节点
发表了文章 2016-05-16

开源大数据周刊-第5期

浅谈大数据在传统行业的落地之痛，Spark如何简化大数据工作
发表了文章 2016-04-24

开源大数据周刊-第2期

第二期准备了一些本周好的大数据技术的文章；列了近期一些大数据会议；业务方面还是大数据+各种各样的点，没有过多的列出；大数据融资领域还是融资不断；E-Mapreduce团队计划下周发布VPC方案，敬请期待；Aliyun-emapreduce-demo发布在github上，敬请关注。

...

暂无更多信息

发表了文章 2020-07-17

Apache Spark 3.0 中的向量化 IO
发表了文章 2020-07-17

7月23日社区直播【TFPark: Distributed TensorFlow in Production on Apache Spark】
发表了文章 2020-07-16

大神带练， 0基础Spark训练营限时免费抢报！
发表了文章 2020-07-15

SparkSQL中产生笛卡尔积的几种典型场景以及处理策略
发表了文章 2020-07-14

再出王牌：阿里云 Jindo DistCp 全面开放使用，成为阿里云数据迁移利器
发表了文章 2020-06-16

EMR Spark-SQL性能极致优化揭秘 Native Codegen Framework
发表了文章 2020-06-16

我们欠国内Spark开发者的，用一场掷地有声的中文峰会来还
发表了文章 2020-06-12

Spark Packages寻宝（一）：简单易用的数据准备工具Optimus
发表了文章 2020-06-11

直播 | Delta Lake 如何帮助云用户解决数据实时入库问题
发表了文章 2020-06-09

6月11日 JindoFS 系列直播【JindoFS 存储策略和读写优化】
发表了文章 2020-06-09

Spark-TFRecord: Spark将全面支持TFRecord
发表了文章 2020-06-08

不通过 Spark 获取 Delta Lake Snapshot
发表了文章 2020-06-04

直播 | 阿里、快手、Databricks、网易云音乐...国内外大数据大佬齐聚一堂要聊啥？
发表了文章 2020-06-04

阿里云发起首届 Spark “数字人体” AI 挑战赛 — 聚焦上班族脊柱健康
发表了文章 2020-05-21

首届 Apache Spark AI智能诊断大赛重磅来袭！
发表了文章 2020-05-20

SparkSQL与Hive metastore Parquet转换
发表了文章 2020-05-19

5月21日 Spark 社区直播【Spark on Zeppelin】
发表了文章 2020-05-18

物化视图在 SparkSQL 中的实践
发表了文章 2020-05-14

招聘！招聘！招聘！计算平台解决方案架构师专场
发表了文章 2020-05-14

Spark + AI Summit 2020 中文议题有奖征集

正在加载, 请稍后...

滑动查看更多

回答了问题 2020-03-16

怎样进钉钉2个群

赞0 踩0 评论0
提交了问题 2019-05-05

请教一下，delta是不是可以理解为，是基于hdfs的行级别的数据库？然后对于更新数据对于hdfs产生小文件的解决方案是他会提供merge机制？
提交了问题 2019-05-05

workflow这个功能很期待，想问下他的工作流之间的依赖关系是怎么建立的，是用户自己定义么？
提交了问题 2019-05-05

spark 与 tensorflow 结合有没有方案？
回答了问题 2019-07-17

请教一下，delta是不是可以理解为，是基于hdfs的行级别的数据库？然后对于更新数据对于hdfs产生小文件的解决方案是他会提供merge机制？

是的，可以大致这样理解。是行级别的，但下面存储格式基本上还是以 Parquet/ORC 列式为主；delta 小文件要及时合并的，否则性能很差。数据库这个提法不一定好，因为并不会用于 OLTP；可以说是数据仓库，OLAP 场景为主的。关于这个区别，我的一篇文章里面讲得比较细。可以看看。https://yq.aliyun.com/articles/699919?spm=a2c4e.11153959.0.0.4f427507ntu6fX

赞0 踩0 评论0
回答了问题 2019-07-17

workflow这个功能很期待，想问下他的工作流之间的依赖关系是怎么建立的，是用户自己定义么？

这个问题很高级，你们是不是已经在玩了？不过工作流的定义过程里面，必然会形成各个工作流节点之间的依赖关系，定义工作流本身就是定义各个节点和他们之间的上下游关系，也就形成了这些依赖关系。如果你问的是多个工作流之间是不是还可以形成更高层次的依赖关系，我没有深入去看，感觉目前还比较早一点，不一定已经支持了。

赞1 踩0 评论0
回答了问题 2019-07-17

spark 与 tensorflow 结合有没有方案？

分享里面(4月28日钉钉群分享）提到的 Hydrogen 项目就是要系统支持这些深度学习框架的。Spark 3.0 会包含进去。你找到相关 SPIP，JIRA 和 PPT 挖一下。

赞0 踩0 评论0
提交了问题 2019-04-26

E-MapReduce 集群 header 节点有公网 IP，存在安全风险，是否可以通过 ECS 控制台关闭公网 IP，关闭公网 IP 是否会对 E-MapReduce 服务产生影响?
提交了问题 2019-04-26

如何登陆 Core 节点，并进行 root 权限操作
提交了问题 2019-04-26

E-Mapreduce 主节点不允许安装其它软件？
提交了问题 2019-04-26

已有/现存 ECS 是否可以用到 EMR 集群中
提交了问题 2019-04-26

自动续费
提交了问题 2019-04-26

集群续费问题
提交了问题 2019-04-26

创建集群失败，构建失败 "The specified instance Type exceeds the maximum limit for the PostPaid instances. "
提交了问题 2019-04-26

创建大数据机型（D1）的问题
提交了问题 2019-04-26

高安全集群
提交了问题 2019-04-26

E-MapReduce 按量高配节点问题
提交了问题 2019-04-26

错误提示：指定的 InstanceType 未授权使用
提交了问题 2019-04-26

错误提示：zone 或者 Cluster 的库存不够了
提交了问题 2019-04-26

错误提示：The Node Controller is temporarily unavailable

正在加载, 请稍后...

滑动查看更多

正在加载, 请稍后...

暂无更多信息

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

开源大数据EMR_个人页

个人介绍

擅长的技术

开源大数据周刊-第62期

开源大数据周刊-第61期

开源大数据周刊-第58期

开源大数据周刊-第57期

开源大数据周刊-第56期

开源大数据周刊-第55期

开源大数据周刊-第54期

开源大数据周刊-第52期

开源大数据周刊-第51期

开源大数据周刊-第50期

开源大数据周刊-第49期

开源大数据周刊-第48期

开源大数据周刊-第46期

开源大数据周刊-第45期

开源大数据周刊-第43期

开源大数据周刊-第42期

开源大数据周刊-第41期

开源大数据周刊-第40期

开源大数据周刊-第39期

开源大数据周刊-第38期

开源大数据周刊-第37期

梨视频：基于阿里云E-MapReduce搭建视频推荐系统的实践

开源大数据周刊-第36期

首次揭秘|为6.4亿人次出行提供无线网络的技术架构

开源大数据周刊-第35期

开源大数据周刊-第31期

开源大数据周刊-第29期

开源大数据周刊-第26期

开源大数据周刊-第25期

开源大数据周刊-第24期

开源大数据周刊-第22期

开源大数据周刊-第21期

开源大数据周刊-第19期

开源大数据周刊-第16期

自己搭建的hadoop集群要迁移到EMR，数据怎么导上来呢？

开源大数据周刊-第14期

开源大数据周刊-第12期

开源大数据周刊-第10期

开源大数据周刊-第8期

开源大数据周刊-第7期

E-Mapreduce的Spark软件安装目录

开源大数据周刊-第6期

怎么登陆emapreduce的master节点

开源大数据周刊-第5期

开源大数据周刊-第2期

Apache Spark 3.0 中的向量化 IO

7月23日社区直播【TFPark: Distributed TensorFlow in Production on Apache Spark】

大神带练， 0基础Spark训练营限时免费抢报！

SparkSQL中产生笛卡尔积的几种典型场景以及处理策略

再出王牌：阿里云 Jindo DistCp 全面开放使用，成为阿里云数据迁移利器

EMR Spark-SQL性能极致优化揭秘 Native Codegen Framework

我们欠国内Spark开发者的，用一场掷地有声的中文峰会来还

Spark Packages寻宝（一）：简单易用的数据准备工具Optimus

直播 | Delta Lake 如何帮助云用户解决数据实时入库问题

6月11日 JindoFS 系列直播【JindoFS 存储策略和读写优化】

Spark-TFRecord: Spark将全面支持TFRecord

不通过 Spark 获取 Delta Lake Snapshot

直播 | 阿里、快手、Databricks、网易云音乐...国内外大数据大佬齐聚一堂要聊啥？

阿里云发起首届 Spark “数字人体” AI 挑战赛 — 聚焦上班族脊柱健康

首届 Apache Spark AI智能诊断大赛重磅来袭！

SparkSQL与Hive metastore Parquet转换