大数据开发套件—数据集成常见问题
我们在进行大数据开发过程中,会遇到各种问题,本文将定期收集整理一些在使用阿里云数加大数据开发套件进行数据同步过程中遇到的常见问题,供大家参考~
HBase基本知识介绍及典型案例分析
本文来自于2018年10月20日由中国 HBase 技术社区在武汉举办的中国 HBase Meetup 第六次线下交流会。
HBase基本知识介绍及典型案例分析 PPT 下载:http://hbase.group/slides/162
本次分享的内容主要分为以下五点:
HBase基本知识;
HBase读写流程;
RowKey设计要点;
HBase生态介绍;
HBase典型案例分析。
CIO指南:如何使用SAP HANA平台处理大数据
CIO指南:如何使用SAP HANA平台处理大数据
http://mp.weixin.qq.com/s?__biz=MjM5OTI2MjgyMA==&mid=2651785957&idx=1&sn=a2d234e1d...
MaxCompute表设计最佳实践
MaxCompute表设计最佳实践
产生大量小文件的操作
MaxCompute表的小文件会影响存储和计算性能,因此我们先介绍下什么样的操作会产生大量小文件,从 而在做表设计的时候考虑避开此类操作。
使用MaxCompute Tunnel SDK上传数据,上传过程中,每commit一次就会产生一个文件。
Spark内置图像数据源初探 | 6月27号云栖夜读
今天的首篇文章,讲述了:作者:林武康,花名知瑕, 阿里巴巴计算平台事业部EMR团队的高级开发工程师,Apache HUE Contributor, 参与了多个开源项目的研发工作,对于分布式系统设计应用有较丰富的经验,目前主要专注于EMR数据开发相关的产品的研发工作。
[Phoenix] 十二、数据迁移
数据迁移工具是否丰富,也在一定程度上决定了数据库的流行程度和它的生态圈。了解其相关工具,能让我们的数据迁移工作更加高效。本文主要介绍 Phoenix 的数据导入导出工具,希望给准备在 Phoenix 上做数据迁移的同学一些帮助。