备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

热数据复制是什么？

已解决

热数据复制是什么？

展开

收起

游客lmkkns5ck6auu 2022-08-10 14:04:46 380 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客c3gxxcx6cqeyo

推荐回答

通过将访问频繁的热数据进行跨集群缓存，减少频繁读取产生的直读流量。我们通过数据分析发现，有些数据被很多 job 依赖，我们称之为热数据。热数据一般数据量比较大，并且被读取次数很多。于是我们有了一个很自然的想法，将这些热数据在 remote cluster 进行缓存。由于存储是有代价的，因此这里的问题其实是一个trade-off，在最小化带宽消耗和最小化冗余存储之间做权衡。为了降低问题的复杂度以便于求解，我们通过数据分析发现，数据的访问有一个特点：数据的访问频率与大小和数据的产出时间相关，越新的数据被访问的频率越高、被读取的越大。因此，我们将问题转化为两个问题：对哪些表进行复制、这些表的复制生命周期。问题的目标是在一定冗余存储限制的前提下，最小化带宽消耗，包括复制带宽消耗和直读带宽消耗。

以上内容摘自《“伏羲”神算》电子书，点击https://developer.aliyun.com/topic/download?id=873

2022-08-11 10:33:21

赞同展开评论

问答分类：

云原生大数据计算服务 MaxCompute

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

83523

47

0

请问下我访问接口不通什么原因 Provisional headers are shown

3635

1

0

sql server的用户名和密码怎么查啊？

37460

21

0

this xml file does not appear to have any style in

51800

10

0

重启Docker后报错：Error response from daemon

2243

0

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60889

32

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3608

1

0

OSS的endpoint如何查看

37457

6

0

阿里云服务器如何重置系统？

24699

4

0

已经创建好了accesskey, 但是忘了了 secret, 在哪里可以查看?

8823

3

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

收录在圈子:

阿里巴巴大数据计算

347744

+ 订阅

MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库，以 Serverless 架构提供快速、全托管的在线数据仓库服务，消除了传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您可以经济并高效的分析处理海量数据。数以万计的企业正基于 MaxCompute 进行数据计算与分析，将数据高效转换为业务洞察。

相关文章

【跨国数仓迁移最佳实践6】MaxCompute SQL语法及函数功能增强，10万条SQL转写顺利迁移

ODPS 十五周年实录 | Data + AI，MaxCompute 下一个15年的新增长引擎

【跨国数仓迁移最佳实践7】基于 MaxCompute 多租的大数据平台架构

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

网站代码网站源代码网页源代码网页代码网站

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

请教个大数据计算MaxCompute问题，报这个错误是啥情况？

Dataworks中MaxCompute表怎么创建唯一索引啊?

sparksql中cte物化方式是怎样的

请问大家一般而言，在做技术选型的时候，会怎么选择 EMR 和 MaxCopmute ？

在大数据计算MaxCompute中，这要怎么修改字段类型？

大数据计算MaxCompute中maxcompute spark如何读取 oss 上面的文件？

阿里云一个CU对应多少cpu和内存?

大数据计算MaxCompute阿里云一个CU对应多少cpu和内存？

阿里云和腾讯云服务器哪个好！

展开全部

大数据环境下该如何优雅地设计数据分层

odps是什么?

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

吴刚专访--大数据和 MaxCompute 技术和故事

2017杭州云栖大会FAQ（持续更新中）

Python+大数据计算平台，PyODPS架构手把手教你搭建

【大数据干货】轻松处理每天2TB的日志数据，支撑运营团队进行大数据分析挖掘，随时洞察用户个性化需求。

干货：解码OneData，阿里的数仓之路。

[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

展开全部

还有其他疑问?