开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks数据分析电子表格超过5000条,保存报错了,可以优化么?

DataWorks数据分析电子表格超过5000条,保存报错了,可以优化么?

展开
收起
真的很搞笑 2023-08-07 20:42:15 75 0
2 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    有以下几点可以优化:

    使用数据库取代电子表格:
    电子表格存在数据量限制,一般不适合存储超过5000条的数据。可以考虑使用DataWorks内置的数据库(如ODPS 或 SQL Server),存储和分析数据。

    只在电子表格显示部分数据:
    电子表格只用来展示5000条左右数据,其他多余数据仍然存储在数据库中。需要时再查询部分数据显示在电子表格中。

    分割表存储:
    将数据按时间排序后,分段存储在多个电子表格中。每个表格5000条左右。需要分析时聚合多个表格。

    使用流计算:
    将原始大数据首先加载到流计算(如fluxDB)中存储,在电子表格中连接流计算查看实时的数据。

    接入大数据分析平台:
    由专业的大数据分析和存储平台接入原始数据,DataWorks只负责数据分析展示。可以接入TDW、HoloView等。

    综上,对于DataWorks电子表格报错的情况,最佳实践是:

    不要依赖电子表格存储超5k的数据
    使用数据库来存储原始数据,电子表格只负责展示
    通过分段存储、流计算或大数据分析解决方案,实现实时大数据分析

    2023-08-09 17:22:43
    赞同 展开评论 打赏
  • 辛苦发一下完整截图 和报错文本+地域信息 ,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-08-08 23:21:03
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 热门讨论

    热门文章

    相关电子书

    更多
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载