开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks数据分析电子表格超过5000条,保存报错了,可以优化么?

DataWorks数据分析电子表格超过5000条,保存报错了,可以优化么?

展开
收起
真的很搞笑 2023-08-07 20:42:15 84 0
2 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    有以下几点可以优化:

    使用数据库取代电子表格:
    电子表格存在数据量限制,一般不适合存储超过5000条的数据。可以考虑使用DataWorks内置的数据库(如ODPS 或 SQL Server),存储和分析数据。

    只在电子表格显示部分数据:
    电子表格只用来展示5000条左右数据,其他多余数据仍然存储在数据库中。需要时再查询部分数据显示在电子表格中。

    分割表存储:
    将数据按时间排序后,分段存储在多个电子表格中。每个表格5000条左右。需要分析时聚合多个表格。

    使用流计算:
    将原始大数据首先加载到流计算(如fluxDB)中存储,在电子表格中连接流计算查看实时的数据。

    接入大数据分析平台:
    由专业的大数据分析和存储平台接入原始数据,DataWorks只负责数据分析展示。可以接入TDW、HoloView等。

    综上,对于DataWorks电子表格报错的情况,最佳实践是:

    不要依赖电子表格存储超5k的数据
    使用数据库来存储原始数据,电子表格只负责展示
    通过分段存储、流计算或大数据分析解决方案,实现实时大数据分析

    2023-08-09 17:22:43
    赞同 展开评论 打赏
  • 辛苦发一下完整截图 和报错文本+地域信息 ,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-08-08 23:21:03
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 相关电子书

    更多
    Python第四讲——使用IPython/Jupyter Notebook与日志服务玩转超大规模数据分析与可视化 立即下载
    互联网下半场的角逐,玩转轻资产的大数据服务—图(关系网络)数据分析与阿里应用 立即下载
    如何使用大数据计算服务 MaxCompute进行数据分析 立即下载