文档备案控制台

开发者社区问答正文

java如何解决上亿级别的数据读取,及内存开销.：报错

如用户上网时间段合并，用户的上网时间段可能有上亿级别的数据也可能有千万，首先得读取到用户这些数据，怎么解决大数据量的问题，及内存的开销呢？

展开

收起

kun坤 2020-06-06 23:14:09 1204 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

kun坤

建议考虑下NoSql数据库和Map/Reduce架构（如Hadoop）######放在数据库里面######

一个用户有上亿条数据？

还是在上亿条里面有所有用户。

######就是解决大数据在java中的计算，及内存开销问题######分布式集群、搜索引擎和nosql
######
对于这种上网日志行为的数据。如果把所有用户的数据放到同一个表格同一个数据库里面，说明设计上就有问题。

这种历史数据，完全可以采用分库分表策略（按用户的ID进行分库分表）
######换php######你确定这样可以？######他说有1一条日志，不是1亿访问量，用个算法处理一下，再分文件存储 [0]###### 应该分层处理以及避免过早优化，程序该怎么写就怎么写。
数据库自动cache或者加面对开发透明的cache，诸如mc/redis，适当修改逻辑，提高命中率就好。不过要考虑网络传输成本，或者多几个节点来分流预热数据，尽量减少网络和磁盘开销。Java数据读取：http://edu.51cto.com/course/course_id-3283.html

2020-06-06 23:14:47

赞同展开评论

问答分类：

Java 云原生大数据计算服务 MaxCompute

问答标签：

Java内存 Java报错 Java数据报错 Java数据数据内存

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

CSV虚拟机中的内存数据是如何保证其不被主机或其他CSV虚拟机解密的？

256

1

0

在Nacos中内存占用过大，如何解决？

2088

2

0

在视觉智能平台中java项目跑内容文本内容审核有问题，如何解决？

231

3

0

Tair如何解决内存统计不准确的问题？

165

1

0

在云效中我把代码的java版本降到17，还是会报错，如何解决？

219

1

0

Java调用流式输出api时，绘图出不了图片链接，但是在调用非流式输出是可以出图片链接的，如何解决？

453

1

0

Rust如何解决use-after-free这类内存安全问题？

182

1

0

Redis 发生内存 swap 后，应该如何解决？

173

1

0

当Redis内存达到maxmemory后，淘汰数据的逻辑是怎样的？

200

1

0

DataWorks语句改了表名之后，原表为什么还在数据地图能找到，这种情况原表仍然在占内存吗？

189

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

我用qoder 和 codex+deepseek 及claude + qwen 3.7同时解题目

阿里云服务器多少钱一年？支持40个连接的配置

阿里云服务器多少钱一年企业用？公司用什么配置？

阿里云服务器多少钱一年？企业用的配置费用价格

阿里云服务器多少钱一年？学生用的配置价格

相关文章

WorkBuddy 深度实战:把重复工作交给AI，一人撑起团队的技术产出

Codex与Claude Code 深度拆解:两代 AI编程智能体的技术本质与Java实战指南

RabbitMQ 消息队列实战：交换机、队列与消息转换器全解析（2026 实测）

不吹不黑，DeepSeek 编程实测翻车：这些低级问题暴露真实水平

Tair 替换 Redis 实战：企业级缓存升级的性能对比与零停机迁移方案

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

数据守护：防勒索攻击数据保障

多模态数据信息提取

高效存储和处理多媒体数据

还有其他疑问?