您好,咨询一个问题:关于数据库或者产品选型的问题
1.现状:数据来源oss,分析工具EMR集群
2.结果:分析结果数据存储到mysql
3.瓶颈:每天的数据有几十万,就相当于一个月数据可能会有3010(天)几十万(基础数据),mysql肯定不是一个很好选择,量越来越大,而且维度可能会不断增加,我们现在想找一个合适的数据仓库,
① 我看过Redshift和Greenplum,hbase、mongo、es等,能不能给一些建议,可以存储一定数据量,支持高级一点的查询语法
② 阿里云的产品能支持就更好了,
③ 因为我们的应用都是在阿里云上的,更倾向于阿里云的产品,希望能给个方案
谢谢!
推荐你使用HybridDB for PostgreSQL,或 rds pgsql,都支持直接读写OSS,通过OSS 外部表。
阿里内部今年双十一也使用了RDG PGSQL和HDB PG。
https://github.com/digoal/blog/blob/master/201706/20170601_02.md
https://github.com/digoal/blog/blob/master/201711/20171111_01.md
推荐阿里巴巴集团内部使用的数仓产品MaxCompute,低成本、高效,https://yq.aliyun.com/articles/78108
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。