搞了一年的mdrill项目,数据量膨胀了1000呗,还是依然原先的10台机器。
悲剧啊,真想说任何不给机器的需求都是耍流氓。
小小coding们,有没有感觉到程序员一般都不会PK呢?
时间点 | 数据量 | 事件 |
12年12月 | 小于2亿 | adhoc首次上线 |
13年1月 | 20~30亿 | 由2台机器扩容到了10台 |
13年5月2日 | 100亿 | 首次过百亿 |
13年7月24日 | 400亿 | 首次开源 |
13年11月 | 1000亿 | 全文检索模式ods_allpv_ad_d上线 |
13年12月 | 1500亿 | 实时数据以及无线数据的接入 |
14年2月 | 3200亿 | 目前只有10台机器,硬盘使用率30% |
mdrill地址:
https://github.com/alibaba/mdrill
算广告吗?哈。3200亿,相当于320G的量,我不知道你这个是bit呢,还是条数。哈。如果一条数据128byte,那么你这个就有40Tbyte的数据,10台机器,平均4Tbytes的数据。那么你每个机器的硬盘空间应该大约在 15Tbytes左右,机器没有替换过,12年的机器,15Tbytes的存储,也是好机器哦。哈。######使用率才30% 还好啊,cpu idle和内存的使用情况呢 ?
######这是大神啊######坐等大神现身######
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。