我有这么个想法,如下:
1.Solr 分词后倒排信息存入 HBase;
2. 检索的时候,Solr 读取 HBase 中存储的数据,支持实时检索业务;
3. HBase 如何存倒排数据?查询总数该如何汇总?
4. 统计和分组业务 功能该如何来做?
5. 如果使用 HBase的协处理器,是否会影响入库或查询的性能?
========================================
如上,只是我目前的想法,其中有一些问题,我没想法如何来实现。如果,我那块描述有问题,请留言交流,我会一一答复!
各位大神,如果有思路,请给予分享和支持。谢谢。
solr自己就有集群方案,而且是基于hadoop的。用不着你来实现
######基于 hadoop, 我遇到过 索引文件在 hdfs 出问题的坑。版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。