备案控制台

开发者社区问答正文

2千万的索引库，完全匹配字段时用lucene直接读库还是将数据封装到map中查找较好？：报错

现有2千万条数据的索引库（可能更多），每条数据包含两个字段(word、count),现在要输入一个word查找count值，请问如何使用才是最佳方案？
目前有三种想法：1.用lucene直接从硬盘读索引库进行匹配，
2将索引库预先加载到内存中匹配，
3将数据读取后封装成map,通过key查找value,请问哪种比较好？大侠们还有其它方案么？？？？

展开

收起

kun坤 2020-06-06 15:43:19 572 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

kun坤

要分词只能lucene，如果是纯==匹配，redis和memcached会更好；######不用分词，是完全匹配，，目前是用map封装，直接用KEY找Value，但是效率貌似不高######memcached######nosql数据库不正是你的绝佳选择吗######数据都是lucene建的本地索引，只能在代码上寻找新方法，换数据库不靠谱啊，客户的数据库都要求统一处理方式######增加一个hash字段，把word的hash值写在这个字段里，然后索引，查询的时候就用这个hash值进行查询，应该能提高性能

2020-06-06 15:43:25

赞同展开评论

问答分类：

索引

问答标签：

封装Map 数据Map Map报错库Map Map字段

问答地址：

开发者社区 > 云计算 > 问答

相关问答

Hologres创建maxcompute外表map类型字段在映射时为空

128

1

0

使用dataworks中系统自带的map函数构建字段，发现=变为了\u003d 什么原因？

1044

2

0

flink 使用MapState，我定义的对象里面包含了一些Map，序列化会报错，有什么办法嘛？

129

1

0

Maxcompute表中的map类型字段在创建外表的时候数据类型为空

124

1

0

ModelScope中这个map好像可能只支持999个，每次打到这里就报错，有什么办法解决么？

139

0

0

springboot应用的nacos配置类中【Map对象的某个字段为null】是什么原因？

351

1

0

datawork api看文档返回的是个map，如果我一次性要查很多条数据，该怎么用？

213

12

0

flink cdc 写代码的方式接收数据-map操作-sink到表是导入那个Maven依赖啊？

120

0

0

AI Earth的map.addLayer运行没有报错，但是地图上没有显示是什么原因？

119

0

0

为什么nacos-当配置存在map类型，移除元素无效，保留的还是原来的数据怎么办？

230

0

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

PolarDB这个PXD部署这个端口可以指定吗？

通义灵码启动异常，可点击按钮进行一键修复，如仍无法解决，请参考[问题排查指南](https://he

关于idea lingma欺骗的对话。请开发者尽快修复

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

相关文章

Spring Boot 整合 Elasticsearch 及实战应用

PageAdmin CMS如何配置全文检索

PageAdmin CMS如何配置全文检索功能

火语言RPA制作农产品价格采集工具（界面交互 + 数据采集 + 导出）

从一条慢SQL说起：交易订单表如何做索引优化

还有其他疑问?