开发者社区> 问答> 正文

爬虫使用了redis去重之后如何管理redis里面数据

一只爬虫如果每天勤劳工作,一年以后,已经爬取了上亿的数据,此时redis也同步存放了上亿的url,内存说不定去到了10G以上,请问各位大神,一般使用了redis去重机制之后,是不是数据就一直存放在redis里面?
还是说,可以有啥办法适当删除一部分数据达到优化效果,不然这样下去内存早晚得奔溃

展开
收起
李博 bluemind 2019-04-09 12:44:54 2024 0
1 条回答
写回答
取消 提交回答
  • 云栖社区Java、Redis、MongoDB运营小编,有意合作请联系钉钉:15810436147

    redis数据库一般作为数据缓存的地方比较好,redis存入的数据,尽量少用长久保存的,这样会降低查询效率。如果数据较少当然没问题,如果是大型数据的入库保存最好的选择是MySQL,或者MongoDB比较好。

    2019-07-17 23:32:55
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
云数据库Redis版的开源之路 立即下载
阿里技术专家煮茶:Redis主从复制基本原理 立即下载
Redis&MongoDB的同步、迁移以及混合云场景构建 立即下载