sphinx全文检索引擎

简介: sphinx全文检索引擎

sphinx站内搜索

基于SQL的全文检索引擎


mysql 索引

# 加索引
mysql> alter table <table_name> add index <index_name>(<field_name>);
# 加主关键字的索引
mysql> alter table <table_name> add primary key (<field_name>);

应用场景

1、站内搜索

2、后台搜索


PHP -> MySQL

PHP -> Sphinx <-> MySQL


优势

mysql直接查询较慢

中文分词

速度快

-高速建立索引 10M/s

-高性能搜索 2-4G 0.1s

-海量数据


安装

http://sphinxsearch.com/


$ whereis sphinxsearsh


两个重要的工具

indexer:用于创建索引

searched:用于后台


配置

/etc/sphinxsearch/sphinx.conf


工作原理

indexer —> index data <— searched <— service/web


生成索引数据

/usr/bin/indexer --config /etc/sphinxsearch/sphinx.conf --all


索引文件存储的数据种类

.spa 存储文档属性

.spd 存储每个词ID可匹配的文档ID列表

.sph 存储索引头信息

.spi 存储词列表

.spm 存储MVA数据

.spp 存储每个词的命中列表


查看进程

ps -axu |grep searched


查看sphinx数据

mysql -h0 -p9306


select * from <index_name> limit 10;

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。 &nbsp; 相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/mysql&nbsp;
相关文章
|
安全 jenkins 网络安全
在配置 Gitee 时需要注意什么?
通过注意以上这些方面,可以更好地配置Gitee,保障项目的代码管理安全、高效、有序,为团队的协作开发和代码上线流程提供有力的支持。
|
机器学习/深度学习 自然语言处理 算法
深度学习在自然语言处理中的应用与展望
本文深入探讨了深度学习技术在自然语言处理(NLP)领域的广泛应用及其未来发展方向。通过具体案例分析,如机器翻译、情感分析和文本生成等,展示了深度学习如何提高NLP任务的准确性和效率。同时,文章也讨论了当前深度学习在NLP中面临的挑战,包括数据偏见、模型解释性不足等问题,并提出了可能的解决策略。最后,本文展望了深度学习与NLP结合的未来趋势,强调了持续创新和跨学科合作的重要性。
|
机器学习/深度学习 数据采集 存储
算法金 | 决策树、随机森林、bagging、boosting、Adaboost、GBDT、XGBoost 算法大全
**摘要:** 这篇文章介绍了决策树作为一种机器学习算法,用于分类和回归问题,通过一系列特征测试将复杂决策过程简化。文章详细阐述了决策树的定义、构建方法、剪枝优化技术,以及优缺点。接着,文章讨论了集成学习,包括Bagging、Boosting和随机森林等方法,解释了它们的工作原理、优缺点以及如何通过结合多个模型提高性能和泛化能力。文中特别提到了随机森林和GBDT(XGBoost)作为集成方法的实例,强调了它们在处理复杂数据和防止过拟合方面的优势。最后,文章提供了选择集成学习算法的指南,考虑了数据特性、模型性能、计算资源和过拟合风险等因素。
455 0
算法金 | 决策树、随机森林、bagging、boosting、Adaboost、GBDT、XGBoost 算法大全
|
C# 开发者 Windows
WPF在.NET9中的重大更新:Windows 11 主题
WPF在.NET9中的重大更新:Windows 11 主题
267 0
|
存储 监控 前端开发
【专栏】阿里云ARMS前端监控的引入方法,以提升应用质量和稳定性
【4月更文挑战第29天】本文介绍了阿里云ARMS前端监控的引入方法,以提升应用质量和稳定性。该工具通过实时收集和分析用户行为、性能数据,提供错误监测和实时告警。步骤包括注册阿里云账号,创建前端监控项目,获取并嵌入监控代码到页面中,部署并运行,最后查看监控数据。案例和经验分享强调了合理设置监控指标、与其他工具结合以及定期分析数据的重要性。注意保护用户隐私,正确管理监控代码,并解决可能出现的数据不准确和大量错误告警问题。
447 1
|
网络协议 Ubuntu 安全
Linux常用命令速查册,再也不用费脑细胞了
Linux常用命令速查册,再也不用费脑细胞了
Linux常用命令速查册,再也不用费脑细胞了
SAP 批量更改物料描述
由于公司业务部门需要,向我提出的这个要求,我就在网上查了下,看到了一位知乎的前辈大神写了但是不是特别详细,笔者测试了下,把过程更详细的记录了一下,也挺好用,就在这里记录和分享一下! 比如现在业务部门提出物料主数据中物料描述维护错了,要批量进行修改,而且每个物料这个字段的值是不一样的,此时可以使用MASS事物码通过EXCEL进行批量维护。经常使用MASS将主数据的某个字段修改为相同的值,其实可以使用MASS导入EXCEL进行字段修改,也可将统一字段修改为不同的值,主数据的更改可以不通过LSMW实现。MASS可以实现很多主数据的修改,进入事物码MASS选择对象类型,可实现对不同主数据的更改!
SAP 批量更改物料描述
|
机器学习/深度学习 人工智能 缓存
骁龙845公布了一大堆参数,到底都提升了些啥?
昨日(12月7日)凌晨4点,高通爸爸终于公布了其新一代移动端旗舰芯片——骁龙845的具体规格和参数。
571 0
骁龙845公布了一大堆参数,到底都提升了些啥?
|
机器学习/深度学习 文字识别 自然语言处理
机缘巧合诞生的讯飞语音输入法,如何累积了 4 亿用户?
在 11 月 2 日的讯飞输入法沟通会上,讯飞输入法产品总监翟吉博分享了讯飞输入法背后的故事,包括这是一个最初仅 4 人的「小项目」、涟漪效应为这款输入法带来的提升、以及他们对输入法这一产品的思考。
667 0
机缘巧合诞生的讯飞语音输入法,如何累积了 4 亿用户?