在SQL Server 2005中用存储过程实现搜索功能-阿里云开发者社区

在SQL Server 2005中用存储过程实现搜索功能

2017-11-26 973

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云数据库 RDS SQL Server，基础系列 2核4GB

RDS SQL Server Serverless，2-4RCU 50GB 3个月

简介：

现在很多网站都提供了站内的搜索功能，有的很简单在SQL语句里加一个条件如：where names like ‘%words%’就可以实现最基本的搜索了。

我们来看看功能强大一点，复杂一点的搜索是如何实现的（在SQL　ＳＥＲＶＥＲ２００／２００５通过存储过程实现搜索算法）。

我们把用户的搜索可以分为以下两种：

1.精确搜索,就是把用户输入的各个词语当成一个整体,不分割搜索.

2.像百度,GOOGLE一样的,按空格把输入的每一个词分离,只要包含这些词语,而不管出现的顺序，称为ALL-Word Search.

3.对输入的词只要有一个出现就为匹配称为Any-Word Search

一、对搜索结果进行排序的算法

在前面提到的LIKE语句最大的问题就是搜索的结果是没有经过排序的,我们不知道结果出现在的顺序是如何的,因为它是随机的。像百度,GOOGLE都会对结果用算法进行排序再显示的.好我们也来建立一个简单的排序法。一个很常见的算法是计算关键词在被搜索内容中出现的次数,次数最多的排在结果的第一位。我们的是在存储过程中实现这个算法的，而在ＳＱＬSERVER中没有提供计算关键词在被搜索内容中出现的次数这样的函数，我们要自己写一个UDF（User-Defined Functions）,UDF是SQLSERVER的内部函数，可以被存储过程调用或者被其他UDF调用。函数如下：

CREATE FUNCTION dbo.WordCount
2

( @Word VARCHAR( 15),
4

@Phrase VARCHAR( 1000))
6

RETURNS SMALLINT
8

AS
10

BEGIN
12

/* 如果@Word 或者@Phrase 为空返回 0 */
14

IF @Word IS NULL OR @Phrase IS NULL RETURN 0
16

/* @BiggerWord 比@Word长一个字符 */
18

DECLARE @BiggerWord VARCHAR( 21)
20

SELECT @BiggerWord = @Word + ' x '
22

/*在 @Phrase用@BiggerWord替换@Word */
24

DECLARE @BiggerPhrase VARCHAR( 2000)
26

SELECT @BiggerPhrase = REPLACE ( @Phrase, @Word, @BiggerWord)
28

/* 相减结果就是出现的次数了 */
30

RETURN LEN( @BiggerPhrase) - LEN( @Phrase)
32

END
34

以上就是整个UDF，它用了一个很高效的方法来计算关键词出现的次数。

二、参数传递

用户输入的关键词从一个到多个不等，我们可以把参数固定为@word1~@word5，这样比较方面实现。当用户输入超过5个时，忽略不计，少于5个的地方视为空。其实GOOGLE也是这样做的，只是GOOGLE的最大词语限制是10个。

三、搜索的实现过程

假定我们对Product表进行搜索，Product字段有：Id,Name ,Descripton(产品描述)，搜索要同时对Name 和 Description进行。

Any-World Search实现如下：

SELECT Product.Name,
2

3 * WordCount( @Word1, Name) + WordCount( @Word1, Description) +
3

3 * WordCount( @Word2, Name) + WordCount( @Word2, Description) +
5

AS Rank
9

FROM Product
10

这里对Name赋予权重为3，Description为1（大家根据实际情况赋予不同的权重），Rank是计算列，通过前面定义的UDF计算所关键词出现的次数乘上权重等到的。

同样的All-Word Search实现如下：

SELECT Product.Name,
2

( 3 * WordCount( @Word1, Name) + WordCount( @Word1, Description)) *
4

CASE
6

WHEN @Word2 IS NULL THEN 1
8

ELSE 3 * WordCount( @Word2, Name) + WordCount( @Word2, Description)
10

END *
12

AS Rank
16

FROM Product
18

这时把每个关键词出现的次数相乘只要一个没出现

RANK 就为 0 ，为 0 就是搜索结果为空。

还可以这样实现：

SELECT Product.Name,
2

CASE
3

WHEN @Word1 IS NULL THEN 0
4

ELSE ISNULL( NULLIF(dbo.WordCount( @Word1, Name + ' ' + Description), 0), - 1000)
5

END +
6

CASE
7

WHEN @Word2 IS NULL THEN 0
8

ELSE ISNULL( NULLIF(dbo.WordCount( @Word2, Name + ' ' + Description), 0), - 1000)
9

END +
10

AS Rank
12

FROM Product

对没出现的关键词赋值-1000，这样Rank就肯定为负数，负数表示搜索结果为空。

四、对结果进行分页

搜索的结果可能很多，对结果分页可以提高性能。我在如何在数据层分页以提高性能已经说明了如何用存储过程进行分页了，这里就不在详细复述了。

过程简单来说就是创建一个临时表，表中包含行号，读取时按行号来读取数据

五、完整代码

经过前面的分析，完整代码如下：

CREATE PROCEDURE SearchCatalog
2

(
3

@PageNumber TINYINT,
4

@ProductsPerPage TINYINT,
5

@HowManyResults SMALLINT OUTPUT,
6

@AllWords BIT,
7

@Word1 VARCHAR( 15) = NULL,
8

@Word2 VARCHAR( 15) = NULL,
9

@Word3 VARCHAR( 15) = NULL,
10

@Word4 VARCHAR( 15) = NULL,
11

@Word5 VARCHAR( 15) = NULL)
12

AS
13

/* 创建临时表，保存搜索的结果（Sql Server2005适用，Sql Server2000见如何在数据层分页以提高性能） */
14

DECLARE @Products TABLE
15

(RowNumber SMALLINT IDENTITY ( 1, 1) NOT NULL,
16

ID INT,
17

Name VARCHAR( 50),
18

Description VARCHAR( 1000),
19

Rank INT)
20

/* Any-words search */
22

IF @AllWords = 0
23

INSERT INTO @Products
24

SELECT ID, Name, Description,
25

3 * dbo.WordCount( @Word1, Name) + dbo.WordCount( @Word1, Description) +
26

3 * dbo.WordCount( @Word2, Name) + dbo.WordCount( @Word2, Description) +
28

3 * dbo.WordCount( @Word3, Name) + dbo.WordCount( @Word3, Description) +
30

3 * dbo.WordCount( @Word4, Name) + dbo.WordCount( @Word4, Description) +
32

3 * dbo.WordCount( @Word5, Name) + dbo.WordCount( @Word5, Description)
34

AS Rank
36

FROM Product
38

ORDER BY Rank DESC
39

/* all-words search */
41

IF @AllWords = 1
43

INSERT INTO @Products
45

SELECT ID, Name, Description,
47

( 3 * dbo.WordCount( @Word1, Name) + dbo.WordCount
49

( @Word1, Description)) *
51

CASE
53

WHEN @Word2 IS NULL THEN 1
55

ELSE 3 * dbo.WordCount( @Word2, Name) + dbo.WordCount( @Word2,
57

Description)
59

END *
61

CASE
63

WHEN @Word3 IS NULL THEN 1
65

ELSE 3 * dbo.WordCount( @Word3, Name) + dbo.WordCount( @Word3,
67

Description)
69

END *
71

CASE
73

WHEN @Word4 IS NULL THEN 1
75

ELSE 3 * dbo.WordCount( @Word4, Name) + dbo.WordCount( @Word4,
77

Description)
79

END *
81

CASE
83

WHEN @Word5 IS NULL THEN 1
85

ELSE 3 * dbo.WordCount( @Word5, Name) + dbo.WordCount( @Word5,
87

Description)
89

END
91

AS Rank
93

FROM Product
95

ORDER BY Rank DESC
97

/* 在外部变量保存搜索结果数 */
99

100

SELECT @HowManyResults = COUNT( *)
101

102

FROM @Products
103

104

WHERE Rank > 0
105

106

/* 按页返回结果*/
107

108

SELECT ProductID, Name, Description, Price, Image1FileName,
109

110

Image2FileName, Rank
111

112

FROM @Products
113

114

WHERE Rank > 0
115

116

AND RowNumber BETWEEN ( @PageNumber - 1) * @ProductsPerPage + 1
117

118

AND @PageNumber * @ProductsPerPage
119

ORDER BY Rank DESC

本文转自高海东博客园博客，原文链接：http://www.cnblogs.com/ghd258/archive/2006/11/17/563218.html，如需转载请自行联系原作者

在SQL Server 2005中用存储过程实现搜索功能

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

在SQL Server 2005中用存储过程实现搜索功能

热门文章

最新文章

相关课程

相关电子书

相关实验场景