关于sql server全文检索的一些资料收集2

现在的位置: 首页 > 综合 > 正文

2012年06月27日 ⁄ 综合 ⁄ 共 697字 ⁄ 字号小中大 ⁄ 评论关闭

查询子句只包含被忽略的词

这是因为使用一些很简单的词，比如'是'，进行查询的缘故。

提出的解决办法不外乎是把C:\Program Files\Microsoft SQL Server\MSSQL\FTDATA\SQLServer\Config\noise.chs 清空

觉得这种方法是不可取的，大家打开这个文件看看，发现里面是一些这样的词：is,are,be,at,我,是

这些词都是频率很高的词，而且在查询中的意义不大，就好像几乎每个抽屉里面都有纸屑一样，为这些词作索引得不偿失，所以全文引擎把这些词称为干扰词不做索引，个人觉得在应用中过滤这些词然后向用户提出友好的提示更好，而不是使用清空noise.chs粗暴的对待全文引擎。比方大家可以看看在Google中搜索“的”

另外谢谢ghj，一个很重要的东西遗漏了，与一般的索引立即更新不同，全文索引一般是定期维护索引的，所以对于频繁更新的数据不合适，需要做全文索引的对象一般都是论文网页之类，还算适合拉！

个人觉得我的数据库没有代表性，所以也不细说：作索引的时候，CPU和内存使用都很高，时间也很长(下面我的数据库是整个晚上)，完成以后并不需要使用很多的系统资源，多个全文查询并发的时候也有不小的CPU消耗，但是比LIKE强。

我的系统上数据库是123M，太小，使用全文索引没有感到特别的优势，但是可以想想对于GOOGLE那样的海量数据，使用LIKE是不可想象的:)当然别人也没有使用关系数据库。

----------------------------------------------------------------------转自"Carfield的猫窝"

抱歉!评论已关闭.

学步园