现在位置: 首页 > 搜索技术 > 文章
2014年10月22日 搜索技术 ⁄ 共 1656字 评论关闭
对搜索引擎(百度/谷歌/雅虎)排名不友好的五种网站 搜索引擎针对不同类别的网站,判断标准和考核得分点是不 一样的,避免对百度排名不友好的五种网站操作 你的网站是否在这五种网站里,决定你的网站是否能获得排 名。 1、有没有同学看到有的网站非常高大上,很多企业网都很 炫,实际实际上不利于优化 搜索引擎不可读 frame IF框架  大量网站都存在js、FLASH、框架,这些不是不利于优化吗 ,这里有个理解误区,js要实现的效果是...
阅读全文
2014年09月05日 搜索技术 ⁄ 共 251字 评论关闭
搜索引擎的结构清晰、分工明确。按照各自的功能划分,可以划分为四大体系结构。 一、抓取系统(又称为下载系统) 搜索引擎的工作组件为爬虫,爬虫通过在网页上爬寻,来抓取和下载各种类型的网页。并且保持对万维网变化的同步。这也是搜索引擎工作的第一步。 二、分析系统 通过抓到的网页,分析系统来对这些不同类型的网页进行分析,并进行pr和分词计算。 三、索引系统 将分析处理后的网页进行索引入库。 四、查询系统 ...
阅读全文
2014年08月16日 搜索技术 ⁄ 共 11943字 评论关闭
【可搜索范围】 1. 正常网页搜索 数据:URL、标题,描述 2. 百科(百度,360) 数据:URL、标题,描述,作者,发布日期 3. 微博 数据:URL、标题,描述,作者,发布日期,微博类型(新浪、腾讯、163、搜狐),评论数,转发数 4. 新闻 数据:URL、标题,描述,发布日期,发布网站 5. 论坛 数据:URL、标题,描述,发布日期,发布网站 6. 博客 数据:URL、标题,描述,发布日期,发布网站 【原理】 1. 获取各大搜索引擎,...
阅读全文
2014年04月28日 搜索技术 ⁄ 共 4075字 评论关闭
Web搜索引擎设计和实现分析 作者: 出处: 时间: 03-06 点击: 31 内容载入中... ---- 一、引言 ---- 随着Internet的飞速发展,人们越来越依靠网络来查找他们所需要的信息,但是,由于网上的信息源多不胜数,也就是我们经常所说的"Rich Data, Poor Information"。所以如何有效的去发现我们所需要的信息,就成了一个很关键的问题。为了解决这个问题,搜索引擎就随之诞生。 ---- 现在在网上的搜索引擎也已经有很多,比较著...
阅读全文
2013年03月01日 搜索技术 ⁄ 共 13301字 评论关闭
 建立搜索引擎四步:     抓取数据---》解析数据----》创建索引-----》执行搜索 第一部分:体会 今天做了一个简单示例,用的版本是lucune 2.4.1,跟教科书上的有些不同,但教科书上的示例都能正常执行。   第二部分:遇到的问题 刚把程序写出来的时候,出现了搜索不到结果的情况,后来发现是在添加Field的时候没有把搜索的字段设置成 Field.Index.ANALYZED, 如果你在搜索器中设定的搜索字段是 text,那么在创建索引的时候应该把...
阅读全文
2012年08月02日 搜索技术 ⁄ 共 308字 评论关闭
(1)Sphinx  http://sphinxsearch.com/(2)Elasticsearch  http://www.elasticsearch.org/(3)Xapian  http://xapian.org/在实际中使用过Sphinx,感觉还是很不错的,建立索引速度挺高,查询语法丰富,而且使用起来很简单。Sphinx依托于MySql 或者 postgresql,并提供SQL查询接口,对于属于MySql或者postgresql的同学来说更亲切一些Elasticsearch听说不错,支持RESTful接口,建议于Apache Lucene.之上,支持分布式,对...
阅读全文