越来越多的网站,开始采用“单页面结构”(Single-page
application)。
整个网站只有一张网页,采用Ajax技术,根据用户的输入,加载不同的内容。
这种做法的好处是用户体验好、节省流量,缺点是AJAX内容无法被搜索引擎抓取。举例来说,你有一个网站。
http://example.com
用户通过井号结构的URL,看到不同的内容。
http://example.com#1
http://example.com#2
http://example.com#3
但是,搜索引擎只抓取examp...
阅读全文
对搜索引擎(百度/谷歌/雅虎)排名不友好的五种网站
搜索引擎针对不同类别的网站,判断标准和考核得分点是不
一样的,避免对百度排名不友好的五种网站操作
你的网站是否在这五种网站里,决定你的网站是否能获得排
名。
1、有没有同学看到有的网站非常高大上,很多企业网都很
炫,实际实际上不利于优化
搜索引擎不可读 frame IF框架
大量网站都存在js、FLASH、框架,这些不是不利于优化吗
,这里有个理解误区,js要实现的效果是...
阅读全文
搜索引擎的结构清晰、分工明确。按照各自的功能划分,可以划分为四大体系结构。
一、抓取系统(又称为下载系统)
搜索引擎的工作组件为爬虫,爬虫通过在网页上爬寻,来抓取和下载各种类型的网页。并且保持对万维网变化的同步。这也是搜索引擎工作的第一步。
二、分析系统
通过抓到的网页,分析系统来对这些不同类型的网页进行分析,并进行pr和分词计算。
三、索引系统
将分析处理后的网页进行索引入库。
四、查询系统
...
阅读全文
Web搜索引擎设计和实现分析
作者: 出处: 时间: 03-06 点击:
31
内容载入中...
---- 一、引言
---- 随着Internet的飞速发展,人们越来越依靠网络来查找他们所需要的信息,但是,由于网上的信息源多不胜数,也就是我们经常所说的"Rich Data, Poor Information"。所以如何有效的去发现我们所需要的信息,就成了一个很关键的问题。为了解决这个问题,搜索引擎就随之诞生。
---- 现在在网上的搜索引擎也已经有很多,比较著...
阅读全文
建立搜索引擎四步:
抓取数据---》解析数据----》创建索引-----》执行搜索
第一部分:体会
今天做了一个简单示例,用的版本是lucune 2.4.1,跟教科书上的有些不同,但教科书上的示例都能正常执行。
第二部分:遇到的问题
刚把程序写出来的时候,出现了搜索不到结果的情况,后来发现是在添加Field的时候没有把搜索的字段设置成
Field.Index.ANALYZED,
如果你在搜索器中设定的搜索字段是 text,那么在创建索引的时候应该把...
阅读全文
(1)Sphinx http://sphinxsearch.com/(2)Elasticsearch http://www.elasticsearch.org/(3)Xapian http://xapian.org/在实际中使用过Sphinx,感觉还是很不错的,建立索引速度挺高,查询语法丰富,而且使用起来很简单。Sphinx依托于MySql 或者 postgresql,并提供SQL查询接口,对于属于MySql或者postgresql的同学来说更亲切一些Elasticsearch听说不错,支持RESTful接口,建议于Apache Lucene.之上,支持分布式,对...
阅读全文