现在位置: 首页 > 搜索技术 > 文章
2014年10月26日 搜索技术 ⁄ 共 5430字 评论关闭
对于每一个做SEO优化的人员来说,最基本、最起码必须要了解搜索引擎的工作原理,因为我们在做网站优化的时候是通过和搜索引擎打交道来实现我们网站的排名的!研究搜索引擎工作原理就很有必要了。今天我来和大家分享一下我是如何学通搜索引擎工作原理的,其实很简单,你可以把搜索引擎工作原理模拟成一个形象的蜘蛛爬网抓虫子的过程就可以了,具体是怎么一个过程我可以详解的给大家分析一下: 搜索引擎的工作原理大体上可以分...
阅读全文
2014年10月23日 搜索技术 ⁄ 共 2036字 评论关闭
越来越多的网站,开始采用“单页面结构”(Single-page application)。 整个网站只有一张网页,采用Ajax技术,根据用户的输入,加载不同的内容。 这种做法的好处是用户体验好、节省流量,缺点是AJAX内容无法被搜索引擎抓取。举例来说,你有一个网站。 http://example.com 用户通过井号结构的URL,看到不同的内容。 http://example.com#1 http://example.com#2 http://example.com#3 但是,搜索引擎只抓取examp...
阅读全文
2014年10月22日 搜索技术 ⁄ 共 1656字 评论关闭
对搜索引擎(百度/谷歌/雅虎)排名不友好的五种网站 搜索引擎针对不同类别的网站,判断标准和考核得分点是不 一样的,避免对百度排名不友好的五种网站操作 你的网站是否在这五种网站里,决定你的网站是否能获得排 名。 1、有没有同学看到有的网站非常高大上,很多企业网都很 炫,实际实际上不利于优化 搜索引擎不可读 frame IF框架  大量网站都存在js、FLASH、框架,这些不是不利于优化吗 ,这里有个理解误区,js要实现的效果是...
阅读全文
2014年09月05日 搜索技术 ⁄ 共 251字 评论关闭
搜索引擎的结构清晰、分工明确。按照各自的功能划分,可以划分为四大体系结构。 一、抓取系统(又称为下载系统) 搜索引擎的工作组件为爬虫,爬虫通过在网页上爬寻,来抓取和下载各种类型的网页。并且保持对万维网变化的同步。这也是搜索引擎工作的第一步。 二、分析系统 通过抓到的网页,分析系统来对这些不同类型的网页进行分析,并进行pr和分词计算。 三、索引系统 将分析处理后的网页进行索引入库。 四、查询系统 ...
阅读全文
2014年08月16日 搜索技术 ⁄ 共 11943字 评论关闭
【可搜索范围】 1. 正常网页搜索 数据:URL、标题,描述 2. 百科(百度,360) 数据:URL、标题,描述,作者,发布日期 3. 微博 数据:URL、标题,描述,作者,发布日期,微博类型(新浪、腾讯、163、搜狐),评论数,转发数 4. 新闻 数据:URL、标题,描述,发布日期,发布网站 5. 论坛 数据:URL、标题,描述,发布日期,发布网站 6. 博客 数据:URL、标题,描述,发布日期,发布网站 【原理】 1. 获取各大搜索引擎,...
阅读全文
2014年04月28日 搜索技术 ⁄ 共 4075字 评论关闭
Web搜索引擎设计和实现分析 作者: 出处: 时间: 03-06 点击: 31 内容载入中... ---- 一、引言 ---- 随着Internet的飞速发展,人们越来越依靠网络来查找他们所需要的信息,但是,由于网上的信息源多不胜数,也就是我们经常所说的"Rich Data, Poor Information"。所以如何有效的去发现我们所需要的信息,就成了一个很关键的问题。为了解决这个问题,搜索引擎就随之诞生。 ---- 现在在网上的搜索引擎也已经有很多,比较著...
阅读全文
2013年03月01日 搜索技术 ⁄ 共 13301字 评论关闭
 建立搜索引擎四步:     抓取数据---》解析数据----》创建索引-----》执行搜索 第一部分:体会 今天做了一个简单示例,用的版本是lucune 2.4.1,跟教科书上的有些不同,但教科书上的示例都能正常执行。   第二部分:遇到的问题 刚把程序写出来的时候,出现了搜索不到结果的情况,后来发现是在添加Field的时候没有把搜索的字段设置成 Field.Index.ANALYZED, 如果你在搜索器中设定的搜索字段是 text,那么在创建索引的时候应该把...
阅读全文
2012年08月02日 搜索技术 ⁄ 共 308字 评论关闭
(1)Sphinx  http://sphinxsearch.com/(2)Elasticsearch  http://www.elasticsearch.org/(3)Xapian  http://xapian.org/在实际中使用过Sphinx,感觉还是很不错的,建立索引速度挺高,查询语法丰富,而且使用起来很简单。Sphinx依托于MySql 或者 postgresql,并提供SQL查询接口,对于属于MySql或者postgresql的同学来说更亲切一些Elasticsearch听说不错,支持RESTful接口,建议于Apache Lucene.之上,支持分布式,对...
阅读全文