现在的位置: 首页 > 综合 > 正文

垂直搜索,互联网的下一个泡沫(转载自:http://hi.baidu.com/xiejl/blog)

2013年08月01日 ⁄ 综合 ⁄ 共 3112字 ⁄ 字号 评论关闭
垂直搜索,互联网的下一个泡沫
  
  2005年是互联网的WEB2.0年,催生了一大批冠以web2.0帽子的网站,06年是web2.0泡沫走向破裂的一年,同时也是垂直搜索火爆发展的一年,在这一年,诞生了一大批各行各业的垂直搜索引擎,涉及博客、论坛、商务、商机、购物、招聘、房产、交友、医药、二手信息,火车票、汽车、股票,性用品,视频、图书等等。

 

几乎都是在2005年底到2006年这一短短时间内发展起来的。以招聘搜索引擎为例,目前就已经存在不下十家成规模的搜职引擎,在2007年再底统计时,这个数字可能就是上百家了。
  
  以google为代表的搜索引擎重组了互联网内的无序信息,互联网的意义才得以充分体现和发挥。google创造了互联网的一个神话,成功塑造了一个互联网教主的崇高地位,也是继微软后的一个新的财富神话。百度是世界上唯一一个成功挑战并且打败google的区域性搜索引擎,也因此快速造就了一大批的新的富翁。这都让人,尤其是互联网的热血创业者门仰望和羡慕不已。无形中,搜索引擎已成为高深科技的代名词。google的PR值,成为人们津津乐道的话题。用google而不用中文搜索更好的百度,也成为高雅人士的最多选择。
  
  以google为代表的搜索引擎,如百度、雅虎、搜狗等等,都归属于“通用搜索”,通过访问、下载网络上的尽可能多的网页,从中分离出感兴趣的关键词,通过各自的排序算法,将搜索结果返回给用户。这其中,关键的核心技术之一是对搜索结果排序的算法,也就是海量网页间的关联计算。(google的PR值比较妥善的解决了这个问题,百度也有网站的“权重”概念)。由于互联网网页总量非常庞大,而且还在不停的高速增加中。这对搜索引擎的技术和搜索引擎的硬件开支要求都非常高,google有3000多台个人PC,且以每天增加一台PC 的速度,来实现互联网网页的访问、下载。这些都是阻止潜在竞争者进入传统搜索行业的门槛。而垂直搜索则不同,垂直搜索只需要访问很有限的指定行业网站,从中获取很有限的网页,这即不需要庞大的搜索服务器群,也不需要处理海量数据,导致垂直搜索的进入门槛非常低。搜索一个行业网站页面,一般只需要几台普通PC就能一天内遍历完成。在google、百度财富神话的激励下,垂直搜索呈现火爆发展局面也就是必然的了。
  
  
  所谓垂直搜索引擎,也称为行业搜索引擎,专业搜索引擎。是指仅仅针对某一个行业的网站进行搜索的网络搜索引擎,如购物、房产、汽车、招聘等等。google、百度、雅虎等搜索引擎则归类为“通用搜索引擎”,通用搜索引擎,不会对网页进行分类处理,只会给用户笼统的返回关键词最匹配的搜索结果。导致通用搜索返回的结果虽然“无穷多”,但真正对用户有用的信息,往往只有几条、几十条,其它都是无用的信息。而垂直搜索则完全不同,搜索的结果高度匹配,垃圾信息一般只会占其中很小的比例。比如通过搜职引擎搜索“软件开发”工作职位,搜职引擎不会把《软件开发》书籍的介绍页面返回给你。这对用户无疑是是有吸引力的。垂直搜索,势必是互联网发展的一个必须和必然。垂直搜索和通用搜索将会并存存在,谁也覆盖不了谁。随着web2.0泡沫的破裂,垂直搜索也将会是风险投资VC的注意力关注所在。
  
  信息采集软件,可以说是垂直搜索引擎的先驱,具有垂直搜索的基本特征,可以说,现在存在的很多垂直搜索引擎,基本上就是一个信息采集软件。垂直搜索引擎可以看成是信息采集软件的升级版,在信息采集原理的基础上,进行技术深入、功能扩充,满足用户体验等等。所以垂直搜索的技术入门门槛是很低的。
  
  低技术、低投入,必然的发展趋势,外加利好的刺激,看起来垂直搜索行业没有理由不走向火爆。当然,目前垂直搜索行业还处在起步阶段,还不为用户认识,用户使用习惯还没有培养起来,解决这个问题,只需要加以时日即可。从培养用户使用习惯的角度来看,更多的竞争者,会分担这个行业先行者的压力,更快的促进市场迈向成熟。
  
  从用户的角度,从行业发展的角度,垂直搜索的火爆,都是好事,但会有一方对此排斥的,哪就是关键信息采集的来源一方。对于行业网站,累计的行业数据就是网站的根本。他们乐意垂直搜索引擎给它带来访问人气,但他们对于自身行业数据的“泄密”则是深感不安的。因为随着垂直搜索的分析技术的提高,垂直搜索能从网页中分析出足够详细的分类数据,基本上相当于搜索引擎直接从对方网站的数据库中获取详尽的分类数据。行业网站对垂直搜索的不安,也就是可以理解的了。对于处于行业垄断地位的网站,他们对这种搜索引擎基本上是反感的,因为垂直搜索引擎会分散他们的人气,也会威胁他们的垄断地位。
  
  经营过网站的都知道,网站的页面浏览,大部分都是搜索引擎的蜘蛛在访问,搜索蜘蛛大致占网站60~80%左右的访问量,这势必给网站增加了访问压力。现在的通用搜索引擎,对自己的访问都做了控制,尽量减少给被访问网站带来的访问压力。但如果这样的蜘蛛太多,几家,几十家,几百家,会给被访问网站带来难以承受的访问压力。随着垂直搜索的火爆发展,这种局面也将是难以避免的。这也是信息源一方会排斥搜索引擎的一个理由。而且很多垂直搜索引擎对自己也缺乏约束,对同一个网站同时派出的访问蜘蛛数量不作控制,结果往往是自己的访问被对方网站屏蔽。
  
  垂直搜索引擎本身也面临者盈利压力,搜索引擎的盈利途径非常有限,广告、增值服务等等。而且这都是小利,只有在自身足够强大的时候,这些小利才能汇成江河。但往往根本等不到强大的一天,就得因无米下锅而只得关门大吉了,也无法每个人都把希望都寄托在风险投资身上。在生存的压力下,众多的垂直搜索商家,将会不得不介入行业传统网站的经营,借助便利的垂直搜索带来的人气,介入行业传统网站的经营可以轻松的获得跳跃式发展。这当然是信息来源一方的网站所不愿看到的,谁也不乐意用自己的资源去资助竞争对手。以笔者最熟悉的人才招聘网站来说,几乎所有的大型人才网站都针对“信息采集软件”做了各种各样的针对性的技术屏蔽,阻止信息采集软件从自己网站上面采集数据,目前的搜职引擎,不得不对此作出技术处理,去绕开这些屏蔽和访问障碍。一旦人才网站熟悉了搜职引擎的技术,这种屏蔽将会更加具有针对性,届时,搜职引擎的地位将会很尴尬。(版权所有,转载烦请注明博客地址:http://hi.baidu.com/xiejl/blog)
  
  
  一旦信息采集来源网站对垂直搜索引擎非常排斥的时候,意味这垂直搜索引擎行业进行大规模洗牌的时刻到来,此时能生存下了的只有技术准备充分,拥有资金实力,有公信力的,且具备对信息采集来源网站拥有有效反置手段的商家。跟现在的网站都为在google、百度的搜索排序位置的争抢一样,垂直搜索引擎也应该具备类似的反置对方的手段,避免束手无策。洗牌过后,剩下的应该约束自己,安心经营搜索引擎,不能直接介入行业传统网站的经营。
  
  低技术门槛,低投入,竞争者众多,信息采集来源网站的排斥,盈利途径的匮乏,垂直搜索将会面临四面楚歌,前后夹击的困难境地。垂直搜索需要早做技术准备,指望信息采集软件这样的入门技术是无法生存的。必须要具备足够的智能分析能力,具有非模板匹配的自动分析、分离的数据采集能力。并为应付信息采集来源网站的排斥提前做好技术准备。垂直搜索的竞争可能会白热化,垂直搜索的泡沫的破裂,会比web2.0的更为凄惨,毕竟web2.0网站的生存不依赖于别人的脸色。而搜索引擎则是寄生在别人身上的。
  
  (版权所有,转载烦请注明博客地址:http://hi.baidu.com/xiejl/blog)
 

【上篇】
【下篇】

抱歉!评论已关闭.