现在的位置: 首页 > 综合 > 正文

垂直搜索引擎研究

2012年09月01日 ⁄ 综合 ⁄ 共 2508字 ⁄ 字号 评论关闭

 垂直搜索引擎研究

一,垂直搜索引擎8大特点

垂直搜索引擎站点的8条准则:

1、选择一个好的垂直搜索方向。俗话说男怕选错行,这一点对于搜索引擎来说也是一样的,除了选择的

这个行业有垂直搜索的大量需求外,这个行业的数据属XING最好不要和
Yahoo,Google等通用搜索的的抓取方向重叠。
     目前热门的垂直搜索行业有:购物,旅游,汽车,工作,房产,交友等行业。搜索引擎对动态url数

据不敏感也是众所周知的,这些可以作为垂直搜索引擎的切入点;

2、评价所选垂直搜索行业的网站、垂直搜索内容、行业构成等情况:
     我们都知道垂直搜索引擎并不提供内容来源,它的数据依赖爬虫搜集,并做了深度加工而来的。因此

考虑垂直搜索引擎的所处的大环境和定位至关重要。
3、深入分析垂直搜索引擎的索引数据特点:
     垂直搜索引擎的索引数据过于结构化,那么进入的门槛比较低,行业竞争会形成一窝蜂的局面;如果

搜索数据特点是非结构化的,抓取,分析这样的数据很困难,进入壁
垒太高,很可能出师未杰身先死。
4、垂直搜索引擎的索引数据倾向于结构化数据和元数据,这个特点是区别于yahoo,google等通用搜索引

擎的,这是垂直搜索引擎的立足点。而垂直搜索引擎是根植于某一个行业 ,因此行业知识,行业专家这

些也是通用搜索引擎不具备的。也就是说进入垂直搜索是有门槛的。
5、垂直搜索引擎的搜索结果要覆盖整个行业,搜索相关XING要高于通用搜索引擎,贴近用户搜索意图,搜

索结果要及时。
6、垂直搜索引擎的web 2.0 需求:
     垂直搜索引擎的搜索数据由于带有结构化的天XING,相对于通用搜索引擎的全文索引而言,更显的少而

精。因此,设计的时候要提供收集用户数据的接口,同时提供tag,积
分等机制,使搜索结果更加“垂直”。
7、垂直搜索引擎的目标是帮助用户解决问题,而不只是向通用搜索引擎一样发现信息:
     这一点是垂直搜索引擎的终极目标。 在做垂直搜索引擎的时候你需要考虑:什么问题是这个行业内
的特殊XING问题,什么问题是一般XING问题。keso多次提到google的目标是
让用户尽快离开google,而垂直搜索引擎应该粘住用户。一般来说,使用垂直搜索引擎的用户都是和用户
的利益需求密切相关的。所谓利益需求是我自己独创的,大意是和用户工作密切相关,生活中必不可少的
需求,而求有持续XING。比如:学生找论文,业主找装修信息等等这样的需求。因此粘住用户,让用户有反
馈的途径是一个关键部分。

8、垂直搜索引擎的社区化特征:
     这一条和第9条是相关的。
     俗话说物以类聚,人以群分,垂直搜索引擎定位于一个行业,服务于一群特定需求的人群,这个特点

决定了垂直搜索的社区化行为。人们利用垂直搜索引擎解决问题,分享回馈。现在做网站都讲求社区化,
所以垂直搜索引擎本质上还是:对垂直门户信息提供方式的一次简化XING的整合。

二,国外最被看好的十大垂直搜索引擎

以下是福布斯杂志评选出来的2008年最值得关注、最被看好的一些搜索引擎,更确切地讲,应该是垂直搜索,包括社会搜索Aardvark、移动搜索ChaCha、相关搜索Cuil、电子邮件收件箱搜索Gist、应用搜索Kosmix、鞋、表和服装等商品的图像搜索引擎Like.com、Twitter看法搜索、计算搜索Wolfram、房地产搜索Zillow等共10个搜索网站,感觉其中像Cuil、 Gist、Like.com、Wolfram这几种搜索还是很有新意的,都还是第一次听说,试用了一下,感觉还是非常Cool的。

  1 Aardvark
  成立于2007年,专注于社会搜索(social search),擅长解决类似于“帕罗奥多(Palo Alto)最好的牙医是谁?”的问题。当你通过即时信息或电子邮件向Aardvark询问这类问题时,Aardvark将在你所在地区找到一个人回答你的问题,该搜索引擎网址为www.vark.com。
  2 ChaCha
  成立于2008年1月,专注于移动搜索(mobile search),通过文本信息和即时信息向用户提供免费服务,该搜索引擎网址为www.chacha.com。
  3 Cuil
  Cuil读音为“酷”,与谷歌最为相近,该公司仅用相关XING来排列搜索结果,而不用网页等级算法,该搜索引擎网址为www.cuil.com。
  4 Gist
  专注于电子邮件收件箱搜索(e-mail inbox search),Gist可以监控你的电子邮件收件箱并获得来自或关于联系人的最新信息,是联系电子邮件提供商、社交网站和传统媒体的纽带,该搜索引擎网址为www.gist.com。
  5 Kosmix
  成立于2005年,专注于应用搜索(application search),收集来自1万多个来源的内容,从中提取相关内容,向用户提供分类搜索结果,该搜索引擎网址为www.kosmix.com。
  6 Like.com
  成立于2004年,最初只作为图像识别工具,2006年转为鞋、表和服装等商品的图像搜索引擎,该搜索引擎网址为www.like.com。
  7 Powerset
  成立于2005年,专注于自然语言搜索(natural language search)。Powerset使用自然语言程序、基于语义而不是关键词进行搜索,该垂直搜索网址为www.powerset.com。
  8 Twitter搜索
  专注于看法搜索(opinion search),Twitter搜索从每分钟数以千计的实时信息中得出集体智慧,该垂直搜索网址为search.twitter.com。
  9 Wolfram Alpha
  专注于计算搜索(computational search),计划于今年5月推出,Wolfram Alpha能够为用户计算出答案,该项目的资金来自于软件公司Wolfram Research,网址为www.wolframalpha.com。
  10 Zillow
  成立于2006年,专注于房地产搜索(real estate search),用户可以用Zillow搜索当地房地产市场信息,该垂直搜索网址为www.zillow.com。


抱歉!评论已关闭.