现在的位置: 首页 > 综合 > 正文

关注”垂直搜索”,低技术含量的伪概念?

2013年11月08日 ⁄ 综合 ⁄ 共 1426字 ⁄ 字号 评论关闭

中国谷歌模仿酷讯推出生活搜索,一度吸引了媒体和用户对于所谓“垂直搜索”的关注。有观者认为,在百度、中国谷歌和雅虎通吃将近九成的网络搜索份额之后,搜索市场的迟到者或许可以在“垂直搜索”中分到一杯羹。

  然而,由于定义的模糊,垂直搜索在不同人那里指称着不同的事物,许多搜索行业的外行,甚至可以向风险资本家冒充自己搞的是“垂直搜索”,和百度不是一路,但“钱景”十分光明。

  笔者认为,除了目前搜索技术的限制、可以按照信息媒体类型进行垂直的划分之外,其他的垂直搜索不是要么是和搜索本意背道而驰,要么就根本不是搜索。

  何谓搜索?搜索就是从海量的互联网信息中寻找到自己需要的内容,其两个特点一是信息海量,二是信息非结构化,即这些信息都以网页、语音、图片等各种离散形式存在,还不是保存在许多IT业者所梦想的XML文件中。

  由于图像、视频识别技术远未成熟,音频的文本化尚未普及(技术已经存在),今天的搜索引擎不得不分为网页搜索、视频搜索、音乐、图片搜索等类型。在OpenV等的技术之下,视频中的音频信息可以转换为可以搜索的文本,那么视频只不过是网页搜索中的一种。举例说,如果您想知道一种婴儿用药的注意事项,如果一个专家刚好在央视2套的一个节目中进行了详细的解答,这个视频不也是您所希望看到的呢?

  媒体类型的分类是不得以而为之,而其他按照网页内容进行的搜索分类则是画蛇添足,纯属添乱。搜索就是要搜几十亿张网页的海量信息,如果按照“论坛”、“百科”、“博客”等人为类别把五十亿张网页分为五类、十类,然后推出五个、十个搜索产品、让用户点击五次、十次,则完全是背道而驰、浪费用户时间的行为。

  由此看来,按照内容进行划分的所谓“垂直搜索”是一个非常误导的概念,降低了搜索效率,祸害无穷。

  今天,还有一种所谓的“搜索”也被贴上了“垂直搜索”的标签,最典型的是火车票机票。在笔者看来,这些业务根本就不是搜索,而只是检索。判断依据就是所查询的信息是不是海量,信息是不是结构化。

  火车车次,航班班次(含折扣价)的数据是有限的,而且发生变动的频率也就是一年一两次,其信息量远远未到可供“搜索”的地步。从国内网站来看,提供火车票、机票搜索的网站不计其数,其差别不是检索技术的高低,而是数据库更新是不是及时。

  从技术角度来看,在获得权威数据库之后,开发一个基于SQL语句的WEB查询功能只需要几个工作日的时间,和布林佩奇和李彦宏做的搜索可谓天壤之别。当然,一个SQL开发高手想到百度谋得一职也是幻想。

  技术开发十分简单的本质原因,是因为机票车票这些信息都是结构化的,检索过程可以依赖现有技术,而不用自行开发极度复杂的HTML文本搜索技术。

  诸如火车票机票的专业查询还有很多,比如医学方面的病历查询,警方所用的在逃犯检索,以及网上零售网站的商品检索。这些都不是现代意义上的搜索引擎,称之为“垂直搜索”可能是想沾点搜索引擎的“时髦”。

  综上所述,在目前这一代的搜索技术之下,我们暂且按照信息媒体的类型来对搜索分类,这种分类谈不上所谓的“垂直化”。而许多号称“垂直搜索”的服务其实是毫无技术含量的“检索”。

  需要强调的是,搜索的目标是用复杂的算法和分布式计算技术从海量非结构化信息中找出用户最想要的东西。迟来的搜索业者如果对于“算法”和“计算”没有自信,就干脆不要把海量信息的分门别类当成自己的事业,美国Google和中国百度的进步迟早会让这种低技术含量的工作变成无用功。 

抱歉!评论已关闭.