现在位置: 首页 > 搜索技术 > 文章
2017年12月14日 搜索技术 ⁄ 共 6400字 评论关闭
下文就百度商业变现的指标体系进行概要描述,并针对一个类似于百度LBS系统的变现思路,阐述一个商业系统变现策略指标体系的建立过程。 为什么需要商业变现策略指标体系 一般情况下,一个互联网产品,或是一个移动端产品在发展前期,主要会关注流量及用户量的增长。当流量,用户量做到一定程度时,就会考虑商业变现。例如今日头条,美丽说,高德地图这样的产品现在都开始商业化变现。而要从变现效果,效率衡量整个系统,以及...
阅读全文
2017年12月14日 搜索技术 ⁄ 共 3960字 评论关闭
本文将介绍epoll的概念,原理, 优点,及使用接口,同时结合作者在搜索引擎spider开发中epoll使用方式的代码向大家具体介绍epoll的使用方式。 P.S. 笔者08年曾有使用epoll编写未考虑压力控制的crawler,将国内著名票务网站压垮并在boss的带领下登门道歉的经历:) 足见epoll的强悍! epoll是什么 按照man帮助中的说明,epoll是为了高性能处理处理文件句柄而改进的poll机制, 和其类似的功能是select调用。epoll提供相对简单...
阅读全文
2017年12月12日 搜索技术 ⁄ 共 1349字 评论关闭
(百度)假设一个 mp3 搜索引擎收录了 2^24 首歌曲,并记录了可收听这些歌曲的 2^30 条 URL,但每首歌的 URL 不超过 2^10 个。系统会定期检查这些 URL,如果一个 URL 不可用则不出现在搜索结果中。现在歌曲名和 URL 分别通过整型的 SONG_ID 和 URL_ID 唯一确定。对该系统有如下需求: 1) 通过 SONG_ID 搜索一首歌的 URL_ID,给出 URL_ID 计数和列表 2) 给定一个 SONG_ID,为其添加一个新的URL_ID 3) 添加一个新的 SONG_ID 4) ...
阅读全文
2017年12月08日 搜索技术 ⁄ 共 100字 评论关闭
今天在书店看到一本关于搜索引擎的书《走进搜索引擎》作者是梁斌   书中简明扼要的介绍了一些基本知识。相对是比较全面的研究,作为初学者绝对适用。   比《开发自己的搜索引擎》一书那是要好上百倍。大家不妨一读。  
阅读全文
今天在书店看到一本书:搜索引擎零距离——基于Ruby+Java搜索引擎原理与实现 翻了一下,讲得比较系统一点,推荐给大家看一下。
阅读全文
2017年12月02日 搜索技术 ⁄ 共 208字 评论关闭
百度google关键字热度估算查询  百度关键字查询工具,百度指数,关键词数据用曲线图和曲面图形式展现。  http://index.baidu.com  百度指数查询   http://baidu.hrzzz.com http://index.baidu.com/  google关键词搜索量查询工具最新地址  https://adwords.google.com/select/KeywordToolExternal
阅读全文
2017年11月12日 搜索技术 ⁄ 共 202字 评论关闭
有些博客里没有搜索博客的选项,可以用搜索引擎来查找。 比如随便找这样一个博客: http://tang-xinzi.blog.163.com/ 那我们在google里可以这样查找: 东京 site:http://tang-xinzi.blog.163.com/ 意味即为在 tang-xinzi.blog.163.com 里搜索包括 东京 的文章。 其他搜索引擎也试了一下: 百度试了一下找不到。 yahoo, bing 都没有问题。
阅读全文
2017年11月09日 搜索技术 ⁄ 共 1390字 评论关闭
改进排名的主流技术之一是借助于人工,专家能准确描述对网站的信任程度、轻易识别出垃圾。虽然人工可以很容易识别这些垃圾,但评估所有页面但代价很昂贵、是不可行的,所以就提出了一种半自动化技术方案。   TrustRank便应势而生,TrustRank是一种由斯坦福大学和雅虎研究人员提出的链接分析技术。TrustRank算法基本思想是在为网页排名时,要考虑到该页面所在站点的信任指数和权威性。   TrustRank算法应对轻易操纵google排...
阅读全文
2017年11月09日 搜索技术 ⁄ 共 1211字 评论关闭
搜索引擎算法每一次的变动都会牵动着广大站长的心,每个站长都非常想知道搜索引擎的算法是怎样的?如果彻底了解到了搜索引擎的排序准则,那么一定能够让你非常快速的将自己的网站优化到前面,可是搜索引擎的算法却是非常的繁难,对于一名普通的个人站长要想窥探出其中的奥秘,那比登天还难,不过没有关系,我们可以从其他的途径来了解搜索引擎,下面我就将我的经验写出来跟大家分享一下!   一:从网站的结构   搜索引擎的...
阅读全文
2017年11月03日 搜索技术 ⁄ 共 11320字 评论关闭
d61fGFf5KTmeMsmIuKpni1XO5hnGZsB1HR1rG2lTpG0nIfbN 1.引言    万维网WWW(World Wide Web)是一个巨大的,分布全球的信息服务中心,正在以飞快的速度扩展。1998年WWW上拥有约3.5亿个文档[14],每天增加约1百万的文档[6],不到9个月的时间文档总数就会翻一番[14]。WEB上的文档和传统的文档比较,有很多新的特点,它们是分布的,异构的,无结构或者半结构的,这就对传统信息检索技术提出了新的挑战。    传统的WEB搜索...
阅读全文