现在位置: 首页 > 搜索技术 > 文章
原文:HTML5+Ajax+Jquery调用Google搜索API实现搜索引擎,支持web,image,news,vedio4种模式! 源代码下载地址:http://www.zuidaima.com/share/1550463589878784.htm web,image,news,vedio4种模式! 已经拿javaniu作出测试,下载即可查看 
阅读全文
2017年10月24日 搜索技术 ⁄ 共 404字 评论关闭
百度的中文搜索非常的好,Google的搜索引擎支持很多种语言,速度也很快,据说有8000多台服务器来支撑搜索,但是有时候域名解析不是特别的稳定。而且我们发现用同一个关键字在不同的搜索引擎里面搜索,搜索的结果可能有天渊之别。那么在我们的工作当中,有没有其他的一些好的经典的搜索引擎,下面是我在平常的工作中也经常用到的搜索引擎,特别是搜索英文技术相关的关键字的时候,速度和稳定性都比较好,当你在google和baidu上...
阅读全文
2017年10月23日 搜索技术 ⁄ 共 4053字 评论关闭
1、双引号 把搜索词放在双引号中,代表完全匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。bd和Google 都支持这个指令。例如搜索: “seo方法图片” 2、减号 减号代表搜索不包含减号后面的词的页面。使用这个指令时减号前面必须是空格,减号后面没有空格,紧跟着需要排除的词。Google 和bd都支持这个指令。 例如:搜索 -引擎 返回的则是包含“搜索”这个词,却不包含“引擎”这个词的结...
阅读全文
2017年10月07日 搜索技术 ⁄ 共 126字 评论关闭
ubuntu默认的源: http://cn.archive.ubuntu.com/ubuntu/ 对应的firefox版本被修改过,firefox 默认的搜索引擎是baidu 将其删除,直接使用: http://www.firefox.com.cn/ 的最新版即可
阅读全文
2017年10月02日 搜索技术 ⁄ 共 915字 评论关闭
                 Solr是一个基于Lucene的全文搜索引擎,提供了更丰富的搜索语言,更灵活的配置,更高的查询效率。一句话,与Lucene相比,有过之而无不及。这一节里, 主要谈论两个知识点:Jdk的安装和Tomcat的安装。 Solr服务器端使用的是JAVA,所以我们需要安装这两个软件。 有朋友可能说,安装这两个软件就不用讲了吧,其实不然, 对于.NET的同学来说,他们对这两个软件比较陌生。                 首先要安装JDK,然后再安...
阅读全文
2017年09月30日 搜索技术 ⁄ 共 3338字 评论关闭
一致性hash和solr千万级数据分布式搜索引擎中的应用 2013/08/31 | 分类: IT技术 | 0 条评论 | 标签: 分布式, 大数据, 服务器 分享到:3 原文出处: 严澜(@观澜而索源) 互联网创业中大部分人都是草根创业,这个时候没有强劲的服务器,也没有钱去买很昂贵的海量数据库。在这样严峻的条件下,一批又一批的创业者从创业中获得成功,这个和当前的开源技术、海量数据架构有着必不可分的关系。比如我们使用mysql、ngi...
阅读全文
2017年09月29日 搜索技术 ⁄ 共 4038字 评论关闭
分类: 架构设计 架构升级 搜索引擎2013-10-23 20:38 319人阅读 评论(0) 收藏 举报 spider搜索引擎linuxsocketepoll 本文将介绍epoll的概念,原理, 优点,及使用接口,同时结合作者在搜索引擎spider开发中epoll使用方式的代码向大家具体介绍epoll的使用方式。 P.S. 笔者08年曾有使用epoll编写未考虑压力控制的crawler,将国内著名票务网站压垮并在boss的带领下登门道歉的经历:) 足见epoll的强悍! epoll是什么 按...
阅读全文
2017年05月14日 搜索技术 ⁄ 共 1696字 评论关闭
对于许多人来说,谷歌已经成为他们在互联网上进行搜索的主要工具。但是在谷歌统治互联网搜索之前,雅虎Yahoo Directory才是主流搜索引擎。 可是现在,Yahoo Directory即将被关闭。雅虎今天宣布,Yahoo Directory将与Yahoo Education、视频分享Qwiki等服务一起被关闭。 雅虎发文称:“20年前,雅虎推出Yahoo Directory作为网站目录,帮助用户在互联网上搜索。虽然我们依然致力于连接用户与他们感兴趣的信息,但我们的业务...
阅读全文
  robots.txt是一种存放于网站根目录下的文本文件,用于告诉搜索引擎的爬虫(spider),此网站中的哪些内容是不应被搜索引擎的索引,哪些是可以被索引。通常认为,robots.txt文件用来搜索引擎对目标网页的抓取。 robots.txt协议并不是一个规范,而只是约定俗成的,通常搜索引擎会识别这个文件,但也有一些特殊情况。 对于Google来说,使用robots也未必能阻止Google将网址编入索引,如果有其他网站链接到该网页的话,Google...
阅读全文
2017年01月04日 搜索技术 ⁄ 共 1936字 评论关闭
                   接上篇,Solr的准备工作完成后,本节主要介绍Solr的安装,其实Solr不需要安装.直接下载就可以了                   1.Solr配置                       下载地址 :http://lucene.apache.org/solr/                           1.在D盘下创建目录 D:\Server\Solr                           2.解压solr-4.8.0文件,我这里下载的是这个4.8版本,将example文件夹下的Solr文件夹中的所有文件拷贝到D:\Server\Solr...
阅读全文