现在位置: 首页 > 搜索技术 > 文章
2019年12月17日 搜索技术 ⁄ 共 902字 评论关闭
  超文本传输协议HTTP协议被用于在Web浏览器和网站服务器之间传递信息,HTTP协议以明文方式发送内容,不提供任何方式的数据加 密,如果攻击者截取了Web浏览器和网站服务器之间的传输报文,就可以直接读懂其中的信息,因此,HTTP协议不适合传输一些敏感信 息,比如:信用卡号、密码等支付信息。   为了解决HTTP协议的这一缺陷,需要使用另一种协议:安全套接字层超文本传输协议HTTPS,为了数据传输的安全,HTTPS在HTTP的基 ...
阅读全文
2019年12月17日 搜索技术 ⁄ 共 417字 评论关闭
  token什么意思?token在计算机身份认证中是令牌(临时)的意思,在词法分析中是标记的意思。一般作为邀请、登录系统使用。   令牌(信息安全术语)   Token, 令牌,代表执行某些操作的权利的对象   访问令牌(Access token)表示访问控制操作主体的系统对象   邀请码,在邀请系统中使用   Token, Petri 网(Petri net)理论中的Token   密保令牌(Security token),或者硬件令牌,例如U盾,或者叫做认证令牌或者加密令牌...
阅读全文
2019年12月17日 搜索技术 ⁄ 共 542字 评论关闭
  很多人都听过js,但是不知道js是什么意思,也不知道js有什么用,下面php中文网为您总结一下js。    JS是什么意思   Javascript简称js,js是一种脚本语言,是不需要进行编译的,也是浏览器中的一部分,经常用在web客户端脚本语言,主要是用来给html增加动态功能。    js有什么用   一般情况下,html页面主要是用于静态内容的显示,但是在实际中,页面很少的静态的,现在是网站都会有一些表单和幻灯片,这些都是使...
阅读全文
2019年12月17日 搜索技术 ⁄ 共 1268字 评论关闭
  常被计算机管理员用于确认安全策略,同时被攻击者用于识别目标主机上的可运作的网络服务。   端口扫描定义是客户端向一定范围的服务器端口发送对应请求,以此确认可使用的端口。虽然其本身并不是恶意的网络活动,但也是网络攻击者探测目标主机服务,以利用该服务的已知漏洞的重要手段。端口扫描的主要用途仍然只是确认远程机器某个服务的可用性。   扫描多个主机以获取特定的某个端口被称为端口清扫(Portsweep),以此获...
阅读全文
2019年06月04日 搜索技术 ⁄ 共 3870字 评论关闭
文章目录 作者:Winter 工程师 搜索引擎,上网的人基本上都不陌生了,CNNIC的第17次《互联网调查报告》显示,使用搜索引擎服务的网民,仅次于电子邮件。中文分词,估计了解的人并不多,毕竟太技术,太底层。但中文分词是中文搜索引擎系统中非常重要的模块,这里之所以强调是中文搜索引擎,是针对英文搜索引擎来讲,因为对于英文来说,空格代表词和词之间的分隔,也...
阅读全文
2019年06月04日 搜索技术 ⁄ 共 1363字 评论关闭
现在网上有很多种分词方法。要精确必然损失性能,要性能那么精确度必然下降。 比如有句话: "我是中国人" 看看这句话有多少种划分 我 我是 我是中 我是中国 我是中国人   是 是中 是中国 是中国人     中 中国 中国人       国 国人         人 按照灰色区域划分,无疑是正确的。但是从全部分词划分上来说,分词的分法达到了 2^n种。 在我见过的分发中,很多种都是大同小异。而很多种都提到了一个概念——最大词匹...
阅读全文
        对索引网页库信息进行预处理包括网页分析和建立倒排文件索引两个部分。中文自动分词是网页分析的前提。文档由被称作特征项的索引词(词或者字)组成,网页分析是将一个文档表示为特征项的过程。在提取特征项时,中文又面临了与英文处理不同的问题。中文信息和英文信息有一个明显的差别:英语单词之间用空格分隔;而在中文文本中,词与词之间没有天然的分隔符,中文词汇大多是由两个或两个以上的汉字组成的,并且语句是...
阅读全文
2019年06月04日 搜索技术 ⁄ 共 4384字 评论关闭
在《“全文检索(full-text search)”和“搜索引擎(search engine)”的区别和联系》中我们提及到了中文分词,以及《双数组Trie(Double Array Trie)实现原理的一点剖析》中阐述了高效率中文分词的实现。接下来让我们抛开双数组Trie的那些公式,从概念上来了解一下分词技术,因为英文分词相对比较简单,这里主要来了解的是中文分词。 英文是以词为单位的,词与词之间上靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描述...
阅读全文
2019年06月04日 搜索技术 ⁄ 共 4618字 评论关闭
     信息的飞速增长,使搜索引擎成为人们查找信息的首选工具,Google、百度、中国搜索等大型搜索引擎一直是人们讨论的话题。随着搜索市场价值的不断增加,越来越多的公司开发出自己的搜索引擎,阿里巴巴的商机搜索、8848的购物搜索等也陆续面世,自然,搜索引擎技术也成为技术人员关注的热点。   搜索引擎技术的研究,国外比中国要早近十年,从最早的Archie,到后来的Excite,以及altvista、overture、google等搜索引擎面世...
阅读全文
2019年03月15日 搜索技术 ⁄ 共 2019字 评论关闭
这个信息相当繁杂的互联网时代,我们已经学会了如何利用搜索引擎这个强大的利器来找寻目标信息,比如你会在Google上搜索情人节如何讨女朋友欢心,你也会在百度上寻找正规的整容医疗机构(尽管有很大一部分广告骗子)。那么如果在你自己开发的网站系统中需要能让用户搜索一些重要的信息,并且能以结构化的结果展现给用户,下面分享的这9款Java搜索引擎框架或许就可以帮助到你了。 1、Java 全文搜索引擎框架 Lucene 毫无疑问...
阅读全文