现在的位置: 首页 > 综合 > 正文

《搜索引擎优化 SEO 知识完全手册》完整版2

2012年12月28日 ⁄ 综合 ⁄ 共 23156字 ⁄ 字号 评论关闭
《搜索引擎优化 SEO 知识完全手册》完整版2

第三部分:对搜索引擎友好的网页设计制作
一般的网页设计都由网页设计师完成。设计师设计网站往往仅从美观、创意和易用的角度考虑,这对于一个期望获得搜索引擎排名优秀的商业网站来说,已经远远不够了,网站策划人员至少应该为设计师递交一份需求备忘录,提醒在设计中需要配合和注意的环节。
                      目录结构和 URL
URL 是统一资源定位,即每个网页的网址、路径。网站文件的目录结构直接体现于 URL。清晰简短的目录结构和规范的命名不仅有利于用户体验和网址传播,更是搜索引擎友好的体现。
目录层次:
对于一个小型网站来说,一般只有一层子目录,如下:
http://www.yoursite.com/dir1/page.htm
www.yoursite.com 是域名,dir1 是一级目录名,page 是文件名。对搜索引擎而言,这种单一的目录结构最为理想,即扁平结构(Flat)。
而对规模大一些的网站,往往需要二到三层子目录。象这样:
http://www.yoursite.com/dir1/dir2/dir3/page.htm
搜索引擎还是会去抓取二到三层子目录下的文件,但最好不要超过 3 层,如果超过 4 层,象以下这个页面,搜索引擎就很难去搜索它了:
http://www.yoursite.com/dir1/dir2/dir3/dir4/page.htm
当然,以下情况下,即使深入第四层甚至更深层次的页面,也同样能被搜索到:
1、如果该页提供了重要内容,有大量来自其它网站的外部链接(Inbound Links);
2、如果在首页上增加一个该页的链接,可以通过首页直接到达,搜索 Spider 还是可以轻易地找到它;
3、如果有其它网站在顶级页面上链接了该页,其效果就好似你在自己的首页上做了该链接。此外,图形、脚本、CGI-BIN 和 CSS 样式表则各自建立专门的目录收入其中,一般不放在根目录下。
目录和文件命名:
根据关键字无所不在的原则,可以在目录名称和文件名称中使用到关键词。但如果是关键词组,则需要用分隔符分开。我们常用连字符“-”和下划线“_”进行分隔,URL 中还经常出现空格码“%20”。因此,如果以“中国制造”作文件名,就可能出现以下三种分隔形式:
  made-in-china.htm
  made_in_china.htm
  made%20in%20china.htm
但事实上,至少在目前 Google 并不认同“_”为分隔符。对 Google 来说, made-in-china
和 made%20in%20china 都等于 made in china,但 made_in_china 就被读成了 madeinchina,连在一起之后,关键词就失去了意义。因此,目录和文件名称如果有关键词组,要用连字符“-”而不是下划线“_”进行分隔。
URL 应该越短越好。有人为了单纯增加关键字而额外建多一个带有关键字的子目录,改变目录结构。由于 URL 中含有关键字本身对排名提高帮助并不大,因而这种做法多此一举,也是搜索引擎反感的。
绝对 URL 和相对 URL:
绝 对 URL : 即 网 页 路 径 使 用 包 含 顶 级 域 名 在 内 的 完 整 的 URL 。 如 :www.yoursite.com/page1/index.html 是一个绝对路径,其中/page1/index.html 则为相对路径,由浏览器自动在该链接前加上 www.yoursite.com。总体上,Google 在排名时并不在意 URL 使用的是相对路径还是绝对路径。
动态 URL:
目前很多网站都有数据库驱动生成的 URL,即动态 URL,往往表现为在 URL 中出现“?”、“=”、“%”,以及“&”、“$”等字符。动态 URL 极不利于搜索引擎抓取网页,严重影响网站排名,
通常是通过技术解决方案将动态 URL 转化成静态的 URL 形式,如:
http://www.domain.com/messages.php?id=2&type=5
转化为 http://www.domain.com/messages/2/5/
下文将会专门提到动态 URL 的解决方案。
                            导航结构
网站导航是对引导用户访问网站的的栏目、菜单、在线帮助、布局结构等形式的统称。其主要功能在于引导用户方便地访问网站内容,是评价网站专业度、可用度的重要指标。同时对搜索引擎也产生诸多提示作用。概括地讲,网站在导航方面应注意以下几点:
1、 主导航醒目清晰
主导航一般体现为一级目录,通过它们用户和蜘蛛程序都可以层层深入访问到网站所有重要内容。因此主栏目必须在网站首页第一屏的醒目位置体现,并最好采用文本链接而不是图片。
2、 “面包屑型(Breadcrumbs)”路径
所谓“面包屑”是比喻用户通过主导航到目标网页的访问过程中的路径提示,使用户了解所处网站中的位置而不至于迷失“方向”,并方便回到上级页面和起点。路径中的每个栏目最好添加链接。如下:
时代营销:首页 > 网络营销动态 > 特别报道
即使没有详细的路径来源,也至少应该在每个子页面提示回首页的链接,包括页面的 LOGO作链接。
3、首页突出重要内容
    除了主栏目,还应该将次级目录中的重要内容以链接的方式在首页或其它子页中多次呈现,以突出重点。搜索引擎会对这种一站内多次出现的链接给予充分重视,对网页级别
(PageRank)提高有很大帮助,这也是每个网站首页的网页级别一般高于其它页面级别的重要因素,因为每个子页都对首页进行了链接。
4、使用网站地图
网站地图(Site Map)是辅助导航的手段,最初是为用户设计,以方便用户快捷到达目标页。良好的网站地图设计常常以网站拓扑结构体现复杂的目录关系,具有静态、直观、扁平、简单的特点。多采用文本链接,不用或少用修饰性图片,以加快页面加载速度。以上特点符合搜索引擎友好的要求,因此网站地图在 SEO 中也有重要的意义。尤其对于那些采用图片导航和动态技术生成的网页,通过在网站地图中进行文本链接,可在一定程度上弥补蜘蛛程序无法识别图片和动态网页造成的页面不可见的风险。
需要注意,网站地图也要突出重点,尽量给出主干性内容及链接,而不是所有细枝末节。一页内不适宜放太多链接。Google 明确提出“如果网站地图上的链接超过大约 100 个,则最好将网站地图拆成多个网页”。
工具推荐:
Xenu:http://home.snafu.de/tilman/xenulink.html 生成网站地图
                          框架结构

框架结构,即帧结构(Frame)网页表现为一个页面内的某一块保持固定,其它部分信息可以通过滚动条上下或左右移动显示,如左边菜单固定,正文信息可移动,或者顶部导航和LOGO 部分保持固定,其它部分上下或左右移动。我们的邮箱通常都采用框架建构。框架型网页的另一个表现是,深层页面的域名通常不会在 URL 中体现出来,即使进入深层子页面,浏览器显示出来的 URL 仍然是主页的 URL。
框架型网站的优越性体现在页面的整体一致性和更新方便上。尤其对于那些大型网站而言,框架结构的使用可以使网站的维护变得相对容易。但框架对搜索引擎来说是一个很大的问题,这是由于大多数搜索引擎都无法识别框架,也没有什么兴趣去抓取框架中的内容。此外,某些浏览器也不支持框架页面。
如果网页已经使用了框架,或出于某种原因一定要使用框架结构,则必须在代码中使用“Noframes”标签进行优化,把 Noframe 标签看做是一个普通文本内容的主页。在<Noframe></Noframe>区域中包含指向 frame 页的链接以及带有关键词的描述文本,同时在框架以外的区域也出现关键词文本。这样,搜索引擎才能够正确索引到框架内的信息。
还有一个办法是采用 iframe 即内联框架(Inner Frame)技术来避免 Frame 带来的不便。所谓 iframe 也是框架的一种形式,它是相当于在主浏览器窗口中内嵌一个子窗口,内容自动打开。iframe 可以嵌在网页中的任意部分,也可以随意定义其大小,其代码显示为: <iframe src=xx width=x height=x scrolling=xx frameborder=x></iframe>”
对搜索引擎来说,iframe 中的文字是可见的,也可以跟踪到其中链接指向的页面,不过与用户所见不同的是,搜索引擎将 iframe 内容看成单独的一个页面内容,与被内嵌的页面无关。
                          图像优化
一般而言,搜索引擎只识读文本内容,对图像是不可见的。同时,图像文件直接延缓页面加载时间,如果超过 20 秒网站还不能加载,用户和搜索引擎极有可能离开你的网站。因此,除非你的网站内容是图片为主,比如游戏站点或者图片至关重要,否则尽量避免使用大图片,更不要采用纯图像制作网页(SPLASH PAGE)。
网站图片优化的核心有两点:增加搜索引擎可见的文本描述,以及在保持图像质量的情况下尽量压缩图像的文件大小。
Alt 属性:
每个图像<IMG>标签中都有 ALT 属性,搜索引擎会读取该属性以了解图像的信息。因此,最好在所有插图的 ALT 属性中都有文字描述,并带上该页关键字在其中。
如:www.marketingman.net/wm37.htm 的书籍广告图片代码为:
<img src="images/webmarketing2_cover_200.jpg" width="200" height="259" alt="《网
络营销基础与实践》第 2 版(冯英健著,2004)" border="0">
文本说明:
除了 ALT 属性文字,还可以考虑以下方法直接优化图像,使之被搜索到:
1、在图片上方或下方加上包含关键词的描述文本;
2、在代码中增加一个包含关键词段的 heading 标题标签,然后在图片下方增加文字描述。
3、在图片下方或旁边增加如“更多某某”链接,包含关键词。
4、创建一些既吸引用户又吸引搜索引擎的文本内页,先把流量吸引到这些页面,再提供文本链接指向你的图片页面。
总体上,网页应尽量减少装饰性图片以及大图片。而 Alt 属性中的文字对搜索引擎来说,其重要性比正文内容的文字要低。
Gif 和 JPGE 图像优化:
Alt 属性和文本说明都只是对图像之外的文本环境进行优化,下面简单谈谈对图片本身的优化处理。对图片文件优化的目的是在尽量不影响图像画面效果的情况下,将其文件大小降到最低,以加快页面整体下载速度。
网页图片格式主要有 GIF 和 JPGE 两种形式。一般来讲,GIF 适用于线图和企业标识;JPEG适宜照片元素的格式。主要通过减少 GIF 颜色数量、缩小图片尺寸和降低分辩率来缩小文件,也可以采用层叠样式表达到优化的目的。PhotoShop 的版本越高越适用于网络图形。此外,将大图片切割成若干小图片于不同的表格区间内进行拼接,也可以相对加快下载时间。
工具推荐(英文):www.xat.com/internet_technology/download.html (图片优化工具)
FLASH 优化:
由于 FLASH 优美的视觉效果和广阔的创意空间,FLASH 技术在网页设计和网络广告中的应用非常广泛,很多网站首页甚至全部用 FLASH 设计。但 FLASH 网页有一个非常致命的问题,即大部分搜索引擎无法识别 FLASH 中的信息。Google 也只能检索到部分 Flash 文件中的内嵌链接。以下列举一个制造机电设备的企业网站首页的代码,用 FLASH 制作,请注意是否可以看见有意义的文本:
<html>
<head>
<title>Welcome</title>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<style type="text/css">
<!-- body {
  margin-left: 0px;
  margin-top: 0px;
  margin-right: 0px;
  margin-bottom: 0px;
}
-->
</style>
<link rel="stylesheet" href="style.txt" type="text/css">
</head>
<body bgcolor="#FFFFFF" text="#000000">
<table border="0" width="100%" height="100%" cellspacing="0" cellpadding="0">
<tr>
  <td width="100%" background="images/bg.jpg"><div align="center">
    <center>
    <table width="777" border="0" align="center" cellpadding="0" cellspacing="0">
      <tr>
        <td><object classid="clsid27CDB6E-AE6D-11cf-96B8-444553540000"
codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,29
,0" width="777" height="455">
        <param name="movie" value="index.swf">
        <param name="quality" value="high">
        <embed src="index.swf" quality="high"
pluginspage="http://www.macromedia.com/go/getflashplayer"
type="application/x-shockwave-flash" width="777" height="455"></embed>
        </object></td>
      </tr>
    </table>
    <br>
   <span class="style2">
本 页 使 用 FLASH 技 术 , 如 果 无 法 正 常 浏 览 请 下 载 并 <a href="http://www.macromedia.com/shockwave/download/triggerpages/flash.html">安装插件 </a>或<a href="asp-bin/big5/?page=1">直接进入 </a><br> if you are not able to view the animated a href="http://www.macromedia.com/shockwave/download/triggerpages/flash.html">pleass           install
plug-in </a> first <br><!--网站计数器开始-->
<scrīpt language="Javascrīpt" src="counter/count.asp"></scrīpt>
<!--网站计数器结束-->
    </span>
    </center>
    </div>   </td>
</tr>
</table>
</body>
</html>
同时再采用模拟蜘蛛程序的工具,测试到搜索引擎对该页抓取结果如下:
Spidered Text (蜘蛛可识别的文本):
Welcome 本页使用 FLASH 技术,如果无法正常浏览请下载并 安装插件 或 直接进入 if you
are not able to view the animated pleass install plug-in first
Spidered Links(蜘蛛可识别的链接):
http://www.macromedia.com/shockw ... gerpages/flash.html
asp-bin/big5/?page=1 (下载 FLASH 插件的链接地址)
http://www.macromedia.com/shockw ... gerpages/flash.html
因此可以得出结论是:
蜘蛛程序没有在这个企业网站首页获得任何有意义的文本内容,也没有获得该 Flash 首页中进入“中文版”“英文版”关键性内容的链接。
FLASH 优化可以从以下三个方面来考虑:
1、做一个辅助 HTML 版本:
保留原有 FLASH 版本的同时,还可以设计一个 HTML 格式的版本,这样既可以保持动态美观效果,也可以让搜索引擎通过 HTML 版本的网页来发现网站。
2、将 Flash 内嵌 HTML 文件:
还可以通过改变网页结构进行弥补,即不要将整个网页都设计成 Flash 动画,而是将 Flash内容嵌入到 HTML 文件中,这样对于用户浏览并不会削弱视觉效果,搜索引擎也可以从 HTML代码中发现一些必要的信息,尤其是进入内容页面的链接。即使首页全部动用了 FLASH,也应该将进入内页的关键性按钮/链接置于 FLASH 文件之外,以独立纯文本链接的方式呈现。上文案例将“中文版”链接置于 FLASH 文件中,使得蜘蛛程序一无所获,无法抓取到内页信息。
3、 付费登录搜索引擎:
如果 FLASH 网站错过了被免费的技术型搜索引擎自动检索的机会,或者搜索结果排名效果不太理想,可以通过付费登录或做搜索引擎关键词广告,同样被用户搜索到。
总体上,商业网站应尽量少用 FLASH,站点间进行广告交换时也要避免采用 FLASH 广告为上策。
                          表格使用

表格是网页最重要的排版方式。如果某个网页采用了大段的长篇文本,除了可以将一页文本分成多面,还可以考虑将文本置入不同表格中,这样不仅管理方便,也使得该页加载时每个表格内容依次加载,这样访问者就可以一边看已下载内容一边等待剩余部分加载,而不是等待很久之后才一齐加载出来。表格之内套嵌太多表格也不利于页面加载,因浏览器是先加载完大表格之后再加载内嵌的小表格,因此内嵌表格会最终降低整页加载速度。
                          网页减肥

代码设置不妥不仅延长网页加载时间,也严重影响蜘蛛程序对网页内容的抓取。通过对网页代码进行清减(俗称“网页减肥”),去掉臃肿杂乱的代码,减小网页文件大小,能够加快网页加载速度,让蜘蛛快速索引到重要内容。正常情况下一个页面的文件大小在 15K 左右,最好不要超过 50K。网页减肥重点涉及以下几个要点:
CSS 样式
网页制作应通过 CSS(层叠样式表单)来统一定制字体风格,以使代码标准化,避免大量的字体和格式化标签如< h1 >< /h1 >、< font size=×× color=×× >< /font >充斥页面。通过 css 可以控制任何 HTML 标签的风格。例如<td>,<p>,<body>,<table>,<tr>,<th>等。只要在HTML的<head>区内的<style type="text/css">和</style>之间指定对应标签的风格如字体,颜色,大小即可,例如:
<style type="text/css">
<!--
h2 { font-family: "宋体"; font-size: 12pt; color: #333366; background-color:
#FFCCCC; font-weight: bold}
h1 { font-family: "Arial"; font-size: 12pt; color: #993300}
-->
</style>
仅通过以上设置,就把文字的字体、字号、颜色、背景色等统一起来,不用对每段文字单独进行格式定义,从而减少大量重复性标签。注意把所有 css 文件单独存放在命名为 css 的外部文件中。通过设置 CSS 样式,也可以提升导航文本的美观度,达到与图片导航同样优美观的效果,这点尤其提醒网页设计师注意,没有必要将导航条用图片呈现。
Javascrīpt:
正常情况下,网页尽量以<HTML>作为代码的开始端。但采用 Javascrīpt 技术的网页往往在页面一开始就堆积大量 JAVA 代码,以至 META 及关键字迟迟不能出现,被推至页面底部,对搜索引擎很不友好。有两种方法可以使之得以改善:
1、 将脚本移至页面底部
大部分的 JAVA 代码都可以移到页面结束标签之上,而不影响网站功能。这样就能一开始突出关键词,并加快页面加载时间。
2、 将 JAVA 脚本置入一个.js 扩展名的文件。
包含你的 Javascrīpt 的.js 文件通常在网站访问者的浏览器中被缓存下来,使得下次访问速度加快,也使得网站修改和维护起来更加方便。例:一段 JAVA 代码正常情况下显示如下:
<scrīpt language=Javascrīpt>
<!--
此处是你的代码,将它们拷贝到一个.js 文件
//-->
</scrīpt>
忽略开始及结束标签,将中间的代码单独保存为扩展名为.js 的文件,如文件名为
“mycode.js”的一个文件,然后将此文件上传到服务器上与该页同样的目录下。最后将上文列举的完整的 Javascrīpt 置换为简单的一行:
<scrīpt language=Javascrīpt src=mycode.js></scrīpt>
这样,一个“mycode.js”文件就将大段冗长复杂的 JAVA 代码置换了。
工具推荐:
网页减肥工具:http://202.99.237.33/softdown/softdoc/net_opt.htm 去除网页中多余
代码,减小网页。

第四部分:SEO 指导下的技术支持
对搜索引擎最友好(Search Engine Friendly)的网页是静态网页,但大部分内容丰富或互动型网站都不可避免采用到相关技术语言来实现内容管理和交互功能。SEO 思想指导下的技术支持,主要是对特定代码的优化和对动态网页进行静态处理的措施。
                    Title 和 Meta 标签
以.html 或.htm 为扩展名的 HTML 文档称为静态网页。Meta 称为元标志,用于网页的<head>与</head>中。Meta 标签的用处很多,目前几乎所有的搜索引擎机器人都通过自动查找Meta 值来给网页分类,是籍此判断网页内容的基础。其中最重要的是 descrīption(网站描述)和 keywords(网站关键词)。另外一个基本的属性是 Title 标签,提示搜索引擎关于本页的主题。Meta 和 Title 的形式在 html 语言中体现为:
<head>
<title>title 标题</title>
<meta name="keywords" content="网页描述">
<meta name="descrīption" content="关键词">
......
</head>

尽管Meta本身不足以解决排名问题,但对Meta标签的书写仍然是搜索引擎优化的基础工作。清晰准确的 Meta 文字与正文内容的关键词相呼应,是排名加分的重要条件之一。
标题(Title):
网页优化可以说是从 Title 开始的。在搜索结果中,每个抓取内容的第一行显示的文字就是该页的 Title,同样在浏览器中打开一个页面,地址栏上方显示的也是该页的 Title。因此,Title 可谓一个页面的核心。对 Title 的书写要注意以下问题:
1、title 简短精炼,高度概括,含有关键词,而不是只有一个公司名。但关键词不宜过多,不要超过 3 个词组。企业网站的 title 通常以公司名+关键词为内容
2、前几个词对搜索引擎最重要,因此关键词位置尽量靠前。
3、最好将 title 组织成符合语法结构和阅读习惯的短句或短语,避免无意义的词组罗列式
title
关键词(Keywords):
Keywords 提示搜索引擎:本网站内容围绕这些词汇展开。因此 keywords 书写的关键是每个词都能在内容中找到相应的匹配才有利于排名。Meta 中的关键词书写技巧见前文的“关键词策略”。
描述(Descrīption):
描述部分用简短的句子告诉搜索引擎和访问者关于本网页的主要内容。用该网站的核心关键词搜索后得到的搜索结果中,描述往往显示为标题后的几行描述文字。Descrīption 一般被认为重要性在 title 和 keywords 之后。描述的书写要注意以下问题:
1、 描述中出现关键词,与正文内容相关
2、 同样遵循简短原则,字符数含空格在内不要超过 200 个字符
3、 补充在 title 和 keywords 中未能充分表述的说明
其它 Meta 标签:
为了限制搜索引擎对内容的抓取,可以采用以下几个 Robots Meta 标签:
<meta name="Robots" content="all|none|index|noindex|follow|nofollow">
其中:all:文件将被检索,且页面上的链接可以被查询; none:文件将不被检索,且页面上的链接不可以被查询;index:文件将被检索;follow:页面上的链接可以被查询;noindex:文件将不被检索,但页面上的链接可以被查询;nofollow:文件将不被检索,页面上的链接可以被查询。但并不是所有的搜索引擎都支持 meta 中的 robots 标签,但是所有搜索引擎都支持一个功能 ,更强的 robots.txt 的文本文件来达到上述功能(关于 robots.txt 文件应用的介绍,E 书专家平文胜曾专门撰文详细解说“robots.txt 和 Robots META 标签”)。其它常用 meta 标签还有:
<META name author> 网站作者
<META name classification> 网站所属目录类别
<META name copyright> 版权声明
<META name generator> 网站用什么软件做的
……
首页、重要的内页的 title 和 meta 标签最好分别书写,针对栏目主题体现不同的内容。
                        动态网页优化
动态网站是指网站内容的更新和维护是通过一个带有数据库后台的软件,即内容管理系统(CMS)完成。一般采用 ASP,PHP,Cold Fusion,CGI 等程序动态生成页面。动态页面在网络空间中实际并不存在,它们的大部分内容通常来自与网站相连的数据库,只有接到用户的请求,在变量区中输入一个值以后才会生成。动态网页扩展名显示为.asp、.php、cfm 或.cgi,而不是静态网页的.html 或者.htm。其 URL 中通常出现“?”、“=”、“%”,以及“&”、“$”等符号。网站使用动态技术的好处,除了增加网站交互功能,还具有容易维护和更新的优点,因此为许多大中型网站采用。但大多数搜索引擎的蜘蛛程序都无法解读符号“?”后的字符。这就意味着动态网页很难被搜索引擎检索到,因而被用户找到的机会也大为降低。因此,建设网站之前首先要端正思想,即能够采用静态表现的网页尽量不要用动态实现,重要的网页用静态表现。同时使用技术将动态网页转化成静态网页形式,使 URL 中不再包含“?”“=”等类似的符号。也可以通过对网站进行一些改动,间接增加动态网页的搜索引擎可见度。即坚持“动静结合,以静制动”的原则。
不同技术的解决方案:
针对不同程序开发的动态网页有着相应的解决方案。以下是作者 Karen 编译的部分内容:
1、CGI/ Perl
如果你在网站中使用的是 CGI 或者 Perl,可用一个脚本拾取环境变量前的所有字符,再将URL 中剩余的字符赋值给一个变量。这样,你就可以在 URL 中使用该变量了。
不过,对于那些内置了部分 SSI(Server-Side Include:服务器端嵌入)内容的网页,主要
的搜索引擎都能够提供索引支持。那些以.shtml 为后缀名的网页也被解析成 SSI 文件,相当于通常的.html 文件。但如果这些网页在其 URL 中使用的是 cgi-bin 路径,则仍有可能不被搜索引擎索引。
2、ASP
ASP(Active Server Pages: Web 服务器端动态网页开发技术)被用于基于微软的网络服务器中。使用 ASP 开发的网页,一般后缀名为.asp。只要避免在 URL 中使用符号“?”,大多数搜索引擎都能够支持用 ASP 开发的动态网页。
3、Cold Fusion
如果你使用的是 Cold Fusion,那么你就需要在你的服务器端重新对其进行配置,使其能够将一个环境变量中的符号“?”用符号“/”代替,并将替换后的数值传给 URL。这样一来,最后到达浏览器端的就是一个静态的 URL 页。当搜索引擎对该转换后的文件进行检索时,它不会遭遇“?”,因而可继续对整个动态页的索引,从而使你的动态网页对搜索引擎仍然具有可读性。
4、Apache 服务器:
Apache 是最流行的 HTTP 服务器软件之一。它有一个叫做 mod_rewrite 的重写模块,即 URL 重写转向功能。该模块能够使你将包含环境变量的 URL 转换为能够为搜索引擎支持的 URL 类型。对于那些发布后无须多少更新的网页内容如新闻,可采用该重写转向功能。
建立静态入口:
在“静动结合,以静制动”的原则指导下,还可以通过对网站做一些修改,尽可能增加动态网页的搜索引擎可见度。如将动态网页编入静态主页或网站地图的一个链接中,以静态目录的方式呈现该动页面。或者为动态页面建立一个专门的静态入口页面(gateway/entry),链接到动态页面,然后将静态入口页面递交给搜索引擎。
对一些重要的、内容相对固定的页面制作为静态网页,如包含有丰富关键词的网站介绍、用户帮助,以及含有重要页面链接的网站地图等。网站首页尽量全部采用静态形式,并将重要动态内容以文本链接方式全部呈现,虽然增加了维护工作量,但从 SEO 的角度看是值得的。也可以考虑为你的重要动态内容创建静态的镜象网站。
付费登录搜索引擎:
当然,对于整个网站都采用与数据库相连的内容管理系统(CMS)发布的动态网站而言,提高搜索引擎可见度的最直接办法就是进行付费登录,直接提交动态网页到搜索引擎目录,或做关键字广告,保证网站被搜索引擎收录。
搜索引擎对动态网站支持的改进
搜索引擎一直在提高自己对于动态页面的支持。到目前为止,GOOGLE、HOTBOT 和百度等开始尝试抓取动态网站页面(甚至包括 URL 带 "?"的页面)。但这些搜索引擎抓取动态页面时,为了避免"搜索机器人陷阱"(spider traps,脚本错误,这种错误会让搜索机器人进行无限循环的抓取,无法退出)",都只抓取从静态页面链接过去的动态页面,而从动态页面链出去的动态页面都不再抓取,即不会对动态页面中的链接进行深入访问。
对于直接使用动态的 URL 地址,请注意:
文件 URL 中不要有 Session Id,同时不要用 ID 作为参数名称(特别是对于 GOOGLE);
如 :《 网 络 营 销 基 础 与 实 践 》 一 书 , 在 当 当 网 的 介 绍 页 面 URL 地 址 是 :
http://www.dangdang.com/product_ ... p?product_id=493698,该页就无法被读取。参数越少越好,尽量不要超过 2 个;尽量不要在 URL 中使用参数,这样可以增加动态页面被抓取的深度和数量。
附:Google 向网站管理员提供的信息:www.google.com/webmasters/guidelines.html
  百度常见站长问题:http://www.baidu.com/search/guide.html#2
第五部分:搜索引擎优化的重点:链接策略
链接是网站的灵魂。用户通过超级链接获得丰富的网站内容,搜索引擎蜘蛛也是沿着一个网站的页面链接层层跟踪深入,完成对该网站的信息抓取。对搜索引擎尤其是 Google 来说,决定一个网站排名的关键,是外部有多少高质量的链接指向这个网站。这就是外部链接或反向链接,也称导入链接(Inbound links 或 backlinks)。而从网站引向其它网站的导出链接以及网站内部页面间的彼此链接也对排名带来或多或少的影响。
                      搜索引擎分类目录
搜索引擎目录(Directory)即搜索引擎的人工分类目录。今天,登录分类目录是网站建成后非常基础、重要的工作,尤其登录几大主要分类目录,其重要性不在于访问者是否通过目录链接找到你的网站,而主要在于通过这些目录你的网站获得了重要的、高质量的外部链接,这对于你的网站提高排名具有举足轻重的作用。目前,对于中文网站来说,最重要的分类目录有以下几个:开放式目录 ODP,Yahoo!,门户搜索引擎目录搜狐、网易、新浪。可以分为免费登录和付费登录两种情况。无论是免费还是付费,都须通过手工输入登录。
免费登录:
最著名最重要的登录是全球最大的开放式目录库 Open Directory Project:www.dmoz.org
ODP 的宗旨是:建立网上最全面最权威的目录,以及建立一个被公众认为高质量的资源库。
在这一宗旨下,全球志愿编辑员选择高质量内容的网站核准进入分类目录。
由于 Google 等重要搜索引擎都采用 ODP 的数据库,是 Google 每月一次深度索引的基础,因此向 ODP 提交网页成为每个网站完成后的首要工作。登录 ODP 目录是免费的,但要接受较为严格的人工审核和较长时间的等待,并且最后可能网站登录不成功,还要经历反复提交的过程。
由于 DMOZ 目录在网站排名中举足轻重的作用,使得越来越多良莠不齐的的网站向 DMOZ 提交或违规提交,而志愿加入的人工编辑队伍中出现以权谋私的现象和素质不高的情况,诸多因素使得现在登陆 DMOZ 非常困难,没有一个网站敢保证被 DMOZ 收录。因此,要确保登录成功,唯一的办法是小心谨慎地完全遵守 DMOZ 登录条款。以下是必须遵守的提交注意事项:
1、确保网站内容是原创而非转载、镜象或复制
如果你的网站内容只是一些会员制产品/服务信息及链接,或是大量拷贝其它站点内容,那么你的网站极有可能被 DMOZ 拒绝。即使对已经收录的站点,一旦发现它们是镜象、复制或非原创,DMOZ 也会将其从目录中剔除。所以务必在网站中加入产品或服务的原创介绍信息。
2、不要采用虚假、作弊和夸张的手段
被搜索机器人反感的做法,同样被目录编辑拒之门外。下文将有专门章节讲到什么是搜索引擎作弊行为。网站说明中任何虚假、夸张的文字都会遭到拒绝。对违法性内容,也是不会收录的。
3、确保网站外观的良好性
如果网站内容出现大量拼写错误、死链接或“正在建设中”的字样,或者下载缓慢,都会阻碍编辑对你的网站的收录。此外,对于来自免费主机的网站,被 DMOZ 收录的机会很少。
4、确保网站中包含具体联系信息
一个 DMOZ 编辑称,如果他在网站中找不到实际联系地址或电话号码,他就会认为这个网站不具备可信度。因此,如果你的网站中只有一个 Email 地址作为联系信息,是极不利于收录成功的。
5、确保网站提交到正确的目录
选择合适的分类目录及子目录是网站提交的核心。很多网站登录失败只是由于提交选择的目录不正确所致。所以在提交网站之前,必须先浏览整个目录,最好也了解一下竞争对手的网站都放在哪个目录下。确认之后,才在该目录页面右上角点击“提交网页”。
6、记下提交日期、目录名和编辑邮箱
向 ODP 提交完你的网站后,记下提交的日期及目录。如果你提交的那个目录下有编辑员信息,最好把编辑的名字和邮箱也记下来。这些信息,对于你需要询问提交网站的处理状态或再次提交时,非常有用。
7、不要多次重复提交网站
因为编辑是根据网站的提交日期顺序进行处理的,一个目录下往往有很多网站在队列中等候审批。从提交成功到最后收录,最快也要 2 周时间,最晚的甚至要等到半年以后。因此,你需要耐心等待结果。如果网站非常庞大,且拥有很多不同内容的分支时,你可以尝试将不同内容的网页分别向 DMOZ 下的相应目录进行提交。
一旦 DMOZ 收录了你的网站,那很快就可以被 Google,Lycos,Netscape,AOL, HotBot,DirectHit 等一些大型搜索引擎和门户网站收录。
其它的重要免费目录包括 Yahoo 目录。Yahoo 是最早开始做分类目录的网站,直到今天登录Yahoo 目录也是网站推广的重要环节。Google 把来自 Yahoo 目录的链接作为网站排名的重要分值。
工具推荐:
检查网站是否登录多个重要目录:www.123promotion.co.uk/directory/index.php
付费登录(Paid Inclusion):
英文 Yahoo 实行付费登录商业网站政策,国内的门户搜索引擎目录也对商业网站纷纷采用付费登录。付费登录商业模式包括普通登录和固定排名,一般按年付费,网站在付费之后立即登录目录,无须等待和受到其它因素的影响。门户搜索引擎的搜索程序也比较偏重于对自身付费目录数据的抓取。
总体上,付费登录对于商业网站和采用了大量不利于搜索引擎友好的手段建设的网站来说,还是有必要的。
关于自动登录软件(Submitting Tools):
自从有了 B2B 商务平台和搜索引擎营销以来,就出现了向这些中间平台和搜索引擎提交供求信息或网站的自动登录软件,并一度在市面上广为流行。搜索引擎自动登录软件的功能是承诺将客户的网站一次性登录到全球 N 个搜索引擎目录,有的甚至保证可以使网站在搜索引擎中的排名获得极大提升。实际上,已经有诸多营销实践者对此类自动登录软件实际效果提出了质疑:
1、真正为网站带来访问量的搜索引擎主要集中于几大主流搜索引擎,其它的小搜索引擎搜索量极小,即使网站被这些小搜索引擎收录成功,也不能指望通过他们带来什么访问量。
2、 今天的主流搜索引擎目录往往采用付费登录或严格的人工审核,这些目录极其反感由自动登录软件提交的网站,有的明确提出拒绝自动提交方式。
3、在软件自带的几千个搜索引擎中,软件本身提示登录成功的大概有百分之六七十,是否真正登录成功,实际操作中很难一个一个去检验。
4、 如果网站有来自其它网站的导入链接,即使不用登录,主流搜索引擎机器人同样会抓取到你的网页。
5、如果从增加外部导入链接的角度出发,英文网站针对英文搜索引擎的自动提交可以一试,聊胜于无,但不可对其抱有太大的期望。
总体上,盛行于免费推广时期的自动登录软件在今天各大主流商业推广平台纷纷实施付费政策的商业模式下,已经越来越丧失价值。
                      高质量导入链接
搜索引擎在决定一个网站的排名时,不仅要对网页内容和结构进行分析,还围绕网站的链接展开分析。对网站排名致关重要的影响因素是获得尽可能多的高质量外部链接,也称导入链接。网站即使没有向目录提交,但由于其他重要网站上有你的网站链接,一样可以获得搜索引擎的快速抓取,并为取得好排名加分。
将导入链接纳入排名重要指标的依据在于,搜索引擎认为,如果你的网站富有价值,其它网站会提及你;对你提及越多,说明价值越大。由此引申出链接广度(Link Popularity)在搜索引擎优化中的重要地位。唯其如此,人们想方设法地为网站“制造”外部链接,导致涌出大量垃圾(spam)链接和网站,于是搜索引擎在算法调整中,仅对高质量的外部链接给予重视,对类似 Spam 的做法往往给予适得其反的结果。
因此,今天对链接广度要有这样的认识:即使获得上百个质量低劣的或内容毫不相干的站点的链接,也抵不上一个高质量且内容高度相关或互补的站点的链接。
链接质量分析:
来自以下网站的链接都可以称为高质量的链接:
  搜索引擎目录中的链接以及已加入目录的网站的链接
  与你的主题相关或互补的网站
  PR 值不低于 4 的网站
  流量大、知名度高、频繁更新的重要网站(如搜索引擎新闻源)
  具有很少导出链接的网站
  以你的关键词在搜索结果中排名前三页的网站
  内容质量高的网站
相比高质量链接,以下链接堪称垃圾链接,对网站排名不起作用或起反作用:
  留言簿、评论或 BBS 中大量发贴夹带网站链接
  已经加入太多导出链接的网站(几十甚至上百个“友情链接”中有一个你的网站)
  加入链接基地(Link Farm)、大宗链接交换程序(bulk link exchange programs)、交
  叉链接(Cross Link) 等链接程序,与大量会员网站自动交换链接,被搜索引擎视为典
  型的垃圾链接,极有可能受到惩罚或牵连。Google 就会对那些使用链接程序的站点进行
  永久性删除。
还有两种导入链接被误认为可以增加链接广度:
  点击付费的搜索引擎广告链接,如百度竞价排名和 Google 的右侧关键词广告。
  多层级的网络会员制联盟(Affiliate program)链接。
这些链接不会直接指向你的网站,而是指向盟主的网站,以方便他们跟踪点击计费,因此不会提高你网站的链接广度。当然,如果你本身主持该会员制联盟,你的服务器就在跟踪会员网站并将它们指回你的站点,这种情况下还是有助于提高你的链接广度。
怎样获得高质量导入链接:
1、 向搜索引擎目录提交网站:
见前文
2、 寻找网站交换链接
俗称友情链接或互惠链接。互惠链接的基础是你的网站内容具有较高质量,否则请求链接不容易成功。交换链接对象包括:
已经加入搜索引擎分类目录的相关网站
所有主要搜索引擎中的与你的行业相关的目录下的网站,都是理想的链接对象。
与你的竞争对手链接的相关网站
要找到这些网站,可以在搜索引擎中输入"link:",跟着输入竞争者的域名,如
"link:theirdomain.com" 和 "link:www.theirdomain.com." 。这样还可以在获得链接的同
时与对手竞争获得目标客户。
生意链中的对象:
竞争对手与你的主题最相关,但交换链接不大可能,因此可以考虑与你的生意链中的上下游合作伙伴,包括分销商,代理商,供应商等的网站交换链接。
容易被找到的相关网站
如那些做搜索引擎广告的网站或其它大力宣传推广的网站,以及自然排名不错的相关网站。
找到以上网站之后,再对其进行链接分析,考察是否属于高质量链接对象。诸如流量 ALEXA 排名、PR 值高低和导出链接的数量都是考察的基本条件。最好为对方提供链接的 HTML 源代码信息,这样链接交换对象只需简单复制这些代码并嵌入自己网页即可。注意,由于你的网站可以通过好几个不同的 URL 达到。比如下面这四个 URL 地址都指向新竞争力的主页:
http://jingzhengli.com/
http://www.jingzhengli.com
http://jingzhengli.com/index.htm
http://www.jingzhengli.com/index.htm
但搜索引擎的链接分析系统视它们为四个完全不同的页面。因此,在交换链接时必须提供一个统一的 URL,一般以符合大多数人群使用习惯的 http://www.yourname.com 为准。
交换链接的过程,是经过对对方网站仔细分析后,通过诚恳的一对一的联系最终获得,而不是漫天撒网的垃圾邮件轰炸来请求交换链接。
3、 网站被主动链接或转载:
这是最获搜索引擎赏识的链接,也是搜索引擎重视外部链接的根本原因。如果你的网站内容丰富,质量高,其它相关网站会主动将你的网站链接到他们的网站。尤其当你的网站提供很多相关免费资源、知识库时,被其它网站链接和转载的机会都很高。
4、 在重要网站发表专业文章:
围绕目标关键词在一些重要站点发表文章,在文章中或结尾带上你的网站签名,或在作者简介中放上你的链接和围绕关键字的网站描述。这样也是既可以获得高质量互惠链接,亦可能获得目标客户。在你的博客日志或个人主页上也不要忘了加上网站链接。注意你发表的每篇文章标题都应该包含关键词在内。
何谓重要网站,指那些流量高,威信度高的网站。个人体会是,可以用你网站的关键词去主流搜索引擎订阅新闻,那些被作为新闻源的网站都被搜索引擎看作重要网站。搜索引擎对这些新闻源每天检索一次,更新频繁,这些网站上的链接自然也成为被更新的对象,效果极佳。
5、 在所在行业目录提交网站
尽可能向更多的相关网络目录、行业目录、商务目录、黄页、白页提交你的网站,加入企业库。
工具推荐:
查询网站有哪些导入链接及数量:
www.sowang.com/so/ (综合查询:含链接广度、PR、ALEXA 排名)
www.marketleap.com/publinkpop(可同时与多个竞争对手网站进行比较)
www.uptimebot.com(同时检测 10 个搜索引擎的收录情况)
www.seotoolkit.co.uk/link_popularity_checker.asp
搜索框命令:在 google 中输入:link:www.yourname.com
        在 Yahoo 中输入:link:http://www.yourname.com  导出链接和内部链接
导出链接就是你的网站中指向其它网站的链接。搜索引擎机器人除了分析你的导入链接,也会分析你引出去的站点,如果导出链接站点内容与你的网站主题相关联,同样有利于搜索引擎友好。这也是交换链接要选择主题相关网站的原因。最后,一个网站内页面间的链接也被纳入链接分析之中,影响到网站的页面等级,最终影响排名。
导出链接:
在你的网站上如果增加一些与你关键词有关的行业/专业的资源性网站链接,不仅有利于丰富网站内容,也有利于提升搜索引擎对你网站的好印象。
这一点尤其值得一些站长注意。由于缺乏原创资料,他们常常转摘其它网站的文章作自己网站的内容,但又不注明来源,惟恐导出链接助长了竞争对手,不利于自己的网站访问量。其实,对搜索引擎来说,适量、适当的导出链接是很有必要的。
当然,导出不同于导入,即使主题相关,也要控制数量。因为从“网页级别”的角度看,搜索引擎认为一个页面奉献的导出链接数量越多,则该网站其它页面的受益相应就减少。所以一个页面导出链接数量应受到合理控制,不要超过 15 个。首页的导出链接更要控制在10个以内,多出的应单独安排在次级页面。Google 认为一个页面的最大导出链接数量不应超过 100 个。
内部链接:
除了导入导出链接,一个站点的页面之间也往往彼此链接,如一篇文章结束后的“相关文章”列表,将该网站中同一主题下的其它文章都链接在内,不仅方便访问者,也有利于搜索引擎。网站应有意识将重要内容页面对次链接于其它页面,让搜索引擎知道这是你的重要页面,从 而给予更高的 PR 值,进行重点索引。
网站还可以通过建立多个二级域名子站,子站间彼此相链,再一起链回主站,形成一个子站群包围主站,对提高排名相当有利。
无论是导出链接还是内部链接,都要保证链接有效而不是死链接,死链过多不仅给用户造成不便,也极不利于搜索引擎友好,影响排名。
附:免费链接检测工具:
1、 Xenu:http://home.snafu.de/tilman/xenulink.html
2、 W3C:http://validator.w3.org/checklink
              关键词链接文本及上下文语意
搜索引擎比较重视链接文本中出现的关键词。因此无论是导出链接、导入链接还是内部链接,都最好兼顾到链接文本中含有关键字。比如导出链接最好选择那些有关键词命名的网站,如一个服装厂商的网站可以在行业资源中添加名称中带有“服装”二字的导出链接。
需要注意的是,如果一个网站的导入链接的文本完全相同,则可能遭致搜索引擎忽略或惩罚。因为搜索引擎希望导入链接是别人自然创建的,这种统一文字使搜索引擎怀疑该网站是为了增加链接广度而进行人为制造的结果。因此网站在对外交换友情链接时最好使用不同的文本,如新竞争力的链接文本就包括“新竞争力”“网络营销管理顾问”“深圳竞争力科技公司” 等。
除了链接文本,链接周围的文字即上下文(Context) 语意也非常重要。链接分析系统通过检查链接上下文内容来确定网站与其链接对象之间的关联度,以评估该页面的内容质量。通过语意分析,也可以判断出关键词是否作弊。
第六部分:走在钢丝上的搜索引擎优化作弊
由于技术型搜索引擎在网站排名过程中完全由蜘蛛程序自动完成,未有人工参与,这为那些针对排名原理而采用欺骗蜘蛛程序的手段提供成功的可能性。因此在 SEO 的发展过程中,一直伴随着关于作弊方法的讨论,成为业界关注的话题。
                        SEO 作弊手段
做 SEO 必须了解基本的作弊手段,目的是避免无意间采用了相关手段遭到处罚。以下是被视为作弊的常见手段:
1、关键字堆砌:
为了增加关键词的出现频次,故意在网页代码中,如在META、title、注释、图片ALT以及URL地址等地方重复书写某关键词的行为(Stuffing)。
2、虚假关键词:
通过在META中设置与网站内容无关的关键词,如在Title中设置热门关键词,以达到误导用户进入网站的目的。同样的情况也包括链接关键词与实际内容不符的情况。
3、 隐形文本/链接:
为了增加关键词的出现频次,故意在网页中放一段与背景颜色相同的、包含密集关键字的文本。访客看不到,搜索引擎却能找到。类似方法还包括超小号文字、文字隐藏层等手段。隐形链接是在隐形文本的基础上在其它页面添加指向目标优化页的行为。
4、 重定向(Re-Direct):
使用刷新标记(Meta Refresh)、CGI程序、Java、Javascrīpt或其它技术,当用户进入该页时,迅速自动跳转到另一个网页。重定向使搜索引擎与用户访问到不同的网页。
5、 偷换网页:
也称“诱饵行为(Bait-&-Switch)”,是在一个网页成功注册并获得较好排名后,用另一个内容无关的网页来替换它的行为。
6、复制站点或内容:
通过复制整个网站或部分网页内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引的行为。镜象站点(Mirror Sites)是此中典型。
7、桥页/门页(Bridge/Doorway/Portal/Entry):
针对某一关键词专门制作一个优化的页面,链接指向或重定向到目标页面。有时候为动态页面建立静态入口,或为不同的关键词建立不同内页也会用到类似方法,但与桥页不同的是,前者是网站实际内容所需而建立的,是访问者所需要的,而桥页本身无实际内容,只针对搜索引擎作了一堆充斥了关键词的链接而已。
8、隐形页面(Cloaked Page)
指同一个网址下对不同的访问者选择性返回不同的页面内:,搜索引擎得到了高度优化的网页内容,而用户则看到不同的内容。
9、重复注册:
违反网站提交纪律,突破时间间隔限制,将一个网页在短时间内反复提交给同一个搜索引擎以获得收录的做法。
10、垃圾链接:
加入“链接工厂”(亦称“大量链接机制”)指由大量网页交叉链接而构成的一个网络系统。一个站点加入 “链接工厂”后,一方面它可得到来自该系统中所有网页的链接,同时作为交换它需要“奉献”自己的链接。籍此方法来提升链接得分。
11、包含指向作弊网页的链接:
这种情况,有的是无辜被作弊网页牵连,有的则是桥页之故。

搜索引擎对作弊的处罚
由于作弊行为完全背离了搜索引擎对搜索结果排名的初衷——对用户有利的原则,破坏了正常的搜索结果,严重影响搜索引擎质量和声誉,并昭示出搜索引擎技术的漏洞,因此作弊行为被搜索引擎厂商深恶痛绝。一旦被侦破为作弊,将视情节轻重给予不同程度的处罚。发生在2005年3月底的Google清理部分垃圾性搜索结果(清理“广告位出租”的SEO垃圾)以及关闭部分作弊情节严重的作弊站长网站事件,就是典型的处罚案例。
搜索引擎技术的发展也是侦破作弊技术的发展。今天,搜索引擎对于蒙蔽它的手段识别技术越来越精,过去可能还行得通的手段在今天就有着被处罚的危险。以下是部分搜索引擎对于作弊行为的处罚:
百度:
根据网页的作弊情况,会受到不同程度的惩罚。
较轻微的惩罚,是系统在给网页排名时略为降低该网页的排名。
较常见的惩罚,是作弊网站的某些关键词(或所有关键词)的排名降到其它任何网站之后。
较严厉的惩罚,对于作弊行为和后果特别恶劣的网站,将从百度中消失。
特别补充,含恶意代码或恶意插件等用户极端反感内容的网页,虽然不是作弊,但只要用户投诉,一经确认也会被百度拒绝收录。
中搜
中搜采用多种方法惩罚作弊。封杀、只索引部分正常内容(不减权)、整个网页排序推后、连带责任。
根据历史纪录,中搜有作弊黑名单,黑名单中的网站是重点防范、监控对象;根据作弊监控算法计算出来分值很高的网站也会被重点审查。
有轻微作弊的基本正常网页,中搜会只收录正常内容,如隐含文字等内容不建索引。
有较多作弊特征的网页会被减权,基本上在前几页没有机会出现。
包含有指向作弊网页的链接的网页会被牵连,承担连带责任。
中搜会搜索引擎技术的各个环节监控作弊,同时重点监控排序剧变的网页,网站不分大小、不分领域、部分亲属远近都受到每周7*24小时的监控。除自动监控系统外,还有一个人工监控小组打击作弊。
Google
Google 没有明确给出处罚条款,但站主通过以下情况可以了解到网站是否受到处罚:
网站的 PageRank 变为“0”
Google 工具栏上的 PageRank 指示为“0”
网站在 Google 的外部链接数变为“0”
Google 工具栏上的 Backlinks 或在 Google 搜索框中键入“link:www.yourdomain.com”命令显示没有外部链。
网站排名骤降
以核心关键词搜索,原有的排名下降明显。不过这种情况有时候是算法更新的原因,与处罚无关。
网站在 Google 中消失
直接输入网址,找不到该网站。
被处罚的网站一般情况下如果解除作弊,还是可以获得“新生”,情况特别严重者除外。
附:向 Google 举报作弊网站:www.google.com/contact/spamreport.html (Googe 的反作
弊技术发展就是基于这类举报中出现的案例)
向百度投诉垃圾网页 http://www.baidu.com/search/spamreport.html

第七部分:网页级别(PageRank)
Google搜索引擎采用的核心软件称为 PageRank,这是由Google创始人开发出的一套用于网页评级的系统,是Google搜索排名算法中的一个组成部分,级别从1到10级,10级为满分, PR值越高说明该网页在搜索排名中的地位越重要,也就是说,在其他条件相同的情况下,PR值高的网站在Google搜索结果的排名中有优先权。网页级别由此成为Google所有网络搜索工具的基础。
                        网页级别概述
Google对网页级别的描述
“作为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大的链接结构。实质上,当从网页 A 链接到网页 B 时,Google 就认为“网页 A 投了网页 B 一票”。Google 根据网页的得票数评定其重要性。然而,除了考虑网页得票数(即链接)的纯数量之外,Google 还要分析投票的网页。“重要”的网页所投出的票就会有更高的权重,并且有助于提高其它网页的“重要性”。
重要的、高质量的网页会获得较高的网页级别。Google 在排列其搜索结果时,都会考虑每个网页的级别。当然,如果不能满足您的查询要求,网页级别再高对您来说也毫无意义。因此,Google 将网页级别与完善的文本匹配技术结合在一起,为您找到最重要、最有用的网页。Google 所关注的远不只是关键词在网页上出现的次数,它还对该网页的内容(以及该网页所链接的内容)进行全面检查,从而确定该网页是否满足您的查询要求。”
PR值算法原理
总体上基于下面2个前提:
1、一个网页被多次引用,则它可能是很重要的;一个网页虽然没有被多次引用,但是被重要的网页引用,则它也可能是很重要的;一个网页的重要性被平均的传递到它所引用的网页。
这种重要的网页称为权威(Authoritive)网页。
2、假定用户一开始随机的访问网页集合中的一个网页,然后跟随网页的链接向前浏览网页,不回退浏览,那么浏览下一个网页的概率就是被浏览网页的PageRank值。
                      影响 PR 值的因素
PR值体现为从0到10的11个数值,在Google的工具栏上以一条横向绿色柱状图显示,0级情况下呈白色。它是针对网页而不是网站,因此一个网站的首页和内页往往有着迥然不同的PR值。由于Google市场拓展进程的原因,中文网页的PR值整体上低于英文网页。对中文网站来说,拥有3级PR是基础, 4级PR算达标,5级PR可谓良好,而6、7级PR就算相当优秀的网站。当然,由于PR最直接的影响因素是来自链接,因此这种评级并不代表内容的级别水准,网站内容质量对PR的影响是间接的、长期的。根据PR值的算法原理,可知影响一个网站(首页)PR值的因素主要包括:
1、 网站的导入链接质量:
根据前文对高质量导入链接的分析,则获得高PR值需要获得来自以下网站的链接:
  加入搜索引擎分类目录
  与已经加入目录的网站交换链接
  获得来自 PR 值不低于 4 并与你的主题相关或互补的网站的链接
  你的链接出现在流量大、知名度高、频繁更新的重要网站上(如新闻源)
  与你交换链接的网站具有很少导出链接
  与内容质量高的网站链接(PR 值上升潜力大)
2、 导出链接数量:
根据PR计算原理,由于“一个网页的重要性被平均的传递到它所引用的网页”,因此反过来看,一个页面内过多的导出链接将潜在引起该页PR值的流失。但从内容的角度看,适当数量的与主题有关联的导出链接给搜索引擎带来良好的印象。因此,一个页面,尤其是首页的导出链接数量的把握,应该兼顾到PR值和关键词内容二者之间的平衡,即控制导出链接数量,以不超过10个为宜。
3、 搜索引擎收录一个网站的页面数量
在探讨SEO的时候,人们过多关注核心关键词排名以及首页的表现情况,却往往忽略了一个极其重要的问题:即搜索引擎对一个网站收录的页面数量。后者在SEO中也有着极其重要的意义。一个用核心关键词查询排名不佳的网站,可能由于被抓取大量网页而在用户使用其它关键词查询时,内页获得前三甲排名。由于用户搜索时使用的关键词具有分散性,使得这种情况往往给网站带来极大访问量。
正因为收录页面的

抱歉!评论已关闭.