1. 论坛系统升级为Xenforo,欢迎大家测试!
    排除公告

伪静态和纯静态的效果对比

本帖由 temporary022011-01-27 发布。版面名称:SEO 专区

  1. temporary02

    temporary02 New Member

    注册:
    2009-06-22
    帖子:
    57
    赞:
    0
    伪静态和纯静态的效果对比

    一. 关于伪静态的用处有些用户觉得,伪静态和真静态实际被收录量会相差很大,其实不然,从你个人角度,你去判断一下一个帖子到底是真静态还是伪静态?估计很难看得出,因为所谓静态的意思,就是地址中不带问号,不带问号的就是静态,管他是真的还是伪的?搜索引擎看得出吗?

    所以说,其实不论是真的还是伪的,其实对于搜索引擎来说都是一样的,搜索引擎没有说,你这个是伪的,我不收录你.揪根掘底的来说,为什么搜索引擎会不收录带问号的网址?因为搜索引擎怕由于问号而进入死循环(以前动网就有这样一个漏洞,蜘蛛进去出不来了),所以很多时候带问号的地址是不会进去的,伪静态对于搜索引擎来说,其实就是静态,因为地址中没有带问号,所以没有真静态比伪静态收录得多的说法.

    二. 为什么选择伪静态有很多用户说:真静态不好吗?为什么不用真静态?访问起来不是更快吗?负载不是更好吗?等等等等...

    在这里,其实只用一个问题来回答:为什么选择MYSQL.很多用户大概不明白为什么那么多大型论坛都选择了MYSQL数据库作为储存机制,大概大部分都是想:"因为DZ用了MYSQL,所以就是MYSQL".其实不然,试想DZ为什么会在那么多论坛程序并存的日子生存下来并笑傲江湖,很大原因是因为DZ用了MYSQL.试想如果大C当年改的程序是一个文本论坛,那还会有DZ的今天吗?或者从另一个角度问,为什么那么多大型网站都选择了MYSQL而不是文本作为储存机制?

    所谓文本论坛,实际就跟真静态的说法差不多了,将数据储存在空间上面,大量读写硬盘,等等...为什么这种写法会被淘汰呢?我相信答案不会是老师所说的:"discuz.net 目前有 2129867 篇帖子,存储成html的话大约是 20799 M,也就是 20G左右。这当中还不计算由于磁盘存储机制造成的空间浪费(100个1k 的文件占用的空间可能会是200K)。"这种说法从我个人观点来看,这个理由不能给予用户不使用真静态充分的理由.然而,另一个理由却是值得我们注意思考的,也是为什么绝大多数站都不选择生成静态:"删除、更新这些html内容会导致大量的磁盘io操作以及大量的磁盘碎片."正如上面这个说法,在实际当中确实会导致大量的磁盘I/O操作(input,output),大量进行I/O操作带来的后果可想而知,会产生大量的磁盘碎片甚至会导致硬盘出现坏道.所以对于生成静态而言,还不如去用文本论坛,可以更好的解决你们的需求.当然,如果大家记忆力好的话,应该可以记得PW4的时候PW论坛不能访问很长一段时间,后来恢复到一段时间前的数据,官方的说法是被人攻击而导致硬盘损坏,其实这种说法是比较不可信的,相对于是被攻击导致硬盘损坏还是大量I/O操作而产生的后果,我个人更倾向于后者.当然,如果大家比较关注5d6d的话,应该知道前几天有一天时间5d6d无法访问,根据非官方消息是因为硬盘坏了,而损坏的原因我想当然是因为大量用户大量进行I/O操作了,试想,我们一个论坛,进行磁盘I/O操作的仅为管理员进行更新缓存时进行的,而5d6d每一个会员就是一个管理员,试想下对磁盘是多大的考验?所以我并不奇怪5d6d的硬盘坏了.当然,也许在读这篇文章的很多朋友都有使用过BT,也听说过BT对硬盘很伤,不能开多,而所谓伤害,和这里指的都是同一样东西,大量I/O导致磁盘出现碎片甚至出现磁盘坏道.这里都是说些很实际的例子来说明问题了.


    三. 关于伪静态的坏处当然犹如一篇文章的作者所说的"如果流量稍大一些使用伪静态就出现CPU使用超负荷,我的同时在线300多人就挂了,而不使用伪静态的时候同时在线超500人都不挂,我的ISS数是1000"确实是这样的,由于伪静态是用正则判断而不是真实地址,分辨到底显示哪个页面的责任也由直接指定转由CPU来判断了,所以CPU占有量的上升,确实是伪静态最大的弊病.


    四.我们该如何做我们来总结一下.

    1.使用真静态和假静态对搜索引擎来说没有什么区别
    2.使用真静态可能将导致硬盘损坏并将影响论坛性能
    3.使用伪静态将占用一定量的CPU占有率,大量使用将导致CPU超负荷
    4.最重要的一点,我们要静态是为了SEO所以.
    a.使用真静态的方法可以直接排除了,因为无论怎么生成,对硬盘来说都是很伤的.
    b.既然真伪静态的效果一样,我们就可以选择伪静态了.
    c.但是伪静态大量使用会照成CPU超负荷.
    d.所以我们只要不大量使用就可以了.
    5.既然静态只是给SEO看的,我们只需要伪静态给SEO就行了,不需要给用户使用.

    6.所以我们只要在专门提供给SEO爬的Archiver中使用伪静态就可以了.
    现在站长都在做SEO。目前几乎所有流行的CMS也都提供生成静态页的功能。
    生成html静态页的好处有5点:
    是减少服务器对数据响应的负荷
    是加载不用调动数据库,响应速度快。
    是便于化化引擎。
    从安全角度讲,静态网页不宜遭到黑客攻击。
    从网站稳定性来讲,如果程序、数据库出了问题,会直接影响网站的访问,而静态网页就避免了如此情况,不会因为程序等,而损失网站数据,影响正常打开,损失用户体验,影响网站信任度。
    缺点有三点:
    是维护不方便,每次都要手动生成。
    空间占用比较大(要多占用将近一倍的空间)。
    是生成的文件多了,服务器对html文件的响应负担也较重。

    本文主要讨论url重写实现网站伪静态的利弊。
    很多站长都喜欢生成静态页,我已经几年不这么做了。一直是用URL重写技术替代生成静态页。微软的官方网站向来都是用url重写来做,过去我是追随微软,认为他们用的技术一定是有道理的。
    伪静态(url重写)就是截取传入的Web 请求并自动将请求重定向到其他 URL 的过程,其目的主要是通过重写URL的方法实现去掉动态网页的参数URL,从而更加有利于搜索引擎的收录。

    url重写的优点在于:

    缩短url,隐藏实际路径提高安全性;
    易于用户记忆和键入
    可以方便的实现对化化引擎的优化,易于被搜索引擎收录。
    占空间比较小,不会像静态化一样,要多占用将近一倍的空间
    维护方便。首页每天都自动变化,不用维护。(网站首页一般都有热点排行之类的,你可以设为,24小时排行,一周排行,再加上最新文章,最新点评等。这样首页天天是有变化的。)

    而有些人说,伪静态(url重写)会提高服务器的响应,这完全错误的,他不仅不会提高,反而会占用一定量的CPU占有率,降低服务器的响应时间。

    另:网站实现伪静态真的有哪么好吗?

    我们分析一下:早期的时候,因为Web应用程序最大的特点之一就是无状态,当一个页面跳转到另一个页面时,那么这个页面上的所有参数都将抛弃,所以动态页面一般利用url地址来保存其参数,这样,搜索引擎在录取该页面时,可能会因为问号而进入死循环(以前动网就有这样一个漏洞,蜘蛛进去出不来了),所以很多时候带问号的地址是不会进去的,这样便降低了页面的收录效率。

    由于这个原因,我们就选用不带问号的url不是可以更好的让搜索引擎收录自己的网页?的确。静态网页的url正好不带问号,所以我们要伪造静态,目的就是为了SEO,提高网站的收录效率。

    这都是04年以前的事了,搜索引擎的算法早已改进,蜘蛛的爬行已经没有这个限制,也不再会因为URL中?传过来的参数出现问题。

    站长也反应:生成静态不能即时动态更新,很麻烦的。我的网站是5月份建的,前几天把它生成真静态测试了一下差不多要30G,因为新站天天要更新静态麻烦,全部把它删了用动态6G,更新又方便,现在仅把它首页生成静态,好像打开静态也只快了那么一丁点,差不多。

    判断网站是伪静态还是真静态
    SEO文章看多了,经常能听到静态、伪静态这类的词语,那什么样的网页是静态的,什么样的网页是伪静态的呢?
    IE5浏览器以上:
    打 开你想判断的网站后,再在网址框中输入javascript:alert(document.lastModified)
    IE5以上… ,此方法可以判断一个网页的最后更新时间,如果这个时间与现在的时间相同,说明是伪静态的,反之为静态的。

    火狐浏览器下:
    先用火狐打开一个网页如:http://bbs.XXXX.com/forum-13-1.html 等网页完全打开后进入FireFox的控制台。”工具”-“错误控制台”快捷键:shift+ctrl+J 然后在控制台里面输入:alert(document.lastModified); 查看最后修改时间并记录。
    接下来关闭控制台,重新刷新网页,再用相同的方法在控制台里输入查询代码,再查看文件的最后修改时间,连续几次如果发现时间不同则可以判断它是伪静态的了。

    相关知识:关于伪静态和真静态网页用处和利弊对比

    1.关于伪静态的用处
    有些用户觉得,伪静态和真静态实际被收录量会相差很大,其实不然,从你个人角度,你去判断一下一个帖子到底是真静态还是伪静态?
    估计很难看得出,因为所谓静态的意思,就是地址中不带问号,不带问号的就是静态,管他是真静态的还是伪静态的?搜索引擎看得出吗?
    所以说,其实不论是真的还是伪静态的,其实对于搜索引擎来说都是一样的,搜索引擎没有说,你这个是伪静态的,我不收录你.
    揪根掘底的来说,为什么搜索引擎会不收录带问号的网址?因为搜索引擎怕由于问号而进入死循环(以前动网就有这样一个漏洞,蜘蛛进 去出不来了),所以很多时候带问号的地址是不会进去的,伪静态对于搜索引擎来说,其实就是静态,因为地址中没有带问号,所以没有真静态比伪静态收录得多的 说法.

    2.为什么选择伪静态
    有很多用户说:
    真静态不好吗?
    为什么不用真静态?
    访问起来不是更快吗?
    负载不是更好 吗?
    等等等等…
    “删除、更新这些html内容会导致大量的磁盘io操作以及大量的磁盘碎片.”
    在实际当中确实会导致大量的磁盘I/O操作(input,output),大量进行I/O操作带来的后果可想而知,会产生大量的 磁盘碎片甚至会导致硬盘出现坏道.

    所以对于生成静态而言,还不如去用文本论坛,可以更好的解决你们的需求.
    当然,如果大家记忆力好的话,应该可 以记得PW4的时候PW论坛不能访问很长一段时间,后来恢复到一段时间前的数据,官方的说法是被人攻击而导致硬盘损坏,其实这种说法是比较不可信的,相对 于是被攻击导致硬盘损坏还是大量I/O操作而产生的后果,我个人更倾向于后者.

    当然,如果大家比较关注5d6d的话,应该知道前几天有一天时间5d6d无法访问,根据非官方消息是因为硬盘坏了,而损坏的原因我想当然是因为大量 用户大量进行I/O操作了,试想,我们一个论坛,进行磁盘I/O操作的仅为管理员进行更新缓存时进行的,而5d6d每一个会员就是一个管理员,试想下对磁 盘是多大的考验?所以我并不奇怪5d6d的硬盘坏了.
    当然,也许在读这篇文章的很多朋友都有使用过BT,也听说过BT对硬盘很伤,不能开多,而所谓伤害,和这里指的都是同一样东西,大量I/O导致磁盘 出现碎片甚至出现磁盘坏道.
    这里都是说些很实际的例子来说明问题了.

    3.关于伪静态的坏处
    当然犹如一篇文章的作者所说的
    “如果流量稍大一些使用伪静态就出现CPU使用超负荷,我的同时在线300多人就挂了,而不使用伪静态的时候同时在线超500人都不挂,我的ISS 数是1000″
    确实是这样的,由于伪静态是用正则判断而不是真实地址,分辨到底显示哪个页面的责任也由直接指定转由CPU来判断了,所以CPU占有量的上升,确实 是伪静态最大的弊病.

    4.我们该如何做?
    我们来总结一下.
    1.使用真静态和假静态对SEO来说没有什么区别
    2.使用真静态可能将导致硬盘损坏并将影响论坛性能
    3. 使用伪静态将占用一定量的CPU占有率,大量使用将导致CPU超负荷
    4.最重要的一点,我们要静态是为了SEO
    所以.
    1.使用真静态的方法可以直接排除了,因为无论怎么生成,对硬盘来说都是很伤的.
    2.既然真伪静态的效果一样,我们就可以选择伪静态了.
    3.但是伪静态大量使用会照成CPU超负荷.
    4.所以我们只要不大量使用就可以了.
    5.既然静态只是给SEO看的, 我们只需要伪静态给SEO就行了,不需要给用户使用.
    6.所以我们只要在专门提供给SEO爬的Archiver中使用伪静态就可以了.

    一.动态网址的利弊分析
    Google能够很好的处理动态网址并顺利抓取;
    Google能够抓取参数超过3个的动态网址,不过,为了避免URL太长应尽量减少参数。
    动态网址有其一定的优势,以news.php?lang=cn&class=1&id=2 为例,网址中的参数准确的告诉Google,此URL内容语言为cn、隶属于分类1、内容ID为2,更便于Google对内容的识别处理。
    动态网址应尽量精简,特别是会话标识(sid)和查询(query)参数,容易造成大量相同页面。

    二.静态网址的利弊分析
    静态网址具有的绝对优势是其明晰,/product/nokia/n95.html和/about.html可以很容易被理解,从而在搜索结果中可能点击量相对较高。
    静态网址未必就是最好的网址形式,上述动态网址中说到,动态网址能够告诉Google一些可以识别的参数,而静态网址如果文档布置不够恰当(如:过于扁平化,将HTML文档全放在根目录下)及其他因素,反而不如动态网址为Google提供的参考信息丰富。

    三.伪静态网址的利弊分析
    伪静态网址不能让动态网址“静态化”,伪静态仅仅是对动态网址的一个重写,Google不会认为伪静态就是HTML文档。
    伪静态可取,但应把重心放在去除冗余参数、规范URL、尽可能的避免重复页上。
    伪静态有很大潜在危险,最好在对网站系统、网站结构、内容分布、参数意义熟悉的情况下使用。

    在写伪静态规则时,应保留有价值的参数,不要将有价值的参数全部精简掉,如前面例子中的 news.php?lang=cn&class=1&id=2 最好重写为 news-cn-class1-id2.html,而不是过份精简重写为 news-2.html。

    伪静态中一定不能包含会话标识(sid)和查询(query)参数,/product.asp?sid=98971298178906& id=1234 这样的动态网址,其中的sid本来Google能够识别并屏蔽,但如果重写为 /product/98971298178906/1234,Google不但无法识别,还在整站中造成无限重复页面(每个会话都会产生一个新的会话 ID)。






    ................
     
  2. temporary02

    temporary02 New Member

    注册:
    2009-06-22
    帖子:
    57
    赞:
    0
    我自己也来顶一下 ……
     
  3. 精英天天在

    精英天天在 New Member

    注册:
    2011-01-27
    帖子:
    10
    赞:
    0
    好长,楼主辛苦了
     
  4. temporary02

    temporary02 New Member

    注册:
    2009-06-22
    帖子:
    57
    赞:
    0
    再来顶一下喽 ……
     
  5. temporary02

    temporary02 New Member

    注册:
    2009-06-22
    帖子:
    57
    赞:
    0
    轻轻的我顶一下,轻轻的我飘过 ……
     
  6. yucedashi

    yucedashi www.yuceshi.com

    注册:
    2011-01-17
    帖子:
    205
    赞:
    0
    拜读学习,谢谢!
     
  7. temporary02

    temporary02 New Member

    注册:
    2009-06-22
    帖子:
    57
    赞:
    0
    今天最后一次顶贴啦 ……
     
  8. temporary02

    temporary02 New Member

    注册:
    2009-06-22
    帖子:
    57
    赞:
    0
    先顶一下,待会儿再发个好帖子 ……