1. 论坛系统升级为Xenforo,欢迎大家测试!
    排除公告

PageRank研究的一些结论

本帖由 qingqing37212011-11-09 发布。版面名称:软文发布区

  1. qingqing3721

    qingqing3721 New Member

    注册:
    2011-02-04
    帖子:
    394
    赞:
    0
    结合PageRank的算法原理以及实证分析,利用PageRank判别网页的质量具有一定的可靠性和可行性,这方面已经得到行业的认可,但在评价中必须思索以下几个方面的问题:


    1.对评价对象抽取样本停止实验,检验PageRank值对评价该主题网页质量的可靠性和可行性,如依据SEO的相关网站的PageRank值与网页的质量未见相关性。对于该主题,不能轻易使用PageRank来判别网页的质量。


    2.不同语言的网页的PageRank值不具有可比性,经过我们的实验显示,中文网页的PageRank值远低于英文网页的PageRank,也就是说,同等质量的内容,中文网页的PageRank远低于英文网页。


    3.PageRank值不适用于评价中文网页。从实验中可以看到,中文网页的PageRank值绝大少数仍为0。


    中文网页PageRank值得分低,至少有3个方面的原因:一是语言的影响使网页在全球范围内传达才能弱于英文网页。第二,与中文网页的链轿扌为有关。在以往的实验中,发现PageRank为零的网页所在的网域的PageRank并不低,很多高达5或6,也就是说,中文网页的链接通常更多的是链接到网站的主页,而不是链接到资源所在的网页,这使一些网页内容很好的网站不一定获得更多的威望链接,影响其PageRank值。第三,从实证一和实证二中发现,对于以PageRank为关键词检索到的网页,中文网页的内容90%以下去自于博客(blog)网站或论坛,一些被评价为好的网页的内容多来自对国外文章的编译,而其他少量的网页内容仅几句话。英文网页的内容有些来自于学术机构(以edu、ac为网域)或专家的团体网站。


    4.PageRank的算法在评价学术网页时,有其本身的缺陷:第一,PageRank的算法未思索到网页的日期问题。从实证中发现,有的网页质量较高,但PageRank值却很低,进一步观察发现这些网页的日期很新。分析PageRank算法,也可以发现PageRank算法未思索网页的新旧问题,一个刚发布的优质网页,能够由于没有多少内部链接而被PageRank视为低等级,相反,一个旧的质量较普通的网页,能够由于工夫累积,形成内部链接相对较多,而排名居前。第二,PageRank算法未思索域的价值,one-t凡兔在学术网页的评价中,这显然是一个缺陷。由于网络中存在少量的广告,因此,来自域edu、ac的网页通常比来自com、net的网页更具有学术性。对于这类网页只要人工增加权重以弥补上述缺陷。


    由此可见,只要在对PageRank的评价作用、适用范围有清楚的掌握时,才能使用这一目的停止网页质量评价。


    网站的内容质量取决于构成网站的诸网页的内容质量,检索到网站关于某主题的相关网页后,将相关网页的PageRank值之和作为网站的PageRank值,这样,PageRank就从评价网页的目的进而成为评价网站的目的。
     
  2. asdqwws

    asdqwws New Member

    注册:
    2011-11-07
    帖子:
    43
    赞:
    0
    对评价对象抽取样本停止实验,检验PageRank值对评价该主题网页质量的可靠性和可行性,如依据SEO的相关网站的PageRank值与网页的质量未见相关性。
     
  3. lixi88

    lixi88 New Member

    注册:
    2011-10-22
    帖子:
    61
    赞:
    0
    好样的.............