网页等级(PageRank)是Google对Web页面质量的一个评价标准.在与查询条件相关度一致的情况下,谁的PR值高,谁的结果的排名就靠前.PageRank的算法是基于链接引用的次数:
1.如果一个页面被多次引用,那么这个页面很可能是重要的;
2.如果一个页面尽管没有被多次引用,但却被一个重要的页面引用,那么这个页面也 很可能是重要的;
3.一个页面的重要性被均分且传递到它所引用的页面.
实际中,当我们浏览网页时,会发现大多数页面的PR值都不会达到10,国内几大门户网站(网易,搜狐,新浪,中华)的PR值一律为7.根据Google的官方资料,PageRank 7 Club中,中文网页屈指可数,能满足我们搜索需求的网页中,大部分的PR很小,有很大一部分比例为0!所以,这大大影响着我们搜索的效率与准确度.
因此,我认为,Web页面的PR值不能一概而论.互联网发展到今天,离其本质要求-完全开放,共享还相差很远,很多站点无论在意识上,还是在操作上,多少摆脱不了"酒香不怕巷子深"的束缚,加之对技术的依赖性,其价值还完全尚未发掘出来.照这个意义上,并不是说Google的PR错了,而是太前卫了,来得太早了.
但我觉得解决的出路还是有的,关键在于打破这种统一的制式.首先,不妨借助地域划分一下,即,试着解决这样的问题:国内网页中PR值为10的网页(网站)是哪些?我要了解日本这个国家,日本所有PR为10的网页是否能够提供给我足够而且有价值的信息?如果回答是肯定的,这些信息必然包括从人文到科学,从艺术到宗教等各个领域的信息.这正好也构成了另一个划分的方式.当然,我们的思考的方式也可以反过来.这样,就形成了地域和领域相互交叉的,立体的网页等级评价机制(Dimensionized PageRank System),也只有这样,PageRank的实际效益才能充分凸现出来。
|