一种搜索结果的排序算法
谁,最不可能出于贪婪而作弊?谁,最可能如实提供网页内容?是政府网站,和教育网站。所以,在超链分析中,gov和edu网站通常被赋予较高的排名,来自gov和edu的超链也有更高的价值。
但是PageRank也带来了一些不请自来的错误排序因素:新站不如旧站,小站不如大站,专业站不如通俗站。一个新网站,一个小网站,一个专业网站,它的内容再好,因为不可能迅速得到大量的超链,所以无法得到合适的排名,即使它的内容是无与伦比的。而一个历史悠久的老网站、大网站、通俗网站,即使它已久不更新,或者内容远不如某些小网站,却可以获得很高的排名。
当超链分析刚出来时,SEO界一片悲观论调,认为这是无法作弊的,SEO业完蛋了(就象近期各搜索引擎纷纷收费,SEO业更觉得自己前景惨淡,其实虽然搜索引擎排名市场的大头要给搜索引擎们,但SEO还是有钱赚的,毕竟,只有劳动模范有下岗的可能,从来没听说骗子会失业的),但是,道高一尺魔高一丈,很快SEO们发现了对付超链分析的方法:你不是喜欢链接么,好,我就做大量的网站,准备大量的链接,哪个客户出钱,我所有的网页都给它一个链接。这种SEO方法被称为link firm。这种方法刚出现时还算有效,不过很快就不行了,因为一个网站是否有大量来自内容不相干网页的链接,或者一个不是搜索引擎的网站给出大量不相干的链接还不难判断。而每当发现一个link firm,那些使用了该link firm的网站就全部死翘翘。我在wmw的论坛上看过一个家伙的帖子,说他的网站被封了,但他觉得自己很干净,没有做spam,所以主动去问Google封他网站的原因,原来仅仅是因为他用了一个link firm,真是可怜
一种搜索结果的排序算法,如果更多的是基于概念、主题、基于网页内容的质量,而不是网络上互相链来链去的超链的重要性,那么搜索结果的相关性在本质上会更好。
只是,让计算机学会理解和评价网页内容吗?好像还是很遥远的事情;花大量的人力一个个网页评估么?这肯定是亏本的商业行为,只有靠志愿者。ODP庶几近之,但也只能点击,用关键字搜索时还是无法跟超链分析的结果相比。


快速导航