在上一节的《6.2、相关排序--网页权重的计算》中我们知道了天网搜索引擎的网页权重计算公式为天网搜索引擎网页权重=网页中词项基本权重+链接权重+用户评价权重。那么 “链接权重”是如何计算的呢?我们在本节一起看看。

我们称每个网页的外链总数为网页的链接命中数LHN(link hit number),我们可以认为如果一个网页的外链很多,则这个网页是比较重要的

网页的链接命中数

1、但是按照上述的策略,对于新网页是非常不公平的。因此,对于新网页用LHN去评估是不合适的,但是我们既然已采用了LHN算法,就应该按照一定的算法对新网页给予LHN的补偿:

2、考虑补偿权值后,得到新的LHT值:

3、最后用WLmax表示对于系统所有网页的WL'(网页)最大值,对LHN值进行归一化,得到期望的链接权值:

小结

要注意的是,上一节的网页词项权重以及本节课所说的链接权重算法仅仅适用于天网搜索引擎,不代表其他搜索引擎的算法,因为仅仅通过以上的算法,很容易通过作弊来实现权重提升,主流的搜索引擎除了我们介绍的几个权值以外还会考虑许多其他的因素。

我们下一节来讲:《6.4、相关排序--用户评价权值的计算》