导航类网站和一般的网站所适用的算法是不同的,一般类型的网站适用的算法基础是PageRank算法,也就是链接投票算法。他几乎是现代搜索引擎算法的基础,也是外链为什么有效的根本依据。导航类网站则适用于另外的一个基础算法HITS算法。HITS也是搜索引擎的基础算法之一,是所有导航类网站排名的算法依据。这两种算法几乎组成了搜索引擎的算法基础,其他的算法都是在这两种算法的基础上延伸出来的,如集合了两个算法优势的SALSA算法、主题敏感PageRank等。今天聊小米网赚导航网站,我们来说说HITS算法。
一、HITS算法的解释
HITS算法将页面分类两类,一种是HUB页面;另一种是Authority页面。
Authority页面指的是某一个领域或者某一个话题的高质量网页或者网站。比如搜索引擎领域的谷歌、百度;比如视频领域优酷、土豆、爱奇艺;新闻门户领域的腾讯、新浪、网易等网站网页,这些网站都属于这些领域的高质量网站。
HUB页面是指很多指向这些Authority高质量页面的链接网页,比如我们经常用的hao123、360导航、2340导航等,就是典型HUB页面。
HITS算法的目的就是为用户在海量的网页中,找出与用户搜索主题相关的高质量Authority页面,HITS算法认为,这样的高质量也Authority更能满足用户需求。
二、Authority页面和HUB页面之间的关系
HITS算法是建立在两个假设之上的:
假设1:一个好的Authority页面会被很多好的HUB页面指向;
假设2:一个好的HUB页面会指向很多好的Authority;
假设1说明了什么是好的Authority页面:也就是说被很多好的HUB页面所指向的页面就就好的Authority页面。这里面有两个修饰语“很多”、“好的”,也就是说指向Authority页面的HUB页面一定要是非常好的页面,也就是高质量的HUB页面;另外指向Authority页面的HUB页面越多越好。这综合了指向Authority页面的质量和数量因素。
假设2,说明了什么是好的HUB页面:也就是说指向很多好的Authority页面。和Authority页面一样,HUB页面也要指向“很多”“好的”Authority页面,才算是好的HUB页面。
很多朋友看着都迷糊了,其实一点也不乱,Authority和Hub页面是一种增强关系。以小米网赚导航为例,因为小米网赚导航有大量指向优质Authority页面链接,所以在这方面得分就较高;而那些Authority页面被好多类似于小米网赚导航这样的页面所指向,所以更加优质。两者相辅相成,相互促进!另外,HITS还有另外一层意思,如果一个Authority质量越高,那么指向它的HUB页面质量就会得到提升;如果一个HUB页面质量越高,那么他指向的Autiority页面的质量也会得到提升。两者就是通过这样的增强关系相互迭代计算的,由此也可以找出哪些页面是高质量的HUB页面和Authority页面。
三、HITS算法的工作步骤
HITS算法在接受到用户的搜索请求后,检索出一组与用户请求高度相关的网站,这组网站被成为“根集”。然后在根集的基础上,HITS对网页集合开始扩充。扩充的原则就是将所有与根集网站有链接关系的网站都扩充进来。不论是指向根集的网站,还是根集所指向的网站全部扩充进网页集合。
然后赋予网页集合内所有网站两个属性:HUB属性和Authority属性。之后利用上述两个假设中的增强关系,对每个网站的两个属性进行多轮迭代计算。每一轮计算完成后更新网站的HUB值和Authority值,直到权重稳定不再变化为止。
当系统进入稳定状态,网页集合内的网站两个属性都没有明显变化后。将网站根据Authority和HUB值由高到低进行排序,取权值较高的若干页进行输出。导航网站的HUB值一般较高,而Authority值相对较低,所以在查询一般性关键词的时候基本无排名,而查询需要由HUB值由高到低排列的时候,则大部分输出的都是导航站。这就是HITS算法的工作步骤。
四、HITS算法在实际中的应用
HITS算法在搜索引擎中应用非常广泛,只要是涉及导航类排名的搜索引擎基本都沿用了HITS算法的思路。所以在实际应用上,我们可以利用HITS算法的工作原理来对我们的网站进行优化。
1、导航站。依据HITS算法原理,好的导航站(HUB)要指向很多好的Authority页面。那对于网赚类导航来说,只需要找出这些“好的”Authority页面即可。如何找呢?既然搜索引擎是按照Authority属性由高到低排列的,那我们搜索某个关键词,排名高的肯定也是Authority值高的。我们搜索“网赚”,排名在前几页的网站,Authority值一定不会低,也基本满足“好”Authority页面的定义。其他类型的导航站也同样原理。
2、内容站。这类网站跟导航站相反,依据HITS算法原理,好的内容站(Authority页面)需要由很多好的HUB页面所指向。那我们就搜索该类型的导航站,一个个去申请,将自己的网站添加进导航目录,这样内容站的权重自然得到提升。如网赚博客或者网赚论坛可以搜索“网赚导航”,将自己的网站申请加入所有的网赚导航网中。
3、低质量或者垃圾的内容站不会给导航站增加权重,反而会分走导航站的权重。如果你的网站是采集站或者内容混乱质量度低的网站,那指向你的导航站就不会得到什么好处,反而浪费自身权重。
4、可以自己建一个导航站指向自己网站增加内容站权重。可以搜集一些高质量的Authority页面建立一个导航站,然后在这些高质量的Authority页面中加入自己的网站,达到增加权重的目的。但由于高质量的Authority是由“很多”“好的”HUB页面所指向,如果仅仅是一个的话,效果也不会太明显。不过量的问题都不难解决,多建几个就是!
5、尽量不要将导航站上直接挂上Authority页面链接,这样会增加首页的跳出率。而因为之前的淘宝客都是用的首页挂图片直接跳转到淘宝的模式,搜索引擎K了很多网站。所以现在的做法一般是由首页跳转到内容页,再由内容页跳出。我们经常用的大网站如hao123其实也是这样的,不过它的跳转我们没察觉到而已。
总结:今天是以小米网赚导航为例,聊了聊导航网站所运用的HITS算法以及如何利用HITS算法增加网站权重。当然小米网赚导航排名好也不完全是因为HITS算法。(如果全是HITS算法,那完全可以复制一个小米网赚导航,同样可以有排名。)搜索引擎是由很多个算法共同作用的,即使是导航网站也需要做友情链接,也需要对网站代码做优化,也需要发外链。所以小米网赚导航之所以这么好,是因为阿健同学的优化思想暗含了搜素引擎算法原理,然后不懈努力的结果。