搜索算法是做seo优化必然会碰到的问题,在优化过程中,不懂搜索的算法,那就只能算个操作员,其实说到算法,在数学中是非常流行的,各种建模的算法一大堆,但是对于seo实战而言,这里只是谈谈搜索中的算法,一个好的算法,能够给用户带来相当好的感受。而不好的算法不仅浪费搜索的开销,也使搜索者得不到好的体验。

因为工作关系,现在没有太多时间去讨论,在这里只是简单的对搜索的算法做个记录,其实不同的搜索有不同的算法,这个算法是不能公开的,但是可以通过统计,对过模拟去了解。了解算法后,对操作seo那是相当的方便,其实很多现在实战的方面都是建立在算法的基础上的。

常见的算法有PageRank算法,PageRank算法基于下面2个前提:

前提1:一个网页被多次引用,则它可能是很重要的;一个网页虽然没有被多次引用,但是被重要的网页引用,则它也可能是很重要的;一个网页的重要性被平均的传递到它所引用的网页。这种重要的网页称为权威(Authoritive)网页。

前提2:假定用户一开始随机的访问网页集合中的一个网页,以后跟随网页的向外链接向前浏览网页,不回退浏览,浏览下一个网页的概率就是被浏览网页的PageRank值。

这是google的专利,从这个算法中,大家可以看到外链的重要性。

HITS算法

HITS(Hyperlink-Induced Topic Search)算法是利用Hub/Authority方法的搜索方法,算法如下:将查询q提交给传统的基于关键字匹配的搜索引擎.搜索引擎返回很多网页,从中取前n个网页作为根集(root set),用S表示。S满足如下3个条件:

1.S中网页数量相对较小
2.S中网页大多数是与查询q相关的网页
3.S中网页包含较多的权威网页。

通过向S中加入被S引用的网页和引用S的网页将S扩展成一个更大的集合T.

从这个算法中大家可以看到相关性的重要。当然还有很多算法,大家可以通过分析得到相应的操作方法。