自建搜索与做seo还是不同的,做seo要依赖于其它的搜索,而自己建一个搜索的话,排名就完全可以自己控制,但这个资源占用太多,一般的公司是做不起的,不过作为一个从事seo优化网站的人员,了解一下这个原理还是不错的。

现在开源的搜索代码也不少,但是满网络爬的还是不多见,大多数是垂直搜索。近日,继搜狗公开叫板百度之后,奇虎360、腾讯和优酷昨日均明确表示,将在搜索领域发力。加上一些小的搜索,垂直搜索的越来越多了。也有不少个人站长在尝试做google这样的站点。本博一时兴起,也跟进做了一个,但是在做的过程中,发现资源占用太大,根本进行不下去。

就拿关键字提取来说吧,测试时一个22M的文本,通过字典提取关键字,在VPS上花了我30多个小时。SCWS是一个开源免费的简易中文分词系统,PHP分词的上乘之选!确实可以解决中文的问题,加上Sphider。看起来很完美,可是建一个索引,就把我的资源占完了,说超过限制。

看来,自建搜索网站还真不是个人玩的起的。不过,了解一下这个原理还是有意思的。