发现更大的SEO世界
 找回密码
 注册
搜索
»首页»SEO培训 SEO论坛 SEO交流 帖子
发新帖
lx2st,哦    

首页排名能力超过分类页么?


旧文可以发么?
——————————
很多人认为网站的首页排名能力超过分类页。这一点从很多公司做SEO报价,或者自己做站预估排名难度时,以前10名或者前几页有多少网站首页来做参考可以看出来。如果前10名都是网站的首页,他们就判断这个词很难做。
这样的想法是没有根据的——一个网站的首页排在另一个网站分类页前面,自然是有原因的——但是没人说过这个原因,这个结论就这样流传开了——也许是某个牛B的大佬在某次牛B的培训上“透露”了这个牛B的经验。不过,一个结论没有根据,就值得怀疑。所以,下面是我的怀疑及分析。
抛开剂量谈食物毒性是扯淡的,抛开搜索词谈排名也没有意义。所以先确定一个搜索词“iphone”吧,下面都以百度搜索“iphone”的结果进行分析。
百度搜索“iphone”排名:

这个结果保留了很多开挂的网站,但毕竟只是示例分析,所以就不声讨他们了。
这15个结果中,网站首页有5个,分类页+专题页有9个,还有1个内容页。结果中有4个网站首页排在后半部分,似乎已经说明了网站首页排名能力并不比分类页强。但现在下这个结论,我也成了经验主义的“肤浅”的人了,所以我会继续分析。对了,在这里推荐下果壳的一篇文章《规律什么的都是骗人的》,目前SEO里面太多的经验主义,太多通过“规律”得出的结论。其实很多所谓的经验都经不起推敲。
那么,先从内容开始吧。
排名前列的结果,是搜索引擎认为的,在其收录的页面中,这些页面的内容是和搜索词最相关的。同样的,每一个有排名的页面的内容,也是这个网站中,与搜索词最相关的。
似乎有点绕口。这么说吧,排第一的“iphone.tgbus.com”这个页面,是“iphone.tgbus.com”这个网站中和iphone最相关的;排第三的“iphone_百度百科”这个页面,是 “百度百科”中和iphone最相关的。
判断内容相关性,有很多算法,tf-idf,余弦相似,最大熵等等,这里就用最简单直观的的tf-idf来判断吧。
下面是用55la的关键词密度检测工具和百度site结果估算的TF-IDF。
Tf-idf估算结果:

这是个严重估算的结果,严重到很多结果是负的(site结果让人吐血),这还好,最严重的是排名第一的是最小的那个…
其实算完这15个页面的tf-idf我就后悔了,这样的结果要我怎么分析才能把大家忽悠住嘛 T_T…费了半天时间弄的数据也不能浪费了,硬头皮上吧。
如果不管网站的主题和权重,百度经验的专题页面是相关性最好的,应该排在第一的位置,而iphone.tgbus是15个结果里最不相关的,应该排在最后——单纯考虑页面相关似乎是这样,那,什么地方出了问题呢?
你不会真的以为我会傻到把单个网站页面的tf-idf当作网站之间比较的标准吧?嗯,我还没那么傻。
这个道理就像,从普通高中的足球队里挑个最牛B的前锋出来,然后从足球学校里挑个最牛B的前锋出来,这两个前锋在各自学校里的“前锋tf-idf”都是最高的,但是,比赛结果是普通高中的前锋赢了..囧..这种情况很特殊,不过也不是没可能,但我们并不能说普通高中的足球比足球学校牛B。
所以,抛开网站主题谈页面的tf-idf是不公平的。再举个例子吧,一个网站有一万个页面,但只有一个页面提到了iphone,这个页面在网站的iphone的idf是就是4,这个值相当高,但这并不能说明这个页面和iphone很相关,很有竞争力。
好,现在比较下这15个网站的tf-idf吧。
让我们把整个网络当成一个大的网站,上面15个网站包括iphone的“site结果/网站页面数量”当成“网站关键词密度”,百度site的上限1亿为整个网络的页面数量,估算下网站的tf-idf:

这次估算的结果我是比较满意的(偷笑ing)。蓝色的区域表示计算网站的关键词密度,网络全部页面为1亿。
现在百度经验的tf-idf只有0.25了,而iphone.tgbus的tf-idf则是16.87,虽然不是最高的,不过,可以说明在iphone这个词上,iphone.tgbus远比百度经验相关(这不是明摆着的事实么,我竟然扯了那么多….嗯,原谅这个开挂的网站吧)
结论就是,对于某个关键词,一个页面在网站中的相关性很高(相关页面太少了),但如果网站在整个网络中的相关性低,综合相关性就会降低,这个页面排名也会靠后;一个页面在网站中的相关性不是很高(相关页面太多了),但网站在整个网络中的相关性很高,综合相关性还会很高,排名很好。
足球学校最牛B的前锋,正常情况下还是比普通高中最牛B的前锋牛B的,网站也一样——原谅我这么半天就是为了说明一句废话吧。
所以,以这15个网站来看,从内容角度考虑,首页和分类页面在排名能力的PK上,首页胜。不过胜出的原因是首页的内容和搜索词更相关,而不是因为它是首页。
再从链接上看看吧。
15名页面链接统计:

其实这个统计并不能说明链接是如何影响首页、分类页面的排名能力的。毕竟这15个页面都是很不错的页面,不然不会在一个百度指数10000+的搜索词serp中排前15名。
好吧,先把你的砖头收起来,我真不是来搞笑的,我哪有能力去分析这15个网站的链接和iphone的相关性呢?我还干点力所能及的事情吧。
我们知道搜索引擎有很多链接分析的算法,从最熟悉的PageRank,到各种游走模型;从相关性判断,到垃圾链接分析,林林总总,数不胜数。我们不需要了解那么多的算法,毕竟不是算法工程师,我们只要记住基本的就好了。
放在本文的环境下,就是判断相关性链接分析算法的基本原则。
一句话概括这个原则就是,对的页面推荐对的页面。额,说这个话题好像有点跑题了,而且猫叔在《什么是“用户或者其他网站的真心推荐”的外链》里说的很明白了,所以还是回到主题,首页和分类页面的排名能力上,嗯,和这15个网站的关系不大了。
在链接分析算法里,发出大量链接的页面,和大量链接指向的页面,都有很高的权威性(当然不是垃圾链接啦亲!),被称为链接权威页,内容权威页。
一般来说,内容权威页,都是一个网站的内页,讲某个具体话题的。当然百度百科的内容页属于变态,明明一个内容页也导出大量链接(喂喂,百度百科排名好,除了开挂,真的不仅仅是因为html标准用的好)。
网站的首页、分类页,则是发出大量的链接指向各个页面,是网站的大枢纽和小枢纽,所以一般首页、分类页排名比内容页好(喂喂,真的不是分类页比内页权重高哇)。
那么,作为枢纽的首页和分类页,相互之间的排名能力怎么区分呢?
还是前面说的,抛开关键词谈排名是扯淡,抛开关键词谈链接也很扯淡。因为,主题偏移。额,类似主题敏感PageRank吧。
一个只谈论iphone的页面,它发出的链接主题是和iphone相关的。这个应该很容易理解,就是和相关网站换链接的原因。
但在这个地方,首页和分类页出现了差距。
可以看下这15个网站,无论首页还是分类页,都是讨论iphone的(这不是废话么…)。其实,我想说的是,为什么威锋网有一个论坛站首页和一个分类页参与了排名,而威锋网首页没有在15名之内呢?
从链接上看,就是威锋网的首页主题发生了偏移——以前威锋网确实是首页排名很好,但现在首页关于iphone的主题被稀释了,甚至于低于它的论坛和一个分类页面——这个分类页面的主题和iphone高度相关。
威锋网iphone分类排名好过威锋网首页,也说明了首页的排名能力并不比分类页面高。这也是首页和分类页面排名能力产生差距的链接的原因:一个主题分散,一个主题高度集中。
内容上高度相关,链接上主题集中,各种优势结合得到的结果就是排名上升。两个方面分析完了,基本能算是有根有据吧,至少不是凭规律和经验拍脑袋得出来的结论了。
那么,如何运用在SEO呢?
用于网站优化,就是把相关内容集起来中,链接主题集中起来。
还是iphone的例子。如果要让某个内容页面排到前15名,那这个页面的内容应该是和iphone相关的,链接上应该成为一个内容权威,变态点也像百度百科一样做成链接权威。这个时候优化的难度就分成了内容难度和链接难度。至于做细分网站首页还是综合网站类目?真的和难度没关系呀!
再简单的多说句吧,很多时候自己的某个栏目超不过别人的首页,是因为网站细分出的这个栏目页的内容相关性、链接主题集中度都不高,排名能力低;而做细分网站的,整个网站都是相关内容,首页链接主题集中,排名能力因而增强——你打不过人家不是人家比你强,而是你比人家弱。
做个总结吧。如果说理科生让世界有序发展,文科生让世界更精彩,那么有根有据的理性SEO让网站有序发展,拍脑袋的经验主义SEO则让网站排名很精彩。

评分

参与人数 1赞同 +4 收起 理由
好一点蓝 + 4 赞一个!

查看全部评分

发表于 2014-9-27 13:41:04 |只看大图
回复 收藏
ZERO,SEO执着爱好者    

只要是对论坛用户可能有助的内容都欢迎发。

针对本文的主题而言,一个问题是越是粗粒度的词,其涉及到的相关网页越多,也会有更多的因素参与影响排名。对于"iphone"这样的词,TF-IDF的影响应该已经是很小的了。

至于若要在理论上研究TF-IDF在这类情况下影响究竟多大,可考虑spearman相关系数来量化。不过也建议不要花太多时间在里面,各类排序因素的本质往往是很直观易懂,而非涉及生涩理论的。
发表于 2014-9-27 18:49:29
回复 收藏
思明,技术宅男SEO之路    QQ:176089710    

针对本文的主题,排名的能力首页排名能力超过分类页吗? 我想大家可以很容易举出很多反例来

排名是一个 众多因素 叠加 的结果, 而这些因素又是我们没法去量化的

举个例子,外链数,但是这些外链数的质量我们又怎么去计算呢?

从百度的专利我们可以频繁的看到 sobar 等词,现在百度的排名还包括第三设备的数据,访客的行为影响将越来越大.

细节的东西不用过度关心,重要的还是把握好全局,做一个用户需要的网站.
发表于 2014-9-28 10:15:08
回复 收藏
快速回复 返回顶部 返回列表