发现更大的SEO世界
 找回密码
 注册
搜索
»首页»SEO培训 SEO论坛 SEO交流 帖子
12下一页
发新帖
ZERO,SEO执着爱好者    

与多位百度人员沟通得到的内部信息

此贴记录一些我曾和百度内部一些人员的沟通中,比较重要的几部分,内容会比较散。


1. From 运营@百度空间

百度内部产品的网页收录,不是由百度爬虫进行抓取,而是直接提交结构化数据。

百度产品也想要从其它搜索引擎获取流量。


2. From PM@百度知道

百度的几个流量产品,其流量的SEO占比极其高。

百度的产品也想方设法从百度搜索获取更多流量。

之所以目前SERP上多数百度知道的结果下面都有相关问题链接,这和一些人想象当中相反,是百度在打压百度知道。因为本来百度知道很多时候在SERP可以占据多条搜索结果,现在很多情况下被并为一条。


3. From RD@大搜索-基础排序

百度判断网页的层级关系,主要依赖于面包屑导航。

竞价与自然搜索是完全分开的两块,彼此拿不到对方的数据。

百度的流量产品想获取更多百度SEO流量十分简单,只要内部调整一下权重值。

在基础排序的角度看来,多数页面的相关性都一样——标题有关键词、内容有关键词...所以在这种情况下会依赖于站点的权重、用户行为数据来决定最终排名。


4. From RD@大搜索-反作弊

百度内部想让一个站提升或者下降SEO流量十分简单,且可以控制变化的流量量级。

反作弊规则有两大类,上策略与上数据。上数据的话,会有一批作弊URL被处理,隔段时间可能下一批URL被处理;上策略的话,新的作弊URL一旦产生即被处理。


5. From RD@大搜索-爬虫(通过他人间接沟通)

对于单IP多子域名,百度会提取一个子域名作为核心,重点抓取。其余均视为*.xxx.com,近似平均分配抓取。

抓取限制的策略比较复杂,总体而言抓取以抓取总量为上限。


6. From RD@大搜索-爬虫(另一人)

哪怕总体而言抓取以抓取总量为上限,因为规则不是单一的,因此加快网页加载速度让每个页面抓取更快的话,总抓取量还是会上升。

评分

参与人数 9赞同 +36 收起 理由
木头 + 4 赞一个!
浅唱孤寂 + 4 很给力!
hwj888 + 4 很给力!
奋斗 + 4 很给力!
莫山 + 4 赞一个!
kaurus + 4 多谢分享
GoGo闯 + 4
jnjoyo + 4 赞一个!
vscvscvsc + 4 32个赞

查看全部评分

发表于 2014-5-16 10:51:56
回复 收藏
莫山,改我论坛密码的没有小JJ,哼!!!    

本帖最后由 莫山 于 2014-5-26 20:43 编辑

谷歌官方的人说谷歌蜘蛛会将一段URL切割成好几块来爬取  #修改,说的不严谨,应该是有时候会这么处理。
例如:www.seoqx.com/aa/bb/1.htm
会切割成:
www.seoqx.com/aa/bb/
www.seoqx.com/aa/
www.seoqx.com/
据观察百度有类似行为。

评分

参与人数 2赞同 +8 收起 理由
hookman + 4
奋斗 + 4 赞同有遇到抓取目录

查看全部评分

发表于 2014-5-26 20:10:19
回复 收藏
guohezu,请到个人资料页面设置个人签名    

莫山 发表于 2014-5-26 20:10
谷歌官方的人说谷歌蜘蛛会将一段URL切割成好几块来爬取
例如:www.seoqx.com/aa/bb/1.htm
会切割成:

嗯,我个人观点,一个页面上的同一个链接,所处的位置不一样,他的作用是不同的。
发表于 2014-5-26 20:38:22
回复 收藏
guohezu,请到个人资料页面设置个人签名    

莫山 发表于 2014-5-26 20:10
谷歌官方的人说谷歌蜘蛛会将一段URL切割成好几块来爬取
例如:www.seoqx.com/aa/bb/1.htm
会切割成:

老大 看你的签名,什么时候分享下你的外链心得啊。
发表于 2014-5-26 20:39:18
回复 收藏
莫山,改我论坛密码的没有小JJ,哼!!!    

guohezu 发表于 2014-5-26 20:39
老大 看你的签名,什么时候分享下你的外链心得啊。

我就说说装装逼而已。
发表于 2014-5-26 20:44:52
回复 收藏
ZERO,SEO执着爱好者    

莫山 发表于 2014-5-26 12:10
谷歌官方的人说谷歌蜘蛛会将一段URL切割成好几块来爬取  #修改,说的不严谨,应该是有时候会这么处理。
例 ...

印象中好像是百度搜索引擎优化指南,推荐把斜杠部分去掉后能看到上一级的网页,而非空页面。
 楼主| 发表于 2014-5-26 21:54:53
回复 收藏
zoro,爱op,爱zoro(海贼王的zoro)。    

莫山 发表于 2014-5-26 20:44
我就说说装装逼而已。

不能这么说了,我们都知道你是小牛了。
发表于 2014-5-27 12:44:33
回复 收藏
杰哥,目标是做一个日IP50W+的优质网站。    

在基础排序的角度看来,多数页面的相关性都一样——标题有关键词、内容有关键词...所以在这种情况下会依赖于站点的权重、用户行为数据来决定最终排名
发表于 2014-5-27 16:07:56
回复 收藏
97251230,请到个人资料页面设置个人签名    

莫山 发表于 2014-5-26 20:44
我就说说装装逼而已。

我也求带。
发表于 2014-5-27 16:41:58
回复 收藏
97251230,请到个人资料页面设置个人签名    

杰哥 发表于 2014-5-27 16:07
在基础排序的角度看来,多数页面的相关性都一样——标题有关键词、内容有关键词...所以在这种情况下会依赖 ...

杰哥,下午好。
发表于 2014-5-27 16:43:06
回复 收藏
杰哥,目标是做一个日IP50W+的优质网站。    


现在得晚上好了 呵呵 多多交流a
发表于 2014-5-27 19:00:18
回复 收藏
97251230,请到个人资料页面设置个人签名    

杰哥 发表于 2014-5-27 19:00
现在得晚上好了 呵呵 多多交流a

难道还用手机上来交流,哈哈。
发表于 2014-5-27 19:21:41
回复 收藏
奋斗,战斗力只有0.05渣渣    

5. From RD@大搜索-爬虫(通过他人间接沟通)

对于单IP多子域名,百度会提取一个子域名作为核心,重点抓取。其余均视为*.xxx.com,近似平均分配抓取。

抓取限制的策略比较复杂,总体而言抓取以抓取总量为上限。


如果二级域名站分布在多个IP 是否也会有抓取总量的上限?。
还有6加载速度加快  没有一个明确的参考

评分

参与人数 1赞同 +4 收起 理由
lijiong520 + 4

查看全部评分

发表于 2014-5-27 21:02:10
回复 收藏
ZERO,SEO执着爱好者    

奋斗 发表于 2014-5-27 13:02
如果二级域名站分布在多个IP 是否也会有抓取总量的上限?。
还有6加载速度加快  没有一个明确的参考
...

具听闻的信息,及之前的抓取数据判断,多半是各IP有各自的抓取总量上限。
 楼主| 发表于 2014-5-27 21:51:45
回复 收藏
AIR_seoqx,希望在SEO前线的乐土中,真正享受SEO的滋润。    

杰哥 发表于 2014-5-27 16:07
在基础排序的角度看来,多数页面的相关性都一样——标题有关键词、内容有关键词...所以在这种情况下会依赖 ...

这点我也是关注的,如何提高站内权重,用户行为数据包含那些。这俩点是至关重要的。

评分

参与人数 1赞同 +4 收起 理由
yinshuiping + 4 很给力!

查看全部评分

发表于 2014-6-3 18:36:08
回复 收藏
12下一页
快速回复 返回顶部 返回列表