发现更大的SEO世界
 找回密码
 注册

扫一扫,访问微社区

搜索
»首页»SEO培训 SEO论坛 SEO交流 帖子
12下一页
发新帖
思明,技术宅男SEO之路    QQ:176089710    

如何像搜索引擎一样思考

本帖最后由 思明 于 2014-6-23 14:04 编辑

搜索引擎是一个没有生命的程序,它是不能够像人类一样进行思考的,它的一切行为都依赖于算法。

搜索引擎也有它特定的思考方式,我们称为 “机器学习” 或 “人工智能” ,但是这一切的前提是基于大数据。

接下来,我通过一些点来说明它是如何思考的。

一、跳出率(搜索跳出率)

    ​   首先如果你的网站没有放置搜索引擎的相关产品代码(如:百度分享,百度统计),或者你的浏览器没有装有搜索引擎的插件(如:百度工具条,谷歌工具条),搜索引擎是无从跟踪用户进入你站点之后的行为。(百度输入法之类的软件是否会通过数据包来收集信息,我不清楚,也不做考虑)

    ​ 如果搜索引擎不能监控到用户进入我们网站之后的行为,那么它是如何统计跳出率的呢?

    ​   答案就是:如果你点击了排名一的网站,10秒后又点击了排名二的网站,那么排名一就会被统计为 不满意的点击,也即跳出。那点击排名一的网站,30秒后没有点击排名后,没有点击其它排名的网站,而是关闭搜索引擎呢?亦或者是搜索了相关的同类的词,或者不同的类的词呢?你可以思考一下,什么样的行业算是一次满意的点击,什么样的行为算是不满意的点击。
    ​
    ​    ​前面的10秒,30秒只是一个举例,要表达的是搜索引擎可以通过用户在搜索引擎上的操作行为来评估每次点击的效果
    ​    ​
    ​    ​别说什么搜索引擎用cookie等来根踪用户进入网站的行为,这些都是扯淡。其前提是 你的网站挂了搜索引擎的相关产品。

二、还是跳出率
    ​    ​
    ​什么样的网站才能佣有更低的跳出率呢?那就是把对的用户带到对的页面

    a、什么叫做对的用户?
    ​
    ​如果你的网站是卖机械的,你却做一些非相关的词来获得流量(你懂的之类的词),那么这些用户就是错的用户,搜索引擎统计到的 搜索跳出率 自然就高。如果你的词就是你的机械的名称或属性相关的词,那过来的就是潜在用户,那就是对的用户。
    ​   
    ​b、什么叫做对的页面?

    ​把对A产品有需求的用户带到A产品的介绍页面,就是对的页面,带到B产品的页面,那就是错的页面。

    ​一句话,让用户在你的网站就能得到他想要的。这句话说的容易,但是搜索引擎带来的流量有时候是你意想不到的,一个页面可能命中的词也可能是你意想不到的词,但是可以肯定的是带来的流量基本都是同一个主题的流量。

    c、举例:

    ​ “美的豆浆机” 页面可能命中的需求:

    ​    ​    ​1、要了解美的豆浆机怎么样
    ​    ​    ​2、了解美的豆浆机价格
       ​    ​ 3、要购买美的豆浆机的,
    ​    ​    ​4、其它的豆浆机的需求

        ​针对这些需求的多样性,页面如何更好的满足用户的需求,就能减少跳出率,就能把用户留在站内。
    ​    ​
    ​    ​可以通过丰富页面的内容来尽可能的留住访客,比如除了介绍美的豆浆机基本情况,还可以推荐不同款式的美的豆浆机,并列出价格,还可以列出美的豆浆机的购买地址,常见问题等内容,万一访客看完之后不喜欢美的了,我们还可以推荐不同品牌的豆浆机,只要访客不再返回搜索引擎搜索同类词或点击排名,那么搜索引擎就认为你满足了需求。

三、搜索引擎的思考(大数据,机器学习)
    ​ 
    ​    ​终于来到本文要说的重点了,搜索引擎通过 评估每个点击的满意度 来给计算页面的质量,这是有前提的,那就是需要先给页面排名,并导入流量,这样才能计算。这也就是为什么有的网站刚开始排名都不错,后来就不好的一个可能原因。

    ​    ​但搜索引擎不能每个网站都一上来就给好排名呀,这不科学,用户体验也不好,那有没有其它办法。

    ​    ​如果我们把拥有排名之后搜索引擎的评估称之为:事后判断,后验概率

    ​    ​那么在还没有排名之前的判断则称之为:事前判断,先验概率

    ​    ​通过事前判断拥有合格的质量得分的页面才会进入排名,进入排名后进入事后判断,重新计算质量得分。

    ​    ​那事前判断的标准是什么,事前判断就是从大量的进行过 事后判断的页面 中提取数据样本进行分析,得出一系列特征码来进行事前评分。
    ​    ​
    ​    ​举个生活的例子:
    ​    ​通过抽样我们可以很容易的 得出 “中国人的中文 比 外国人的中文 好”。但这个不是100%正确。
    ​    ​
    ​    ​机器学习也是通过大数据进行特征统计,得出一个大概率和特征,然后对页面进行事前评分

    ​    ​ ​通过前面的搜索跳出率,有没有以下的可能:
    ​    ​
    ​    ​1、一个页面能够满足越多同种类的需求,那么跳出率就越低 ?   ​   
    ​    ​2、一个页面广告越少,跳出率越低?
    ​    ​3、一个页面有弹窗,跳出率越高?
    ​    ​4、一个页面访问速度越慢,跳出率越高?
    ​    等等。

    ​    ​搜索引擎的思考大概就是这样子,真实的搜索引擎比这个肯定是要复杂的多,但是本质的思路我认为都是一样。

    ​    ​搜索引擎的算法肯定是不会公开的,所有一切都是猜想,我们要学的不是相信某个权威,而是建立起正确的思维方法,从常识出发,去得出和验证自己的想法。

PS:
    ​以上仅是我个人对于搜索引擎思考方式的个人见解,文中所举例子也仅是为了说明我的想法,同不同意权凭个人。不擅长写作,有什么问题可以跟贴,欢迎拍砖。

评分

参与人数 21赞同 +81 收起 理由
Jerry + 1
wangpeng + 4 很给力!
smallcat + 4 很给力!
xcl1086 + 4 赞一个!
低调 + 4
user + 4
邻村小五 + 4 赞一个!
酱油 + 4
AIR_seoqx + 4 赞一个!
豫瞳 + 4 很给力!
gute + 4 赞一个!
方法 + 4 很给力!
zoro + 4 赞一个!
老狼 + 4
hodori + 4
涂丹 + 4 学习了
fred + 4
GoGo闯 + 4
姜姜 + 4 很给力!
fengchao + 1 很给力!

查看全部评分

发表于 2014-6-23 11:33:51
回复 收藏
ZERO,SEO执着爱好者    

事前判断、事后判断仅是昨天课上我临时想到的名词,容易理解,但看上去怪怪的。

回忆了下,有专业的名词在,百度了下:先验概率、后验概率

后验概率可参考:http://baike.baidu.com/view/336754.htm

搜索引擎的概率排序可见:http://wenku.baidu.com/view/9bca82d728ea81c758f57855
发表于 2014-6-23 12:31:57
回复 收藏
fred,请到个人资料页面设置个人签名    [ 版主 ]

貌似搜索引擎还有这么一个算法,行为权重。比如一个搜索用户通过某个关键词搜索进去A网页,A网页上有个图片,图片链接是B网页的,当用户点击A网页上的图片后,最终去到了B网页完成一次搜索。这一次搜索的权值是累加给B网页而不是A网页的。
发表于 2014-6-23 15:23:19
回复 收藏
思明,技术宅男SEO之路    QQ:176089710    

fred 发表于 2014-6-23 15:23
貌似搜索引擎还有这么一个算法,行为权重。比如一个搜索用户通过某个关键词搜索进去A网页,A网页上有个图片 ...

这得搜索引擎能够识别用户进入A网页后的行为,而大部情况下是没办法实现的,所以这种算法我认为概率很小。
 楼主| 发表于 2014-6-23 15:47:07
回复 收藏
浅唱孤寂,请到个人资料页面设置个人签名    

不晓得搜索引擎是如何来判断两次点击搜索结果页中间的间隔时间是否满足了用户的需求,有的页面可能10秒就解决了用户的需求,有的可能十几分钟。而且现在很多人不会仅仅只看一个搜索结果,往往会继续多游览几个搜索结果页。
发表于 2014-6-23 15:50:05
回复 收藏
小小,优雅的拍砖    

浅唱孤寂 发表于 2014-6-23 15:50
不晓得搜索引擎是如何来判断两次点击搜索结果页中间的间隔时间是否满足了用户的需求,有的页面可能10秒就解 ...

用户为什么还会去继续看下一个搜索结果呢
他啊会需求一个更完美的网页
点击这个方面相信搜索引擎比我们研究的深
发表于 2014-6-23 15:54:26
回复 收藏
浅唱孤寂,请到个人资料页面设置个人签名    

小小 发表于 2014-6-23 15:54
用户为什么还会去继续看下一个搜索结果呢
他啊会需求一个更完美的网页
点击这个方面相信搜索引擎比我们研 ...

也许应为 页面的权威性  所以继续点击下一个。
发表于 2014-6-23 15:59:07
回复 收藏
fred,请到个人资料页面设置个人签名    [ 版主 ]

思明 发表于 2014-6-23 15:47
这得搜索引擎能够识别用户进入A网页后的行为,而大部情况下是没办法实现的,所以这种算法我认为概率很 ...

这个算法是从大地那边听来的,应该会有这种算法,但是详细的不知道。
发表于 2014-6-23 16:15:57
回复 收藏
bingyan,攻城师    

搜索引擎虽然是程序,不过还是完善了很多。他会根据用户跳出率来检查网页为什么会这样,比如广告、打开时间、信息错、网页设计等等,这些都是普通网民浏览网页时,影响跳出率的因素,当然有些特殊的就例外了,比如美女图片和视频这样的。
发表于 2014-6-23 17:00:44
回复 收藏
老飘,请到个人资料页面设置个人签名    

贝叶斯概率在搜索引擎算法上应用很广,求相关性就是一个求概率的的算法,不错。
发表于 2014-6-24 10:50:55
回复 收藏
zoro,爱op,爱zoro(海贼王的zoro)。    

其实更多时候,大家都忽略了,正态分布这个概念,上面大家有疑问的地方是如何界定这个时间,其实用户的行为多种多样,到了一定的量级的时候,会形成一个正太分布,而搜索er可以通过深度学习获得初步的计算模型,进而可以很清楚的或者说从大概率的角度来说,确定一个网页的跳出率问题。这个有空可以开个文聊聊。

至于fred提到的算法,其实搜索没有安装百度统计之类的是没办法跟踪的,那么为什么会影响排名呢?因为从概率的角度来说100个页面中,有1个页面有不同的内容,同时这个内容是相关的,那么就是对页面排名有利的因素,仅此而已!

最后还是默默的求赞吧。
发表于 2014-6-24 13:51:08
回复 收藏
ZERO,SEO执着爱好者    

zoro 发表于 2014-6-24 05:51
其实更多时候,大家都忽略了,正态分布这个概念,上面大家有疑问的地方是如何界定这个时间,其实用户的行为 ...

期待具体分享,那么一大波赞将会来袭。
发表于 2014-6-24 14:09:25
回复 收藏
zhonghuanbob,seo的小小小小菜鸟~~    

zoro 发表于 2014-6-24 13:51
其实更多时候,大家都忽略了,正态分布这个概念,上面大家有疑问的地方是如何界定这个时间,其实用户的行为 ...

正太分布好像不太了解,是不是也是一个概率问题,搜索引擎来判断也是一个长期的过程。
不过关于跳出率的问题确实还挺到位的。
发表于 2014-6-24 21:55:58
回复 收藏
,请到个人资料页面设置个人签名    

fred 发表于 2014-6-23 16:15
这个算法是从大地那边听来的,应该会有这种算法,但是详细的不知道。

很想知道大地现在干嘛了?
匿名  发表于 2014-8-27 18:00:04
回复 收藏
,请到个人资料页面设置个人签名    

fred 发表于 2014-6-23 16:15
这个算法是从大地那边听来的,应该会有这种算法,但是详细的不知道。

很想知道大地现在干嘛了?
匿名  发表于 2014-8-27 18:00:05
回复 收藏
12下一页
快速回复 返回顶部 返回列表