发现更大的SEO世界
 找回密码
 注册
搜索
»首页»SEO培训 SEO论坛 SEO交流 帖子
发新帖
hwj888,友链。    

记录自己建立的小型b2c商城。

本帖最后由 hwj888 于 2014-6-22 01:07 编辑

一直在犹豫写不写,因为论坛高手太多,怕自己写得太烂。一:因为有这种思想,就会出现问题,一些seo方法可能错了自己还蒙在怀里,所以写出来刚好大家可以批评指正。二:有些方法说了又说,自己看了又看,但是始终没有去实战,而这边记录的话,也可以促使自己亲自去做一些事情吧,应该也是论坛所说的"让SEO圈不那么浮躁,踏踏实实做一些SEO"。

背景:2月份的时候做了一个小型外贸网站 (产品300+),刚开始感觉没什么可做了,产品太少,主要还是发外链吧,但是又不知道外链怎么发,所以一直拖到现在,然后,因为seo前线的一些经验分享和方法,使自己想重新弄下网站测试下效果,因为一些方法可能看了百遍,但是还没有实践一遍。

1.挖掘关键字
前期已经通过google关键词工具得到了一些,因为对产品不算熟悉,还有很多关键词没有挖掘到,现在回过头再来看看自己网页的质量简直惨不忍睹(坑啊)。
自己用到的方法是,采集竞争对手200W收录行业站的关键词(这么方便的事,之前为什么一直没用,一直在想怎么弄到google关键词api,装b吗?)。竞争网站刚好在robots那边写了xml网址(要是下次遇到一个没写的,该怎么处理?用site命令查不全啊。)那就直接拿来用了,有些xml太大,用浏览器还不能直接打开另存为,我是直接用window下的wget命令下载的(还要下载安装包,linux好像自带?没去看了,反正wget之前,用来自动备份本地网站数据在我这边电脑已经安装了),当然用火车头等工具采集也没什么问题,火车头我用来采集内容页的一部分数据。

其实从这边的xml也可以得出不少结论,至少这边有品牌页,目录页,攻略页,图片页,产品页,评论页,搜索页,视频页,号码大小页,至少很快的对网站结构有了大概的了解,然后因为英文网站一般都是url都是以关键字生成,那这些xml中的url基本后缀就是我所需要的关键词了,对于我这样的小网站已经足够了,下载到xml怎么提取url,这个应该是很简单的,利用正则匹配一下应该很快可以完事,真正自己去写发现自己很2,艰难完成。

  1. <?php
  2. $file='1.txt';
  3. $save='2.txt';
  4. $fh=fopen($file,'rb');
  5. $fs=fopen($save,'a');
  6. while(!feof($fh)){
  7.          $cont=fgets($fh);
  8.          if (eregi('<loc>',$cont)){
  9.                 $cont=preg_replace('/<loc>|<\/loc>|\]\]>|<\!\[CDATA\[/i','',$cont);
  10.         fwrite($fs,$cont);
  11.          }

  12. }
  13. fclose($fs);
  14. echo 'ooooooooooook!!';
复制代码

由于自己对php相对熟悉,就直接用php来了,效率的话,反正自己这边够用了。其它shell,python,应该更简单,快捷,效率更高吧。关于得到xml的一些数据思考,网站产品才2W,这个数目也不多啊,我把现有xml网址加起来也没觉的会有上述收录的那么多,肯定有问题,又用其他方法大概估算了产品数证明应该是2W左右的,再看下网站发现目录属性交叉页竟是如此之多,因为竞争对手网站的属性url有一定特征,所以用inurl命令查了下,大概150W左右,这个命令行不行呢?这都不被惩罚。。。

有了这些关键词后了,接下去应该是词库的一些筛选和分类吧,还没弄。

评分

参与人数 1赞同 +4 收起 理由
hookman + 4 很给力!

查看全部评分

发表于 2014-6-22 00:48:05 |只看大图
回复 收藏
莫山,改我论坛密码的没有小JJ,哼!!!    

xml太大,用浏览器还不能直接打开另存为,我是直接用window下的wget命令下载的
这个直接开迅雷或者QQ旋风把URL贴上去就能下载了哈。

这是哪家的?这么好,xml都送出来了。

采集竞争对手网站的数据,可以查找下URL规则,看有没有规则可寻,如果没有在想其他办法,有些网站做了防采集的设计(论坛有讨论),会比较头疼
反正就是找到一些规律,然后采集
site也是一种手段。
发表于 2014-6-22 23:16:46
回复 收藏
hudson,请到个人资料页面设置个人签名    

楼主怎么不更新了呢?
发表于 2014-8-11 14:01:38
回复 收藏
快速回复 返回顶部 返回列表