记录自己建立的小型b2c商城。

只看大图 · 发表于 2014-6-22 00:48:05

本帖最后由 hwj888 于 2014-6-22 01:07 编辑

一直在犹豫写不写，因为论坛高手太多，怕自己写得太烂。一：因为有这种思想，就会出现问题，一些seo方法可能错了自己还蒙在怀里，所以写出来刚好大家可以批评指正。二：有些方法说了又说，自己看了又看，但是始终没有去实战，而这边记录的话，也可以促使自己亲自去做一些事情吧，应该也是论坛所说的"让SEO圈不那么浮躁，踏踏实实做一些SEO"。

背景：2月份的时候做了一个小型外贸网站（产品300+），刚开始感觉没什么可做了，产品太少，主要还是发外链吧，但是又不知道外链怎么发，所以一直拖到现在，然后，因为seo前线的一些经验分享和方法，使自己想重新弄下网站测试下效果，因为一些方法可能看了百遍，但是还没有实践一遍。

1.挖掘关键字
前期已经通过google关键词工具得到了一些，因为对产品不算熟悉，还有很多关键词没有挖掘到，现在回过头再来看看自己网页的质量简直惨不忍睹（坑啊）。
自己用到的方法是，采集竞争对手200W收录行业站的关键词（这么方便的事，之前为什么一直没用，一直在想怎么弄到google关键词api，装b吗？）。竞争网站刚好在robots那边写了xml网址（要是下次遇到一个没写的，该怎么处理？用site命令查不全啊。）那就直接拿来用了，有些xml太大，用浏览器还不能直接打开另存为，我是直接用window下的wget命令下载的（还要下载安装包，linux好像自带？没去看了，反正wget之前，用来自动备份本地网站数据在我这边电脑已经安装了），当然用火车头等工具采集也没什么问题，火车头我用来采集内容页的一部分数据。

其实从这边的xml也可以得出不少结论，至少这边有品牌页，目录页，攻略页，图片页，产品页，评论页，搜索页，视频页，号码大小页，至少很快的对网站结构有了大概的了解，然后因为英文网站一般都是url都是以关键字生成，那这些xml中的url基本后缀就是我所需要的关键词了，对于我这样的小网站已经足够了，下载到xml怎么提取url，这个应该是很简单的，利用正则匹配一下应该很快可以完事，真正自己去写发现自己很2，艰难完成。

<?php
$file='1.txt';
$save='2.txt';
$fh=fopen($file,'rb');
$fs=fopen($save,'a');
while(!feof($fh)){
$cont=fgets($fh);
if (eregi('<loc>',$cont)){
$cont=preg_replace('/<loc>|<\/loc>|\]\]>|<\!\[CDATA\[/i','',$cont);
fwrite($fs,$cont);
}
}
fclose($fs);
echo 'ooooooooooook！！';

复制代码

由于自己对php相对熟悉，就直接用php来了，效率的话，反正自己这边够用了。其它shell，python，应该更简单，快捷，效率更高吧。关于得到xml的一些数据思考，网站产品才2W，这个数目也不多啊，我把现有xml网址加起来也没觉的会有上述收录的那么多,肯定有问题，又用其他方法大概估算了产品数证明应该是2W左右的，再看下网站发现目录属性交叉页竟是如此之多，因为竞争对手网站的属性url有一定特征，所以用inurl命令查了下，大概150W左右，这个命令行不行呢？这都不被惩罚。。。

有了这些关键词后了，接下去应该是词库的一些筛选和分类吧，还没弄。

*发表于 2014-6-22 23:16:46* · 发表于 2014-6-22 23:16:46

xml太大，用浏览器还不能直接打开另存为，我是直接用window下的wget命令下载的
这个直接开迅雷或者QQ旋风把URL贴上去就能下载了哈。

这是哪家的？这么好，xml都送出来了。

采集竞争对手网站的数据，可以查找下URL规则，看有没有规则可寻，如果没有在想其他办法，有些网站做了防采集的设计（论坛有讨论），会比较头疼
反正就是找到一些规律，然后采集
site也是一种手段。

*发表于 2014-8-11 14:01:38* · 发表于 2014-8-11 14:01:38

楼主怎么不更新了呢？

帐号		自动登录	找回密码
密码			注册

记录自己建立的小型b2c商城。

评分