发现更大的SEO世界
 找回密码
 注册
搜索
»首页»SEO培训 SEO论坛 SEO交流 帖子
发新帖
行书,请到个人资料页面设置个人签名    

关于python scrapy爬虫框架的问题

无基础直接按教程撸代码。
教程中的dmoz不是我要的例子,于是把spider.py中的内容改成万方的(从其他入口登录,非帐号。)

然而链接放到spider.py 首次运行能生成一个有内容的文件,后面死也不行。
考虑是没登录问题,但我这个是从其他入口直接进的,那个平台除了平台要登录以外,点击万方的这块不需要登录,应该是点击的时候顺带传递数据了。
抓包下来也不知道具体要上传个啥。百度谷歌了几天也没有例子(英文看不懂)。

求大神解答,链接不能放。
发表于 2015-7-27 19:17:28
回复 收藏
alexkh,积累金币~    

搜“Scrapy中文教程”,有个 readthedocs的中文教程

还是先撸一遍中文教程吧,否则你问都不知道怎么问,其他人帮都不知道怎么帮。
发表于 2015-8-7 17:24:43
回复 收藏
快速回复 返回顶部 返回列表