【python】批量查询360关键词指数

只看大图 · 发表于 2014-5-27 16:10:58

本帖最后由 GoGo闯于 2014-5-28 18:34 编辑

#coding:utf-8
#批量查询360关键词指数
import urllib
import urllib2
import re
import time
import linecache
req = re.compile('{"query":"(.*?)","data":{.*?"week_index":([0-9]+),"month_index":([0-9]+)}}')
wordindex_360 = open('360wordindex.txt','a')
nu = 1
for word in open('360word.txt'):
url = 'http://index.so.com/index.php?a=overviewJson&q=%s&area=全国' % urllib.quote_plus(word)
headers = {
......
}
postData = {
"a":"overiewJsom",
"q":"x",
"area":"word"
}
postData = urllib.urlencode(postData)
time.sleep(0.25)
#请求并发送制定的构造数据
request = urllib2.Request(url, postData, headers)
response = urllib2.urlopen(request)
text = response.read()
y = linecache.getline(r'daili.txt',nu)
if "360指数_访问异常出错" in text:
print "切换代理IP:"+y
proxy_support = urllib2.ProxyHandler({'http':y})
opener = urllib2.build_opener(proxy_support, urllib2.HTTPHandler)
urllib2.install_opener(opener)
request = urllib2.Request(url, postData, headers)
text = urllib2.urlopen(request).read()
# time.sleep(600)
nu = nu + 1
continue
else:
word_date = re.findall(req,text)
for x in word_date:
data_list = list(x)
data_str = ','.join(data_list).decode('unicode_escape').encode('utf-8').replace(',',' ') #unicode编码转中文
wordindex_360.write(data_str+'\n')
print data_str

复制代码

运行结果：

ps：注意空格和tab，有时粘过去再改改缩进会有问题，改完格式化一遍

*发表于 2014-5-27 17:25:47* · 发表于 2014-5-27 17:25:47

NameError: name 'data_str' is not defined

楼主| *发表于 2014-5-27 23:15:21* · 发表于 2014-5-27 23:15:21

本帖最后由 GoGo闯于 2014-5-28 10:20 编辑

WangGaoshu 发表于 2014-5-27 17:25
NameError: name 'data_str' is not defined

啊，一出验证码就没有data——str的值了

*发表于 2014-5-28 16:05:54* · 发表于 2014-5-28 16:05:54

高大上啊！

*发表于 2014-6-7 00:59:28* · 发表于 2014-6-7 00:59:28

这区分了seo的档次啊

*发表于 2014-6-8 17:37:17* · 发表于 2014-6-8 17:37:17

如果代码中写一点注释，就perfect

*发表于 2014-6-30 21:28:30* · 发表于 2014-6-30 21:28:30

哎，好东西，得学习python 苦逼。。。

*发表于 2014-7-3 10:59:55* · 发表于 2014-7-3 10:59:55

high big up 正想学习

匿名 *发表于 2014-8-12 13:55:49* · 发表于 2014-8-12 13:55:49

楼主为什么我运行不了呢？望指点一二。我发现我在论坛里找的这些脚本，运行后窗口就消失了，不会有输出结果显示在哪里。这怎么回事呢？

*发表于 2014-8-13 09:18:45* · 发表于 2014-8-13 09:18:45

for x in word_date:
data_list = list(x)
data_str = ','.join(data_list).decode('unicode_escape').encode('utf-8').replace(',',' ') #unicode编码转中文
wordindex_360.write(data_str+'\n')
print data_str

复制代码

print data_str 缩进一格就不会出现没有数据报错。

*发表于 2014-8-18 13:15:25* · 发表于 2014-8-18 13:15:25

请问那个省滤号的缩进错误是怎么回事呢？

匿名 *发表于 2014-9-20 13:18:41* · 发表于 2014-9-20 13:18:41

回复内容已删除

帐号		自动登录	找回密码
密码			注册