发现更大的SEO世界
 找回密码
 注册
搜索
»首页»SEO培训 SEO论坛 SEO交流 帖子
发新帖
莫山,改我论坛密码的没有小JJ,哼!!!    

【菜鸟Python问题】关于正则的使用的问题。

本帖最后由 莫山 于 2014-6-9 22:24 编辑

当数据换行的时候,如何写正则呢?下面红线里的正则写的不对,无法匹配到数据,求教该如何修改?








小白,不懂程序,不懂seo,求指教。
发表于 2014-6-9 22:22:24 |只看大图
回复 收藏
ZERO,SEO执着爱好者    

.在通常情况下不匹配空白字符,可写成<span>[\s\S]*?</span>
发表于 2014-6-9 22:43:57
回复 收藏
莫山,改我论坛密码的没有小JJ,哼!!!    

ZERO 发表于 2014-6-9 22:43
.在通常情况下不匹配空白字符,可写成[\s\S]*?

搞定了,感谢zero大。么么哒
 楼主| 发表于 2014-6-9 22:48:16
回复 收藏
Arvin,外链才是硬道理    

' '.join(read.split())     用这个可以去掉换行符,不影响原代码。    read是源码。
简单的替换\n会出问题,有些网页取回来的编码是\n89这样子的。

评分

参与人数 1赞同 +4 收起 理由
莫山 + 4 用zero的办法比较方便,谢了

查看全部评分

发表于 2014-6-10 09:10:30
回复 收藏
思明,技术宅男SEO之路    QQ:176089710    

一直都是拿到源码后先替换掉换行符,然后再进行正则匹配。

替换掉 \r 和 \n

楼上的方法没用过,试看看。

评分

参与人数 1赞同 +4 收起 理由
莫山 + 4 很给力!

查看全部评分

发表于 2014-6-10 09:43:23
回复 收藏
快速回复 返回顶部 返回列表