在使用爬虫爬取数据或者做数據挖掘和分析的时候我们经常会使用到正则表达式,
在python有用吗中使用正则需要导入re
包
首先我们来看两个例子来体验一下正则表达式的威力吧:
- 提取字符串中
<span>
标签里的内容; - 提取其中所有的手机号;
如果不用正则我们来完成这两个要求:
- 提取所有中文和中文标点
在使用爬虫爬取数据或者做数據挖掘和分析的时候我们经常会使用到正则表达式,
在python有用吗中使用正则需要导入re
包
首先我们来看两个例子来体验一下正则表达式的威力吧:
<span>
标签里的内容;
如果不用正则我们来完成这两个要求:
在正则表达式中如果直接给出芓符,就是精确匹配用\d
可以匹配一个数字,\w
可以匹配一个字母或数字所以:
我想知道避免使用regex是否是个好主意在
事实上,我在任何情况下都避免了它有些人给我的建议是我不应该避免它,因为如果你知道什么是每件事的意思比如:
它很容噫阅读,对吧但我觉得避免使用regex我会有一个更可读的代码。在
它越大越不可读,例如:
那么我想知道一个不回避regex的理由?在