【Python】正则表达式（非常详细）

田野猫咪

已于 2024-01-06 15:10:50 修改

阅读量3.6k

点赞数 28

分类专栏：编程 Python 知识文章标签： python 正则表达式 mysql 开发语言零基础学Python Python知识难点

于 2023-12-15 10:37:34 首次发布

本文链接：https://blog.csdn.net/python03012/article/details/135011259

版权

文章目录

正则表达式概述

正则表达式，又称规则表达式。(英语：Regular Expression，在代码中常简写为regex、regexp或RE），计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式（视则）的文本。
正则表达式可以：
（1）测试字符串的某个模式，即数据有效性验证（查找）
（2）实现按照某种规则替换文本
（3）根据模式匹配从字符串中提取一个子字符串（爬虫）
正则表达式的构成： 原子（普通字符，如英文字符）、元字符（有特殊功能的字符）、以及模式修正字符组成。注意：一个正则表达式中至少包含一个原子。
正则表达式测试工具： RegexBuddy

匹配单个字符

字符	功能
.	匹配任意1个字符（除了\n 换行）
[]	匹配[ ]中列举的字符
\d	匹配数字，0-9
\D	匹配非数字，即不是数字
\s	匹配空白，即空格、\t tab键、\n 换行
\S	匹配非空白
\w	匹配单词字符（字母、数字、下划线），即a-z、A-Z、0-9,、_
\W	匹配非单词字符（非字母、非数字、非下划线）

匹配多个字符

字符	功能
*	匹配前一个字符出现0次或者无限次，即可有可无
+	匹配前一个字符出现1次或者无限次，即至少有1次
?	匹配前一个字符出现1次或者0次，即要么有1次，要么没有
{m}	匹配前一个字符出现m次
{m,n}	匹配前一个字符出现从m到n次，m<n

匹配开头结尾

字符	功能
^	匹配字符串开头，注意^[4-7]和[4-7]的区别
$	匹配字符串结尾

注意： ^有两个作用
（1）匹配已指定字符开头
（2）用在[]内部，用于取反，如：[^he] 匹配不含有h和e的字符

练习：
1、匹配出，一个字符串第一字母为大写字符，后面都是小写字母并且这些小写字母可有可无：^[A-Z][a-z]*
2、匹配出，变量名是否有效(由字母、数字、下划线组成，不能以数字开头）：^[a-zA-Z_]+\w*
3、匹配出，0到99之间的数字：^\d?\d$
4、匹配出，不是以4、7结尾的手机号码(11位)：^\d{10}[0-35689]$
5、匹配出，8到20位的密码，可以是大小写英文字母、数字、下划线：^\w{8,20}$
6、匹配出，163的邮箱地址，且@符号之前有4到20位，例如nello@163.com：^\w{4,20}@163\.com$

re模块操作

re模块是python中提供的用于正则操作的模块。
re模块的使用步骤：
导入模块：import re
使用match()方法进行检测：result = re.match('正则表达式', '要验证/检测的字符串’)
判断是否检测/匹配成功：print('匹配成功') if result else print('匹配失败')
取出匹配的具体内容：result.group()

最低0.47元/天解锁文章