正规式，又称正则表达式（Regular Expression），是一种用于描述字符串模式的工具

本文链接：https://blog.csdn.net/blog_programb/article/details/145788671

正规式，又称正则表达式（Regular Expression），是一种用于描述字符串模式的工具。在计算机科学领域，正则表达式被广泛应用于文本处理、编程语言的词法分析、数据验证等场景。通过特定的字符和运算符组合，可以简洁且精确地定义出各种字符串模式，例如匹配特定格式的电话号码、电子邮箱地址、日期等。

例如，“[0-9]+”这个正则表达式表示匹配一个或多个数字组成的字符串。这种表达方式不仅简洁，而且非常强大，能够处理复杂的字符串匹配需求。
在正则表达式中，“+”符号表示匹配前面的子表达式一次或多次。也就是说，它要求前面的元素至少出现一次，且可以连续出现多次。

例如：

正则表达式 a+ 可以匹配一个或多个连续的字符 ‘a’。它可以匹配 “a”、“aa”、“aaa” 等等。
正则表达式 \d+ 可以匹配一个或多个数字字符。它可以匹配 “1”、“123”、“456789” 等等。

需要注意的是，“+”符号是贪婪的，这意味着它会尽可能多地匹配前面的子表达式。如果希望匹配非贪婪的方式，可以使用 +? 来代替。
在正则表达式中，“*”符号表示匹配前面的子表达式零次或多次。也就是说，它可以匹配空字符串或者重复任意多次的前面的字符组合。

例如：

正则表达式 a* 可以匹配 “”, “a”, “aa”, “aaa” 等。
正则表达式 \d* 可以匹配 “”, “123”, “4567” 等数字字符串。

这个符号常用于匹配可选的字符或重复出现的字符。
在正则表达式中，“+”符号表示匹配前面的子表达式一次或多次。也就是说，它会尝试匹配前面的子表达式至少一次，并且可以连续匹配多次。

例如，对于正则表达式 a+：

它可以匹配一个或多个连续的字母 “a”。
如果输入字符串是 “aaa”，那么整个字符串都能被匹配到。
如果输入字符串是 “aa”，同样也能被完全匹配。
如果输入字符串是 “a”，也能被完全匹配。

这个符号在正则表达式中非常有用，特别是在需要重复匹配某个模式的时候。
在正则表达式中，“*”符号是一个量词，表示前面的元素可以出现零次或多次。具体来说，它匹配前面的字符或子模式的零个、一个或多个连续重复。

例如：

a* 可以匹配空字符串、“a”、“aa”、“aaa” 等。
\d* 可以匹配空字符串、“0”、“123”、“456789” 等任意长度的数字字符串。

这种灵活性使“”成为正则表达式中非常强大的工具，用于处理各种复杂的文本匹配需求。
在正则表达式中，“”符号用于表示匹配前面的字符零次或多次。它的表现可以根据贪婪匹配和懒惰匹配有所不同：

贪婪匹配：默认情况下，“”符号是贪婪的，这意味着它会尽可能多地匹配字符。例如，对于字符串“aaaa”和正则表达式“a”，贪婪匹配会尝试匹配所有的“a”，即整个字符串“aaaa”。
懒惰匹配（非贪婪匹配）：通过在“”后面加上“?”，可以使其变为懒惰匹配。在这种情况下，“？”会尽可能少地匹配字符。例如，对于同样的字符串“aaaa”和正则表达式“a*?”，懒惰匹配会尝试匹配最少的“a”，即一个“a”。
正则表达式中的贪婪匹配是指在匹配过程中，尽可能多地匹配字符或字符串。这种匹配方式会尝试从左到右依次匹配，并尽可能地扩展匹配范围，直到不能再继续为止。

具体来说，当一个正则表达式包含量词（如 *、+、?、{n,m} 等）时，贪婪匹配会尽量多地匹配字符，直到达到最大可能的匹配长度。如果后续的匹配失败，才会逐渐减少匹配的长度，尝试其他可能性。

例如，对于正则表达式 a.*b，在字符串 "aaab" 中，.* 会首先匹配尽可能多的 a，即整个字符串 "aaab"，然后再进行匹配。如果匹配成功，则返回整个匹配结果；如果匹配失败，则逐步减少匹配的长度，直到找到合适的匹配。

贪婪匹配在某些情况下可能会导致性能问题，因为它可能会尝试所有可能的匹配组合。因此，在使用正则表达式时，需要根据具体情况选择合适的匹配方式，以避免不必要的性能开销。
非贪婪匹配是正则表达式中的一种匹配方式，与默认的贪婪匹配相对。在正则表达式中，默认情况下，量词（如 *、+、?、{n,} 等）会尽可能多地匹配字符，这称为贪婪匹配。而非贪婪匹配则是让量词尽量少地匹配字符。

具体来说，通过在量词后面加上一个问号 ?，可以将其转换为非贪婪匹配模式。例如：