正则表达式基础(内部分享)

强大,便捷,高效的文本处理工具。

**

使用场景:

  1. 检索
  2. 过滤
  3. 捕获
  4. 更多……

    使用步骤:

  5. 定义正则表达式的规则

  6. 根据规则进行文本处理
  7. 根据结果进行相关操作

语法基础:

  • 字面量:
  • 元字符:

    **. :匹配除换行符之外的任意单个字符**

    **\\d :匹配数字**

    **\\w :匹配字母或数字或下划线或汉字**

    \b :匹配单词的开始或结束

    **\\s :匹配任意的空白字符**

    ^ : 匹配字符串开始

    **$ :匹配字符串结束**

**\* : 重复零次或****更多次**

+ : 重复一次或更多次

**? : 重复零次或一次**

**{n} : 重复n次**

**{n,} : 重复n次或更多次**

**{n,m} : 重复n至m次**

[ ] : 字符组,匹配若干字符之一。

  • :用字符组中时,表示一个范围,但不能用与字符组的起始或结束。

    ^ : 用于字符组起始位置时,表示对字符组取反(匹配不包含在字符中的字符)。

    多选分支

    | :或,用于连接两个或多个子表达式,组合成一个表达式,常与()配合使用。

    使用注意:字符组只能匹配目标文本中的单个字符;多选分支自身可以是完整的表达式,可以匹配任意长度的文本。

    例子:l[ea]rn 与 l(e|a)rn

示例工具

命令行:

grep :

egrep :