正则表达式/介绍
外观
< 正则表达式
正则表达式是一种表示字符串匹配模式的方法。正则表达式可以用来定位和修改文本数据记录中匹配特定模式的字符串,它们通常用在操作文本数据的实用程序和编程语言中。正则表达式非常强大。
各种软件应用程序使用正则表达式来定位、选择或修改特定部分的文本。例如,正则表达式可以用来
- 将整个文本中的“snake”一词替换为“serpent”
- 找到包含“fox”和“sheep”这两个词的同一行的文本
正则表达式由三种类型的组件组成
- 锚点用于指定模式相对于文本行的位置。
- 字符集用于匹配单个位置中的一个或多个字符。
- 修饰符用于指定字符集重复的次数。
正则表达式的语法在不同的应用程序中有所不同。例如,shell 使用一种称为 shell 正则表达式的有限形式的正则表达式进行文件名替换,而 AWK 使用扩展正则表达式语法的超集。
正则表达式得到各种软件工具的支持,包括命令行工具、纯文本编辑器和编程语言。大多数这些工具都可以在各种计算平台上使用,包括 Linux、Windows 和 Mac OS X。这些工具使用略微不同的语法风格。让我们看看一些值得注意的工具。
使用正则表达式的工具列在下面
命令行 工具 |
纯文本 编辑器 |
编程 语言 |
---|---|---|
grep | ed | .NET |
egrep | vi | Awk |
sed | Emacs | Java |
Notepad++ | JavaScript | |
Perl | ||
PHP | ||
Python | ||
Ruby | ||
Tcl |
正则表达式可以被认为是一个小程序,它可以找到或隔离更大文本集的子集。就像普通的计算机程序需要计算机来执行它一样,正则表达式需要软件应用程序来解释它 - 赋予它意义。
例如,正则表达式可以用来告诉编辑器查找“Chapter”一词的下一个出现位置,后面跟着几个空格和数字。或者你可以使用正则表达式来告诉 UNIX grep 命令只显示文件中包含“Wiki”一词,后面跟着“Books”一词或“pedia”词语片段的行。在下一章中,我们将讨论这些正则表达式的确切语法。