14. [^ ] 跟[! ]差在哪? (wildcard)
这个题目说穿了, 就是要探讨Wildcard与Regular Expression的差别的。 这也是很多初学shell的朋友很容易混淆的地方。
首先,让我们回到十三问之第2问, 再一次将我们提到的command line format 温习一次:
command_name options arguments
同时,也再来理解一下,我在第5章所提到的变量替换的特性:
先替换,再重组 command line!
有了这个两个基础后,再让我们来看Wildcard是什么回事吧。
Part-I Wildcard (通配符)
首先,
`Wildcard` 也是属于 `command line` 的处理工序,作用于 `arguments` 里的 `path` 之上。
没错,它不用在command_name
,也不用在options
上。
而且,若argument不是path的话,那也与wildcard无关。
换句更为精确的定义来讲,
`wildcard`是一种命令行的路径扩展(path expansion)功能。
提到这个扩展,那就不要忘了 command line的“重组”特性了!
是的,这与变量替换
(variable subtitution)及
命令替换
(command substitution)的重组特性是一样的。
也就是在wildcard
进行扩展后,
命令行会先完成重组,才会交给shell来处理。
了解了wildcard
的扩展与重组特性后,
接下来,让我们了解一些常见的wildcard吧。
wildcard | 功能 |
---|---|
* | 匹配0个或多个字符 |
? | 匹配任意单一字符 |
[list] | 匹配list中任意单一字符 |
[!list] | 匹配不在list中任意单一字符 |
{string1,string2,…} | 匹配string1或者stsring2或者(…)中其一字符串 |
Note: list 中可以指定单个字符,如abcd, 也可以指定ASCII字符的起止范围,如 a-d。 即[abcd] 与 [a-d] 是等价的,称为一个自定义的字符类。
例如:
a*b # a 与 b 之间可以有任意个字符(0个或多个),如aabcb, axyzb, a012b,ab等。
a?b # a 与 b 之间只能有一个字符,但该字符可以任意字符,如 aab, abb, acb, azb等。
a[xyz]b # a 与 b 之间只能有一个字符,但这个字符只能是x或者y或者z,如:axb, ayb, azb这三个。
a[!0-9]b# a 与 b 之间只能有一个字符,但这个字符不能是阿拉伯数字,如aab,ayb,a-b等。
a{abc,xyz,123}b # a 与 b之间只能是abc或者xyz或者123这三个字串之一,扩展后是aabcb,axyzb,a123b。
[! ]
中的!
只有放在第一位时,才有取反的功效。 eg:[!a]*
表示当前目录下不以a开头的路径名称;/tmp/[a\!]*
表示/tmp目录下所有以a 或者 ! 开头的路径名称;思考:为何!前面要加\呢?提示是十三问之4.
[ - ]
中-
左右两边均有字符时,才表示一个范围,否则,仅作-
(减号)字符来处理。 举例:/tmp/*[-z]/[a-zA-Z]*
表示/tmp 目录下所有以z或者-结尾的子目录中, 以英文字母(不分大小写)开头的目录名称。以*或?开头的wildcard不能匹配隐藏文件(即以.开头的文件名)。 eg:
*.txt
并不能匹配.txt
但能匹配1.txt这样的路径名。 但1*txt及1?txt均可匹配1.txt这样的路径名。
基本上,要掌握wildcard并不难, 只要多加练习,再勤于思考,就能灵活运用了。
再次提醒:
别忘了wildcard的"扩展" + "重组" 这个重要特性,而且只作用在 argument的path上。
比方说, 假如当前目录下有: a.txt b.txt c.txt 1.txt 2.txt 3.txt 这几个文件。
当我们在命令行中执行ls -l [0-9].txt
的命令行时,
因为wildcard处于argument的位置上,
于是根据匹配的路径,扩展为: 1.txt 2.txt 3.txt,
在重组出ls -l 1.txt 2.txt 3.txt
这样的命令行。
因此,你在命令行上敲 ls -l [0-9].txt
与 ls -l 1.txt 2.txt 3.txt
输出的结果是一样,
原因就是在于此。