sed:(Stream Editor)流编辑器。它是行编辑器,处理纯ASCII码文本,实现逐行进行处理文本。
sed编辑特性
它并不直接处理文本文件本身,处理文件时逐行读取,把符合模式条件的行读取到内存空间中,而后在内存中完成编辑,并且把编辑的结果输出到屏幕上。内存空间又称为模式空间。处理文本是做模式过滤,符合模式条件文本进行处理,不符合的不予处理。sed还有一种叫保留空间,属于高级功能。
sed默认不编辑原文件,仅对模式空间中的数据做处理,处理完成后,将模式空间中的内容打印至屏幕
(全屏编辑器:vi)
sed语法格式
sed [options] 'AddressCommand' file1 file2 ...
注意:地址和编辑命令之间不需要加空格
选项:
-n:静默模式,只把经过sed命令处理的行输出到屏幕
-i: 将修改直接写入原文件,而不是输出到屏幕
-e SCRIPT -e SCRIPT:可以同时执行多个脚本(sed的地址和编辑命令称为脚本)
-f 脚本文件名: 从sed脚本中读入sed操作
-r: 表示使用扩展正则表达式
地址(Address)界定表示方法
- StartLine,EndLine 起始行和结束行用逗号隔开,
例:1,100表示从第一行到第100行
$ :表示最后一行
$-1:表示倒数第二行
- /RegExp/ 使用正则表达式来指定模式,用双斜杠将模式包含在内,这里的模式就是正则表达式。
例:/^root/ 匹配所处理文件中所有以root开头的行
/pattern1/,/pattern2/ 模式1,模式2
这种方式表示从第一次被模式1匹配的行开始,至第一次由模式2匹配的行结束,这中间的所有行LineNumber 指定行号,精确匹配某行
StartLine,+N
从startline开始,向后的N行。
命令(Command)
d: 删除符合条件的行
p: 显示符合条件的行
a \string: 在指定的行后面追加新行,内容为“string(字符串)”,字符串中间如果有空格,需要用双引号包含
\n: 可以用于换行
i \string: 在指定的行前面添加新行,内容为string
r FILE(文件名): 将指定的文件的内容添加至符合条件的行处
例:sed '3r /etc/issue' /etc/fstab
w FILE(文件名):将指定范围内的内容另存至指定的文件中
例:sed '/^#/w a.txt' anaconda-ks.cfg
s/pattern/string/: 查找并替换,默认只替换每行中第一次被模式匹配到的字符串,格式:“行范围s/旧字符/新字符/”
加修饰符:
s/pattern/string/修饰符:
修饰符
g:全局替换
i: 查找时忽略字符大小写
例:df -h | sed 's/\//#/g'
//将全文的"/"替换为“#”
注:s命令后的分割符不仅限于“/”,可以换为3个#号或3个@符号,只要是3个同样的符号即可
例:[root@cgy12 ~]# df -h | sed 's$/$#$g'
Filesystem Size Used Avail Use% Mounted on
#dev#sda3 8.7G 3.8G 4.5G 47% #
tmpfs 295M 0 295M 0% #dev#shm
#dev#sda1 194M 34M 151M 19% #boot
后项引用
\{\},\1,\2
&:引用模式匹配到的整个字符串
l..e : like-->liker
love-->lover
例:[root@cgy15 ~]# sed 's/l..e/&r/' test.txt
hello liker
hello lover
//匹配以l开头,e结尾,中间任意两个字符的字符串;将匹配到的字符串后面加上r
或者还可以这样:
例:[root@cgy15 ~]# sed 's%\(l..e\)%\1r%' test.txt
hello liker
hello lover
将做如下修改:
like-->Like
love-->Love
例:[root@cgy15 ~]# sed 's#l\(..e\)#L\1#' test.txt
hello Like
hello Love
tr命令的用法
[root@cgy15 ~]# tr --help
用法:tr [选项]... SET1 [SET2]
从标准输入中替换、缩减和/或删除字符,并将结果写到标准输出。
-c, -C, --complement 首先补足SET1
-d, --delete 删除匹配SET1 的内容,并不作替换
-s, --squeeze-repeats 如果匹配于SET1 的字符在输入序列中存在连续的
重复,在替换时会被统一缩为一个字符的长度
-t, --truncate-set1 先将SET1 的长度截为和SET2 相等
--help 显示此帮助信息并退出
--version 显示版本信息并退出
SET 是一组字符串,一般都可按照字面含义理解。解析序列如下:
\NNN 八进制值为NNN 的字符(1 至3 个数位)
\\ 反斜杠
\a 终端鸣响
\b 退格
\f 换页
\n 换行
\r 回车
\t 水平制表符
\v 垂直制表符
字符1-字符2 从字符1 到字符2 的升序递增过程中经历的所有字符
[字符*] 在SET2 中适用,指定字符会被连续复制直到吻合设置1 的长度
[字符*次数] 对字符执行指定次数的复制,若次数以 0 开头则被视为八进制数
[:alnum:] 所有的字母和数字
[:alpha:] 所有的字母
[:blank:] 所有呈水平排列的空白字符
[:cntrl:] 所有的控制字符
[:digit:] 所有的数字
[:graph:] 所有的可打印字符,不包括空格
[:lower:] 所有的小写字母
[:print:] 所有的可打印字符,包括空格
[:punct:] 所有的标点字符
[:space:] 所有呈水平或垂直排列的空白字符
[:upper:] 所有的大写字母
[:xdigit:] 所有的十六进制数
[=字符=] 所有和指定字符相等的字符