sed命令替换换行符

本文编写于3404天前,最后编辑于 3404天前,部分内容可能已经过时,请您自行斟酌确认。

sed流编辑器是shell中处理文本内容的一大利器。sed命令从文本流中读取一行文本到模式空间中进行相应的命令、或脚本处理,因此在处理换行符时会有点特殊。

下面的命令可以很正确的执行:

echo "a,b,c,d" |sed 's/,/\n/g'

但是如果我想恢复回来,下面的命令却没有效果了:

echo "a,b,c,d" |sed 's/,/\n/g'|sed 's/\n/,/g'

这跟sed的行处理方式有关,sed读取一行时,会先把换行符去掉,处理完后再添加上,所以是无法使用上面的命令进行换行符替换的,必须使用sed中的其它命令来完成。上面的恢复可以使用tr命令:

echo "a,b,c,d" |sed 's/,/\n/g'|tr -t '\n' ','

下面是网上找到的一些用法,经实践效果是各不相同的,只有一种是完全可行的。

sed ':label;N;s/\n/:/;b label' filename

sed ':label;N;s/\n/:/;t label' filename

上面的两条命令可以实现将文件中的所有换行符替换为指定的字串,如命令中的冒号。命令的解释:
:label; 这是一个标签,用来实现跳转处理,名字可以随便取(label),后面的b label就是跳转指令
N; N是sed的一个处理命令,追加文本流中的下一行到模式空间进行合并处理,因此是换行符可见
s/\n/:/; s是sed的替换命令,将换行符替换为冒号
b label 或者 t label b / t 是sed的跳转命令,跳转到指定的标签处
标签跳转和N的追加命令实现了每一行的不间断放入模式处理空间,从而不会漏掉每一个换行符,而没有标签的话跳转的话,就只能每两行替换掉一个换行符,对比效果:

echo "a,b,c,d" |sed 's/,/\n/g'|sed ':x;N;s/\n/,/;b x'
a,b,c,d
echo "a,b,c,d" |sed 's/,/\n/g'|sed 'N;s/\n/,/'
a,b
c,d

还有如下的一种命令的处理效果,也是无法实现换行符的替换。事实上$符号在sed中表示文本流中的最后一行,下面的处理结果我并不是很理解。

echo "a,b,c,d" |sed 's/,/\n/g'|sed 's/$/,/'
a,
b,
c,
d,

PS:sed中的n命令和~地址表示

sed '8,80{n;n;n;d}' filename

n表示读取文本流中的下一行到模式空间(N为追加),sed还是只处理一行。上面的命令理解:从第8行起(包含),一次读取9/10/11行,然后读取11行后,执行d命令,就是删除处理空间中的第11行,之后从12行开始,读取13/14/15, 删除15行,以此类推,直到第80行。

sed '11~4d' filename

该命令实现和上一个命令同样的功能,唯一的差别就是它直到文件结束,而无法指定结束行。

发表评论

电子邮件地址不会被公开。 必填项已用 * 标注