《Linux命令行与shell脚本编程大全》 第二十章 学习笔记

本文主要是介绍《Linux命令行与shell脚本编程大全》 第二十章 学习笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

第一部分:Linux命令行
《Linux命令行与shell脚本编程大全》 第一章:初识Linux shell
《Linux命令行与shell脚本编程大全》 第二章:走进shell
《Linux命令行与shell脚本编程大全》 第三章:基本的bash shell命令
《Linux命令行与shell脚本编程大全》 第四章:更多的bash shell命令
《Linux命令行与shell脚本编程大全》 第五章:使用Linux环境变量
《Linux命令行与shell脚本编程大全》 第六章:理解Linux文件权限
《Linux命令行与shell脚本编程大全》 第七章:管理文件系统
《Linux命令行与shell脚本编程大全》 第八章:安装软件程序
《Linux命令行与shell脚本编程大全》 第九章:使用编辑器

第二部分:shell脚本编程基础
《Linux命令行与shell脚本编程大全》 第十章:构建基本脚本
《Linux命令行与shell脚本编程大全》 第十一章:使用结构化命令
《Linux命令行与shell脚本编程大全》 第十二章:更多的结构化命令
《Linux命令行与shell脚本编程大全》 第十三章:处理用户输入
《Linux命令行与shell脚本编程大全》 第十四章:呈现数据
《Linux命令行与shell脚本编程大全》 第十五章:控制脚本

第三部分:高级shell编程
《Linux命令行与shell脚本编程大全》 第十六章:创建函数
《Linux命令行与shell脚本编程大全》 第十七章:图形化桌面上的脚本编程
《Linux命令行与shell脚本编程大全》 第十八章:初识sed和gawk
《Linux命令行与shell脚本编程大全》 第十九章:正则表达式
《Linux命令行与shell脚本编程大全》 第二十章:sed进阶
《Linux命令行与shell脚本编程大全》 第二十一章:gawk进阶
《Linux命令行与shell脚本编程大全》 第二十二章:使用其他shell

第四部分:高级shell脚本编程主题
《Linux命令行与shell脚本编程大全》 第二十三章:使用数据库
《Linux命令行与shell脚本编程大全》 第二十四章:使用Web
《Linux命令行与shell脚本编程大全》 第二十五章:使用E-mail
《Linux命令行与shell脚本编程大全》 第二十六章:编写脚本实用工具
《Linux命令行与shell脚本编程大全》 第二十七章:shell脚本编程进阶


第二十章:sed进阶

 

多行命令

sed编辑器包含了3个可用来处理多行文本的命令

1.N:将数据流中的下一行加进来创建一个多行组来处理

2.D:删除多行组中的一行

3.P:打印多行组中的一行

next命令

单行的next命令

n命令会告诉sed编辑器移动到数据流中的下一文本行,而不用重新回到命令的最开始再执行一遍

通常sed编辑器会在移动到数据流中的下一文本行前在这行上执行所有定义好的命令。单行的next命令改变了这一流程

$ cat test.txt 
line1line2line3line4

如果我们想删除line1下面的空行,我们可以先找到line1,然后删除下面的那一行

$ sed -i '/line/{n;d}' test.txt 
$ cat test.txt 
line1
line2
line3line4

发现,不止是line1下面的那行被删除了,line2、line3下面的空白行也被删除了。sed执行完n之后的命令 ,还是要继续逐行扫描的,然后对符合要求的行进行操作。

所以我们得匹配的精确点

$ sed -i '/line1/{n;d}' test.txt 
suzhaoqiang@suzhaoqiang-OptiPlex-380:~/android/source/linux_learned$ cat test.txt 
line1
line2line3line4

合并文本行

单行next命令会将数据流中的下一文本行移动到sed编辑器的工作空间(称为模式空间,pattern space)

多行的next命令 会将下一文本行加到已经在模式空间中的文本上,文本行之间仍用换行分隔

$ cat test.txt 
line1
line2
line3
line4
line5

下面将前两行合并

$ sed -i '/line1/{N;s/\n/ /}' test.txt 
$ cat test.txt 
line1 line2
line3
line4
line5

如果想两行变成一行,那么:

$ sed -i '{N;s/\n/ /}' test.txt

多行删除命令

可以N与d配合使用,注意下面的结果:

$ cat test.txt 
line1
line2
line3
line4
line5
$ sed 'N;/line3/d' test.txt 
line1
line2
line5

发现把模式空间中的line3和line4都删除了

sed还提供D,可以只删除模式空间中的第一行

d清空模式空间

$ sed 'N;/line3/D' test.txt 
line1
line2
line4
line5

多行打印命令

p打印模式空间

P打印模式空间的第一行

$ cat test.txt 
line1
line2
line3
line4
line5
$ sed -n 'N;/line/p' test.txt 
line1
line2
line3
line4
$ sed -n 'N;/line/P' test.txt 
line1
line3

P只打印了模式空间中的第一行,p打印出模式空间中所有内容

 

保持空间

模式空间是sed的一块活动缓冲区,但并不是sed编辑器保存文本唯一空间

sed有一个叫做保持空间(hold space)的另一块缓冲区。可以在处理模式空间中其他行时用保持空间来临时保存一些行。

sed的保持空间命令

命令描述
h将模式空间复制到保持空间
H将模式空间附加到保持空间
g将保持空间复制到模式空间
G将保持空间附加到模式空间
x交换保持空间和模式空间的内容

一个练习,提取文本前两行,组合成line1,line2,line1形式

$ cat test.txt
line1
line2
line3
line4
line5
line6
$ sed -n '/line1/{h;p;n;p;g;p}' test.txt 
line1
line2
line1

先找到第一行,把第一行复制到保持空间,然后打印第一行。接着读取第二行,打印第二行,然后把保持空间复制到模式空间,再次打印模式空间。

我们可以简化一下过程

$ sed -n '1{h;N;G;p}' test.txt 
line1
line2
line1

寻址找到第一行,把第一行复制到保持空间,然后读取第二行追加到模式空间上,再把保持空间追加到模式空间上,最后一起打印。

 

排除命令

叹号命令用来排除命令,让原本会起作用的命令不起作用(我觉得书上的这句话只会误导人……)

man 写道
After the address (or address-range), and before the command, a ! may be inserted, which specifies that the command shall only be executed if the address (or
address-range) does not match.

在地址(或者一个范围)之后,命令之前,可以插入叹号(!),它指定了这个命令只能运行在地址(范围)之外的地方。

还是man讲的清楚一些。

不打印还有数字1,2,3的行

$ cat test.txt
line1
line2
line3
line4
line5
line6
$ sed -n '/[1-3]/!p' test.txt 
line4
line5
line6

下面看一个复杂点的例子,反转文本

1)首先sed读取第一行到模式空间,然后将其复制到保持空间中

2)然后sed读取第二行到模式空间,将保持空间追加到模式空间(模式空间现在为第二行、第一行),再将模式空间复制到保持空间中

然后不断重复步骤2),最后进行打印

$ sed -n '1!G;h;$p' test.txt 
line6
line5
line4
line3
line2
line1
$ tac test.txt
line6
line5
line4
line3
line2
line1

这里为了练习,所以使用sed,否则我们可以使用tac

$ tac test.txt
line6
line5
line4
line3
line2
line1

毕竟sed需要讲所有行都读取出来,然后才能打印,所以有这种工作的时候,不应该使用sed

 

改变流

通常,sed编辑器会从脚本的顶部开始执行命令并一直处理到脚本的结尾(D例外,它会强制sed编辑器返回到脚本顶部,而不是读取新行)

跳转(branch)

格式如下:

[address]b [label]

与叹号类似,b可以作用在一个范围上

label定义了要跳转到的位置,如果没有label,b将跳转到脚本的结尾。

$ sed '2,3b;s/line/Line/;s/Line/lines/' test.txt 
lines1
line2
line3
lines4
lines5
lines6

上面的脚本没有为b定义label,所以两个替换命令都执行了。

下面重写一下反转文本的例子

$ sed -n '1b test;G;:test h;$p' test.txt
line6
line5
line4
line3
line2
line1

上面为b定义了一个label叫做test

如果是第一行,那么就执行h;$p,否则执行G;h;$p

我们也可以用b命令实现简单的循环

下面是一个去掉逗号的例子:

$ echo "This, is, a, test, to, remove, commas." | sed -n '{:start;s/,//p;b start}'
This is, a, test, to, remove, commas.
This is a, test, to, remove, commas.
This is a test, to, remove, commas.
This is a test to, remove, commas.
This is a test to remove, commas.
This is a test to remove commas.

label可以定义在b的前面

现在这个例子就很容易理解了,找到逗号,然后删除,打印,然后跳转到脚本开头重复执行。

当所有逗号都删除了之后,循环依然没有停止,所以需要想办法让它在执行完任务就停止查找。

在重复之前,我们查找逗号,如果有,那么就重复执行。

$ echo "This, is, a, test, to, remove, commas." | sed -n '{:start;s/,//p;/,/b start}'
This is, a, test, to, remove, commas.
This is a, test, to, remove, commas.
This is a test, to, remove, commas.
This is a test to, remove, commas.
This is a test to remove, commas.
This is a test to remove commas.

现在就不会进入死循环了。

但是现在还有一个问题,就是我们只想要最终的结果怎么办?

也就是说,我们不能每次循环的时候都打印,只有在执行完任务的时候才需要打印。

$ echo "This, is, a, test, to, remove, commas." | sed -n '{:start;s/,//;/,/b start;p}'
This is a test to remove commas.

测试

类似跳转命令,测试命令(t)会基于替换命令的输出跳转到一个标签,而不是基于地址跳转到一个标签。

在没有指定标签的情况下,如果测试成功,sed会跳转到脚本的结尾。

$ cat test.txt 
line1
line2
line3
line4
line5
line6
$ sed 's/line[45]/Line/;t;s/line[0-9]/line/' test.txt 
line
line
line
Line
Line
line

如果第一个替换命令成功替换,那么t后面的命令就不再执行,否则执行。

下面改写上面删除逗号的例子:

$ echo "This, is, a, test, to, remove, commas." | sed -n '{:start;s/,//;t start;p}'
This is a test to remove commas.


模式替代

and符号

and符号(&)和正则里面的反向引用很相似。&用来代表替换命令中的匹配模式中匹配到的文本。

$ cat test.txt 
line1
line2
line3
line4
line5
line6
$ sed 's/[0-9]/0&/' test.txt 
line01
line02
line03
line04
line05
line06

替换单独的单词

下面的内容就和java正则里面的反向引用一模一样了。

$ sed 's/\([0-9]\)/0\1/' test.txt 
line01
line02
line03
line04
line05
line06

和java正则不同的是,这里的括号需要转义,正好与正则相反。

下面看看如何给一个数字添加千位分割符

$ echo "1234567" | sed ':start;s/\(.*[0-9]\)\([0-9]\{3\}\)/\1,\2/;t start'
1,234,567
$ echo "12345678" | sed ':start;s/\(.*[0-9]\)\([0-9]\{3\}\)/\1,\2/;t start'
12,345,678
$ echo "123456789" | sed ':start;s/\(.*[0-9]\)\([0-9]\{3\}\)/\1,\2/;t start'
123,456,789

代码看上去挺吓人的,这里圆括号和花括号都需要转义,转义之后的圆括号相当于分组,但是用反斜线+数字来引用,花括号转义之后相当于量词

这段代码的意思是:从开头查找连续的数字,前面的一组,后三个一组,然后在两组之间添加逗号

然后再次循环这段逻辑,由于之前在最后三个数字前面添加了括号,所以这次查找不会找到最后三个数字,这次的两组中的第二组是倒数第4、5、6个数字

我们来看一下java中如何实现这个功能:

String reg1 = "\\d(?=(\\d{3})+$)";
System.out.println("123456789".replaceAll(reg1, "$0,"));
System.out.println("12345678".replaceAll(reg1, "$0,"));
System.out.println("1234567".replaceAll(reg1, "$0,"));

输出:

123,456,789

12,345,678

1,234,567

 

在脚本中使用sed

使用包装脚本

可以包装一下之前写过的脚本

$ cat sed_test
#!/bin/bash
sed -n '1!G;h;$p' "$1"

方便之后的使用

$ cat test.txt
line1
line2
line3
line4
line5
line6
$ sed_test test.txt 
line6
line5
line4
line3
line2
line1

重定向sed的输出

默认,sed会将结果输出到STDOUT中,我们可以在shell中使用反引号将其输出定向到变量中。

 

创建sed实用工具

加倍行间距

$ cat test.txt
line1
line2
line3
$ sed '$!G' test.txt 
line1line2line3

保持空间默认只有一个空行,我们将其追加到模式空间即可

对可能含有空白行的文件加倍行间距

策略是先删除原来的空白行,然后在重复上面的工作即可。

$ sed '/^$/d;$!G' test.txt

给文件中行编号

$ cat test.txt
line1
line2
line3
$ sed '=' test.txt | sed 'N;s/\n/ /'
1 line1
2 line2
3 line3

先给出行号,然后消除行号与行直接的换行即可

打印末尾若干行

打印出最后一行很简单:

$ sed -n '$p' test.txt

打印末尾三行呢?

“滚动窗口(rolling window)”是检验模式空间中文本行组成的块的常用方法。

以打印最后三行为例:

$ cat test.txt 
line1
line2
line3
line4
line5
line6
line7
line8
line9
$ sed ':start;$q;N;4,$D;b start' test.txt 
line7
line8
line9

1.如果当前是最后一行,退出

2.读取下一行

3.如果当前行的行号在3之后,那么就删除模式空间中的第一行

4.重复上面的操作

这里sed会先读取前三行,读取第四行之后,删除第一行,读取第五行之后,删除第二行……

注意:如果当前行在4,$中,那么就执行D

如果我们想除了前三行,其余行都打印,那么可以这样:

$ sed ':start;$q;N;1,4D;b start' test.txt 
line4
line5
line6
line7
line8
line9

删除行

删除连续的空白行

关键在于如何找到空行与非空行的交界处

$ sed '/./,/^$/!d' test.txt

点能匹配到非空行,非空行与第一个空行直接的行不删除,其余行删除即可。

当然,这里如果开头有空行,也会被删除掉的

删除开头的空白行

$ sed '/./,$!d' test.txt

这个就比较简单了,从第一个非空行到最后一行,不删除,其余的全删除即可。

删除结尾的空白行

$ sed '{
> :start
> /^\n*$/{$d;N;b start}
> }' test.txt

注意:这里有两层花括号,中间的花括号只作用在前面指定的行上,可以看作是一组命令

如果当前行是空行,那么模式匹配成功,进入括号中的命令组

如果是最后一行,那么删除,否定读取下一行到模式空间,然后重复上面的步骤

如果读取的行不是空行,那么模式匹配失败,不再进入后面的命令组,sed继续处理下一行

删除HTML标签

在sed中,没有惰性匹配,所有我们不能使用.*?这种形式,当然,下面这种直白的贪婪模式也肯定是错的

$ sed 's/<.*>//g' test.html

我们简单的模拟一下惰性匹配:
$ sed 's/<[^>]*>//g' test.html
最后,如果你愿意,可以加一个删除空行的处理:
$ sed 's/<[^>]*>//g;/^$/d' test.html



转贴请保留以下链接

本人blog地址

http://su1216.iteye.com/

http://blog.csdn.net/su1216/

这篇关于《Linux命令行与shell脚本编程大全》 第二十章 学习笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/694478

相关文章

Java使用ANTLR4对Lua脚本语法校验详解

《Java使用ANTLR4对Lua脚本语法校验详解》ANTLR是一个强大的解析器生成器,用于读取、处理、执行或翻译结构化文本或二进制文件,下面就跟随小编一起看看Java如何使用ANTLR4对Lua脚本... 目录什么是ANTLR?第一个例子ANTLR4 的工作流程Lua脚本语法校验准备一个Lua Gramm

Linux内核参数配置与验证详细指南

《Linux内核参数配置与验证详细指南》在Linux系统运维和性能优化中,内核参数(sysctl)的配置至关重要,本文主要来聊聊如何配置与验证这些Linux内核参数,希望对大家有一定的帮助... 目录1. 引言2. 内核参数的作用3. 如何设置内核参数3.1 临时设置(重启失效)3.2 永久设置(重启仍生效

kali linux 无法登录root的问题及解决方法

《kalilinux无法登录root的问题及解决方法》:本文主要介绍kalilinux无法登录root的问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,... 目录kali linux 无法登录root1、问题描述1.1、本地登录root1.2、ssh远程登录root2、

shell编程之函数与数组的使用详解

《shell编程之函数与数组的使用详解》:本文主要介绍shell编程之函数与数组的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录shell函数函数的用法俩个数求和系统资源监控并报警函数函数变量的作用范围函数的参数递归函数shell数组获取数组的长度读取某下的

SpringShell命令行之交互式Shell应用开发方式

《SpringShell命令行之交互式Shell应用开发方式》本文将深入探讨SpringShell的核心特性、实现方式及应用场景,帮助开发者掌握这一强大工具,具有很好的参考价值,希望对大家有所帮助,如... 目录引言一、Spring Shell概述二、创建命令类三、命令参数处理四、命令分组与帮助系统五、自定

Spring Shell 命令行实现交互式Shell应用开发

《SpringShell命令行实现交互式Shell应用开发》本文主要介绍了SpringShell命令行实现交互式Shell应用开发,能够帮助开发者快速构建功能丰富的命令行应用程序,具有一定的参考价... 目录引言一、Spring Shell概述二、创建命令类三、命令参数处理四、命令分组与帮助系统五、自定义S

Linux ls命令操作详解

《Linuxls命令操作详解》通过ls命令,我们可以查看指定目录下的文件和子目录,并结合不同的选项获取详细的文件信息,如权限、大小、修改时间等,:本文主要介绍Linuxls命令详解,需要的朋友可... 目录1. 命令简介2. 命令的基本语法和用法2.1 语法格式2.2 使用示例2.2.1 列出当前目录下的文

利用Python快速搭建Markdown笔记发布系统

《利用Python快速搭建Markdown笔记发布系统》这篇文章主要为大家详细介绍了使用Python生态的成熟工具,在30分钟内搭建一个支持Markdown渲染、分类标签、全文搜索的私有化知识发布系统... 目录引言:为什么要自建知识博客一、技术选型:极简主义开发栈二、系统架构设计三、核心代码实现(分步解析

Linux中的计划任务(crontab)使用方式

《Linux中的计划任务(crontab)使用方式》:本文主要介绍Linux中的计划任务(crontab)使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、前言1、linux的起源与发展2、什么是计划任务(crontab)二、crontab基础1、cro

Oracle数据库常见字段类型大全以及超详细解析

《Oracle数据库常见字段类型大全以及超详细解析》在Oracle数据库中查询特定表的字段个数通常需要使用SQL语句来完成,:本文主要介绍Oracle数据库常见字段类型大全以及超详细解析,文中通过... 目录前言一、字符类型(Character)1、CHAR:定长字符数据类型2、VARCHAR2:变长字符数