《Linux命令行与shell脚本编程大全》 第十九章 学习笔记

本文主要是介绍《Linux命令行与shell脚本编程大全》 第十九章 学习笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

第一部分:Linux命令行
《Linux命令行与shell脚本编程大全》 第一章:初识Linux shell
《Linux命令行与shell脚本编程大全》 第二章:走进shell
《Linux命令行与shell脚本编程大全》 第三章:基本的bash shell命令
《Linux命令行与shell脚本编程大全》 第四章:更多的bash shell命令
《Linux命令行与shell脚本编程大全》 第五章:使用Linux环境变量
《Linux命令行与shell脚本编程大全》 第六章:理解Linux文件权限
《Linux命令行与shell脚本编程大全》 第七章:管理文件系统
《Linux命令行与shell脚本编程大全》 第八章:安装软件程序
《Linux命令行与shell脚本编程大全》 第九章:使用编辑器

第二部分:shell脚本编程基础
《Linux命令行与shell脚本编程大全》 第十章:构建基本脚本
《Linux命令行与shell脚本编程大全》 第十一章:使用结构化命令
《Linux命令行与shell脚本编程大全》 第十二章:更多的结构化命令
《Linux命令行与shell脚本编程大全》 第十三章:处理用户输入
《Linux命令行与shell脚本编程大全》 第十四章:呈现数据
《Linux命令行与shell脚本编程大全》 第十五章:控制脚本

第三部分:高级shell编程
《Linux命令行与shell脚本编程大全》 第十六章:创建函数
《Linux命令行与shell脚本编程大全》 第十七章:图形化桌面上的脚本编程
《Linux命令行与shell脚本编程大全》 第十八章:初识sed和gawk
《Linux命令行与shell脚本编程大全》 第十九章:正则表达式
《Linux命令行与shell脚本编程大全》 第二十章:sed进阶
《Linux命令行与shell脚本编程大全》 第二十一章:gawk进阶
《Linux命令行与shell脚本编程大全》 第二十二章:使用其他shell

第四部分:高级shell脚本编程主题
《Linux命令行与shell脚本编程大全》 第二十三章:使用数据库
《Linux命令行与shell脚本编程大全》 第二十四章:使用Web
《Linux命令行与shell脚本编程大全》 第二十五章:使用E-mail
《Linux命令行与shell脚本编程大全》 第二十六章:编写脚本实用工具
《Linux命令行与shell脚本编程大全》 第二十七章:shell脚本编程进阶


第十九章:正则表达式

 

由于之前我已经写过比较详尽的正则教程

深入入门正则表达式(java) - 引言

深入入门正则表达式(java) - 1 - 入门基础 
深入入门正则表达式(java) - 2 - 基本实例

深入入门正则表达式(java) - 3 - 正则在java中的使用

深入入门正则表达式(java) - 匹配原理 - 1 - 引擎分类与普适原则

深入入门正则表达式(java) - 匹配原理 - 2 - 回溯

并且在Unix & Linux 大学教程中的第20章也有笔记,所以这里笔记较为简略,一些简单的示例在这里就不在演示了。

 

什么是正则表达式

定义

正则表达式类型

Linux中,有两种流行的正则表达式引擎:

1.POSIX基本正则表达式(BRE)引擎

2.POSIX扩展正则表达式(ERE)引擎

大多数Linux工具至少符合BRE引擎规范,能够识别所有模式和符号。

一些工具,比如sed只实现了BRE引擎规范的子集。gawk实现了ERE引擎。

 

定义BRE模式

纯文本

特殊字符

斜线(/)不是正则的元字符,但是在sed和gawk中使用,也需要转义

锚字符

下面利用锚点来删除空白行

$ cat test.txt 
A:11221133
B:44115522line 5
$ sed '/^$/d' test.txt 
A:11221133
B:44115522
line 5

(并不是所有程序都可以这么干的)

点字符

字符组

排除字符组

使用区间

特殊字符组

BRE特殊字符组

含义类似于
[[:lower:]]小写字母a-z
[[:upper:]]大写字母A-Z
[[:alpha:]]大小写字母a-zA-Z
[[:alnum:]]大小写字母、数字a-zA-Z0-9
[[:digit:]]数字0-9
[[:punct:]]标点符号-- 
[[:print:]]匹配任意可打印字符--
[[:blank:]]空格或制表符(空白符)--
[[:space:]]匹配任意空白字符空格、制表符、NL、FF、VT和CR

一个简单的示例:

$ cat test.txt 
A:11221133
B:44115522line 5
$ sed -n '/[[:digit:]]/p' test.txt 
A:11221133
B:44115522
line 5

这里使用\d是无效的

星号

 

扩展正则表达式

问号

加号

花括号

警告:默认情况下,gawk不识别表达式区间,必须指定--re-interval选项

注意:gawk只支持下面几种形式

{m},{m,n},{m,}

并不支持{,m}

管道符号

聚合表达式

 

实用中的正则表达式

目录文件计数

也和书中一样,我们统计$PATH中的目录含有的文件数目。

其实这里关键的就是把$PATH里的目录变成数组参数而已。

下面是书中的例子,不过这个例子是有问题的:

$ echo $PATH | sed 's/:/ /g'

代码很容易理解。环境变量PATH中的目录是用冒号分割的,现在利用sed,改为空格分割路径,这样就可以直接对此使用循环了。

但是,PATH中的目录是允许重复的!也就是说,你可以把同一个目录多次的加入到这个变量中(虽然这么做没有半点好处),当然,很有可能是其他软件设置的PATH与你自己设置的重复了。不管怎样,我们是不需要重复统计的。

下面是修正后的代码:

echo $PATH | sed 's/:/\n/g' | sort | uniq

这里用换行替换冒号,这样也能直接对此结果使用循环。这么做的好处就是,我们可以使用sort然后使用uniq去重复

验证电话号码

解析邮件地址

 

关于正则更多内容,可以参考我之前的写的教程,里面有详尽的正则基础讲解以及示例。

深入入门正则表达式(java) - 引言

深入入门正则表达式(java) - 1 - 入门基础 
深入入门正则表达式(java) - 2 - 基本实例

深入入门正则表达式(java) - 3 - 正则在java中的使用

深入入门正则表达式(java) - 匹配原理 - 1 - 引擎分类与普适原则

深入入门正则表达式(java) - 匹配原理 - 2 - 回溯

《Unix & Linux 大学教程》 - 第二十章 正则表达式

 

 

转贴请保留以下链接

本人blog地址

http://su1216.iteye.com/

http://blog.csdn.net/su1216/

这篇关于《Linux命令行与shell脚本编程大全》 第十九章 学习笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/694476

相关文章

Linux中的计划任务(crontab)使用方式

《Linux中的计划任务(crontab)使用方式》:本文主要介绍Linux中的计划任务(crontab)使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、前言1、linux的起源与发展2、什么是计划任务(crontab)二、crontab基础1、cro

Oracle数据库常见字段类型大全以及超详细解析

《Oracle数据库常见字段类型大全以及超详细解析》在Oracle数据库中查询特定表的字段个数通常需要使用SQL语句来完成,:本文主要介绍Oracle数据库常见字段类型大全以及超详细解析,文中通过... 目录前言一、字符类型(Character)1、CHAR:定长字符数据类型2、VARCHAR2:变长字符数

微信公众号脚本-获取热搜自动新建草稿并发布文章

《微信公众号脚本-获取热搜自动新建草稿并发布文章》本来想写一个自动化发布微信公众号的小绿书的脚本,但是微信公众号官网没有小绿书的接口,那就写一个获取热搜微信普通文章的脚本吧,:本文主要介绍微信公众... 目录介绍思路前期准备环境要求获取接口token获取热搜获取热搜数据下载热搜图片给图片加上标题文字上传图片

Linux换行符的使用方法详解

《Linux换行符的使用方法详解》本文介绍了Linux中常用的换行符LF及其在文件中的表示,展示了如何使用sed命令替换换行符,并列举了与换行符处理相关的Linux命令,通过代码讲解的非常详细,需要的... 目录简介检测文件中的换行符使用 cat -A 查看换行符使用 od -c 检查字符换行符格式转换将

Linux系统配置NAT网络模式的详细步骤(附图文)

《Linux系统配置NAT网络模式的详细步骤(附图文)》本文详细指导如何在VMware环境下配置NAT网络模式,包括设置主机和虚拟机的IP地址、网关,以及针对Linux和Windows系统的具体步骤,... 目录一、配置NAT网络模式二、设置虚拟机交换机网关2.1 打开虚拟机2.2 管理员授权2.3 设置子

揭秘Python Socket网络编程的7种硬核用法

《揭秘PythonSocket网络编程的7种硬核用法》Socket不仅能做聊天室,还能干一大堆硬核操作,这篇文章就带大家看看Python网络编程的7种超实用玩法,感兴趣的小伙伴可以跟随小编一起... 目录1.端口扫描器:探测开放端口2.简易 HTTP 服务器:10 秒搭个网页3.局域网游戏:多人联机对战4.

Linux系统中卸载与安装JDK的详细教程

《Linux系统中卸载与安装JDK的详细教程》本文详细介绍了如何在Linux系统中通过Xshell和Xftp工具连接与传输文件,然后进行JDK的安装与卸载,安装步骤包括连接Linux、传输JDK安装包... 目录1、卸载1.1 linux删除自带的JDK1.2 Linux上卸载自己安装的JDK2、安装2.1

Java并发编程必备之Synchronized关键字深入解析

《Java并发编程必备之Synchronized关键字深入解析》本文我们深入探索了Java中的Synchronized关键字,包括其互斥性和可重入性的特性,文章详细介绍了Synchronized的三种... 目录一、前言二、Synchronized关键字2.1 Synchronized的特性1. 互斥2.

Linux卸载自带jdk并安装新jdk版本的图文教程

《Linux卸载自带jdk并安装新jdk版本的图文教程》在Linux系统中,有时需要卸载预装的OpenJDK并安装特定版本的JDK,例如JDK1.8,所以本文给大家详细介绍了Linux卸载自带jdk并... 目录Ⅰ、卸载自带jdkⅡ、安装新版jdkⅠ、卸载自带jdk1、输入命令查看旧jdkrpm -qa

Linux samba共享慢的原因及解决方案

《Linuxsamba共享慢的原因及解决方案》:本文主要介绍Linuxsamba共享慢的原因及解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux samba共享慢原因及解决问题表现原因解决办法总结Linandroidux samba共享慢原因及解决