shell中字符串的截取方法、cut基本用法

2024-04-02 08:32

本文主要是介绍shell中字符串的截取方法、cut基本用法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、八种基本字符截取方法:
1、使用 # 号操作符。从左边删除第一次出现 substr 左边字符(包括substr ),保留右边字符。
用法为 #*substr
例如:



即删除从左边开始到第一个"//"及其左边所有字符
2、使用 ## 号操作符。从左边删除最后一次出现substr 左边字符(包括substr ),保留右边字符。
用法为 ##*subst
例如:



即删除最后出现的"/"及其左边所有字符
3、使用 % 号操作符。从右边删除第一次出现 substr 右边字符(包括substr ),保留左边字符。
用法为 %substr
例如:



即删除从右边开始到第一个"/"及其右边所有字符
4、使用 %% 号操作符。从右边删除最后一次出现 substr 右边字符(包括substr ),保留左边字符。
用法为 %%substr*
例如:



即删除从右边开始到最后一个"/"及其右边所有字符
5、从左边第几个字符开始以及字符的个数
用法为 :start:len
例如:



即 0 表示左边第一个字符开始,5 表示字符的总个数。
6、从左边第几个字符开始一直到结束
用法为 :start
例如:



即 7 表示左边第8个字符开始
7、从右边第几个字符开始以及字符的个数
用法为 :0-start:len
例如:



即 0-10 表示右边算起第10个字符开始,6 表示字符的个数。
8、从右边第几个字符开始一直到结束
用法为 :0-start
例如:



即 0-4 表示右边算起第4个字符开始。

二、使用 cut 进行字符串截取
cut 命令接受三个定位方法:
1、字节(bytes),用选项-b;
2、字符(characters),用选项-c;
3、域(fields),用选项-f。

三、字节 -b 的使用
(1) 以“字节”定位
例如:
如果我们想提取每一行的第3个字节,就这样:





注:-b后面可以设定要提取哪一个字节,其实-b和3之间没有空格也是可以的,但推荐有空格 :)

(2) 如果“字节”定位中,我想提取第3,第4、第5和第12个字节
-b支持形如3-5的写法,而且多个定位之间用逗号隔开就成了。
例如:





但有一点要 注意,cut命令如果使用了-b选项,那么执行此命令时,cut会先把-b后面所有的定位进行从小到大排序,然后再提取。可不能颠倒定位的顺序哦。
例如:




(3)类似于“3-5”这样的小技巧
例如:





注:-3表示从第一个字节到第三个字节,而3-表示从第三个字节到行尾。可以看到这两种情况下,都包括了第三个字节“e”。如果执行who|cut -b -3,3-,是输出整行,而不会出现连续两个重叠的e的。

四、字符 -c 的使用
例如:





但是,-c 和 -b 怎么没有区别呢? 其实不然,只是因为这个例子举的不好,所以看不出来,who 输出的都是单字节字符,所以用-b和-c没有区别,如果提取中文,区别就出来了。
例如:





如上,用 -c 则会以字符为单位,输出正常;而 -b 只会以字节(8位二进制位)来计算,输出就是乱码。当遇到多字节字符时,可以使用 -n 选项,-n 用于告诉 cut 不要将多字节字符拆开。
例如:






五、域 -f 是怎么回事呢?
(1)为什么会有“域”的提取呢,因为刚才提到的 -b 和 -c 只能在固定格式的文档中提取信息,而对于非固定格式的信息则束手无策,而“域”可以。
比如/etc/passwd文件,它并不像 who 的输出信息那样具有固定格式,而是比较零散的排放。但是,冒号在这个文件的每一行中都起到了非常重要的作用,冒号用来隔开每一个项。
cut命令提供了这样的提取方式,具体的说就是设置“间隔符”,再设置“提取第几个域”,就OK了。
例如(/etc/passwd的前五行内容):





用 -d 设置间隔符为冒号:,然后用 -f 设置要取的是第一个域。
(2)在设定 -f 时,也可以使用 3-5 或者 4- 类似的格式:






(3)如果遇到空格和制表符时,怎么办?
有时候制表符确实很难辨认,有一个方法可以看出一段空格到底是由若干个空格组成的还是由一个制表符组成的。





如果是制表符(TAB),那么会显示为 /t 符号,如果是空格,就会原样显示。通过此方法就可以判断制表符和空格了。
应该在cut -d中用什么符号来设定制表符或空格呢?其实,cut 的 -d 选项的默认间隔符就是制表符/t,所以当你就是要使用制表符的时候,完全就可以省略-d选项,而直接用-f来取域就可以了。
例如:



这篇关于shell中字符串的截取方法、cut基本用法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/869486

相关文章

Nginx设置连接超时并进行测试的方法步骤

《Nginx设置连接超时并进行测试的方法步骤》在高并发场景下,如果客户端与服务器的连接长时间未响应,会占用大量的系统资源,影响其他正常请求的处理效率,为了解决这个问题,可以通过设置Nginx的连接... 目录设置连接超时目的操作步骤测试连接超时测试方法:总结:设置连接超时目的设置客户端与服务器之间的连接

Java中String字符串使用避坑指南

《Java中String字符串使用避坑指南》Java中的String字符串是我们日常编程中用得最多的类之一,看似简单的String使用,却隐藏着不少“坑”,如果不注意,可能会导致性能问题、意外的错误容... 目录8个避坑点如下:1. 字符串的不可变性:每次修改都创建新对象2. 使用 == 比较字符串,陷阱满

Java判断多个时间段是否重合的方法小结

《Java判断多个时间段是否重合的方法小结》这篇文章主要为大家详细介绍了Java中判断多个时间段是否重合的方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录判断多个时间段是否有间隔判断时间段集合是否与某时间段重合判断多个时间段是否有间隔实体类内容public class D

Python使用国内镜像加速pip安装的方法讲解

《Python使用国内镜像加速pip安装的方法讲解》在Python开发中,pip是一个非常重要的工具,用于安装和管理Python的第三方库,然而,在国内使用pip安装依赖时,往往会因为网络问题而导致速... 目录一、pip 工具简介1. 什么是 pip?2. 什么是 -i 参数?二、国内镜像源的选择三、如何

IDEA编译报错“java: 常量字符串过长”的原因及解决方法

《IDEA编译报错“java:常量字符串过长”的原因及解决方法》今天在开发过程中,由于尝试将一个文件的Base64字符串设置为常量,结果导致IDEA编译的时候出现了如下报错java:常量字符串过长,... 目录一、问题描述二、问题原因2.1 理论角度2.2 源码角度三、解决方案解决方案①:StringBui

Linux使用nload监控网络流量的方法

《Linux使用nload监控网络流量的方法》Linux中的nload命令是一个用于实时监控网络流量的工具,它提供了传入和传出流量的可视化表示,帮助用户一目了然地了解网络活动,本文给大家介绍了Linu... 目录简介安装示例用法基础用法指定网络接口限制显示特定流量类型指定刷新率设置流量速率的显示单位监控多个

Java覆盖第三方jar包中的某一个类的实现方法

《Java覆盖第三方jar包中的某一个类的实现方法》在我们日常的开发中,经常需要使用第三方的jar包,有时候我们会发现第三方的jar包中的某一个类有问题,或者我们需要定制化修改其中的逻辑,那么应该如何... 目录一、需求描述二、示例描述三、操作步骤四、验证结果五、实现原理一、需求描述需求描述如下:需要在

JavaScript中的reduce方法执行过程、使用场景及进阶用法

《JavaScript中的reduce方法执行过程、使用场景及进阶用法》:本文主要介绍JavaScript中的reduce方法执行过程、使用场景及进阶用法的相关资料,reduce是JavaScri... 目录1. 什么是reduce2. reduce语法2.1 语法2.2 参数说明3. reduce执行过程

C#中读取XML文件的四种常用方法

《C#中读取XML文件的四种常用方法》Xml是Internet环境中跨平台的,依赖于内容的技术,是当前处理结构化文档信息的有力工具,下面我们就来看看C#中读取XML文件的方法都有哪些吧... 目录XML简介格式C#读取XML文件方法使用XmlDocument使用XmlTextReader/XmlTextWr

C++初始化数组的几种常见方法(简单易懂)

《C++初始化数组的几种常见方法(简单易懂)》本文介绍了C++中数组的初始化方法,包括一维数组和二维数组的初始化,以及用new动态初始化数组,在C++11及以上版本中,还提供了使用std::array... 目录1、初始化一维数组1.1、使用列表初始化(推荐方式)1.2、初始化部分列表1.3、使用std::