sort,tr,uniq,cut和正则表达式

2024-03-29 22:32
文章标签 正则表达式 sort tr cut uniq

本文主要是介绍sort,tr,uniq,cut和正则表达式,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

sort

概念

以行为单位对文件内容进行排序,也可以根据不同的数据类型来排序
sort 选项 参数
cat file | sort 选项

常用选项

-f:忽略大小写,默认会大写字母排在前面
-b:忽略每行前面的空格
-n:按照数字进行排序
-r:反向排序
-u:等同uniq,表示相同的数据仅显示一行,去重
-t:指定字段分隔符,默认使用tab键分隔
-k:指定排序字段
-o <输出文件>:将排序后的结果转存至指定文件
在这里插入图片描述

uniq

概述

用于报告或者忽略文件中连续的重复行,常与sort命令结合使用

常用选项

-c:进行计数,并删除文件中重复出现的行
-d:仅显示连续的重复行
-u:仅显示出现一次的行
在这里插入图片描述
在这里插入图片描述

tr

用于对来自标准输入的字符进行替换、压缩和删除

-c:保留字符集1的字符,其他的字符(包括换行符\n)用字符集2替换
-d:删除所有属于字符集1的字符
-s:将重复出现的字符串压缩为一个字符串,用字符集2 替换 字符集1
-t:字符集2 替换 字符集1,不加选项同结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

cut命令

显示行中的指定部分,删除文件中指定字段语法格式

常用选项
-f :通过指定哪一个字段进行提取。cut命令使用"T海B"作为默认的字段分隔符。
-d : "TAB”是默认的分隔符,使用此选项可以更改为其他的分隔符。
–complement :此选项用于排除所指定的字段。
–output-delimiter :更改输出内容的分隔符。

删除windows文件"’^M’字符

在这里插入图片描述
在这里插入图片描述

正则表达式

正则表达式是通过一些特殊字符的排序,用以删除、查找、替换一行或者多行文字字符串的程序。

字符类

在这里插入图片描述

数量限定符

在这里插入图片描述

这篇关于sort,tr,uniq,cut和正则表达式的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/859811

相关文章

Java中的正则表达式使用技巧

Java中的正则表达式使用技巧 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿!今天,我们来探讨一下Java中正则表达式的使用技巧。正则表达式是一种强大的工具,用于字符串匹配、替换和分割等操作。掌握正则表达式能够大大提高我们处理文本数据的效率。 1. 正则表达式的基本概念 正则表达式(Regular Expression,简称

js 正则表达式出现问题

帮同事写个页面,出现正则表达式不管怎么改都没法匹配的情况。。。。 reg = /^sy[0-9]+$/i; if(rtx.match(reg) == null){ alert("请输入正确的RTX账号!"); return false; } 因为之前一直用的是 reg ="/^sy[0-9]+$/i"; 写PHP写习惯了。。外面多写了两个双引号……T.T 改

shell的正则表达式

一、正则表达式:匹配的是文本内容(文本三剑客:grep:过滤文本内容       sed:针对文本内容进行增删改查        awk:按行取列) 二、grep:过滤 1.grep:过滤文本内容,作用就是使用正则表达式来匹配文本内容。    grep命令格式:grep -m 1 “bash”  /etc/passwd                             cat  /e

biostar handbook(六)|正则表达式和K-mers在模式匹配中的使用

模式匹配中的正则表达式和k-mer 模式匹配指的是在看似杂乱无章的系统中找到符合要求的部分。比如说你想从基因组中寻找motif,转录因子结合位点,CDS, 或者检测测序结果里是否有接头等,这些行为都可以解读为根据已有的模式去寻找目标序列中符合要求的片段。后面介绍的序列模式匹配的两种方法,正则表达式和k-mers。 正则表达式的基础概念 正则表达式(regular expression)的概念

常用命令: sort学习笔记

本文的sort命令是GNU版本(8.22), 和BSD的sort不同 sort是我最常用Linux命令之一,它的功能就是排序,一般后面还会和uniq搭配,对数据进行去重。 下面的操作假设你有一个文件,叫做chr.txt, 内容如下, 不同列之间用制表符分隔 Chr3 20251812 20254323 +Chr1 471971 473336 -Chr3

利用一个正则表达式的一个例子来讲解Java中的两种for循环。

package 正则表达式;public class Rudolph {public static void main(String[] args) {// TODO Auto-generated method stubString[] str = new String[]{"Rudolph","[rR]udolph","[rR][aeiou][a-z]ol.*","R.*"};for(Strin

编写一个正则表达式:检查一个句子是否以大写字母开头,以句号结尾.

package 正则表达式;import java.util.regex.Pattern;public class Test2 {public static void main(String[] args) {String len="^[A-Z].*[\\.]$";String s1="A line terminator.";String s2="Wangdan1600";String s3="a

正则表达式,linux文本三剑客

正则表达式匹配的是文本内容,linux的文本三剑客都是针对文本内容,按行进行匹配 文本三剑客: grep 过滤文本内容 sed 针对文本内容进行增删改查 awd 按行取列 一.grep命令 作用就是使用正则表达式来匹配文本内容 -m +数字:匹配几次之后停止 -v :取反 -n :显示匹配的行号 -c :只统计匹配的行数 -o :仅显示匹配的结果 -

验证输入的合法性正则表达式

验证数字的正则表达式集  验证数字:^[0-9]*$  验证n位的数字:^\d{n}$  验证至少n位数字:^\d{n,}$  验证m-n位的数字:^\d{m,n}$  验证零和非零开头的数字:^(0|[1-9][0-9]*)$  验证有两位小数的正实数:^[0-9]+(.[0-9]{2})?$  验证有1-3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$  验证非零的正整数:^\+

Elasticsearch wildcard 和 regexp 查询:使用通配符和正则表达式

在 Elasticsearch 中,当我们需要执行基于字符串模式的搜索时,wildcard 和 regexp 查询就派上了用场。这些查询类型允许我们根据通配符和正则表达式来匹配文档中的字段值。在本文中,我们将详细讨论这两种查询的用途、语法以及最佳实践。 一、wildcard 查询 wildcard 查询允许我们使用通配符 ?(匹配单个字符)和 *(匹配零个或多个字符)来执行基于模式的搜索。这对