Linux 文件管理命令Lawk wc comm join fmt

2024-05-01 19:52

本文主要是介绍Linux 文件管理命令Lawk wc comm join fmt,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

    • 2.Linux 文件管理命令
    • 2.44 awk:模式匹配语言
      • 1.变量
      • 2.运算符
      • 3.awk 的正则
      • 4.字符串函数
      • 5.数学函数
      • 案例练习
    • 2.45 wc:输出文件中的行数、单词数、字节数
    • 案例练习
    • 2.46 comm:比较排序文件
      • 案例练习
    • 2.47 join:将两个文件中指定栏位内容相同的行连接起来
    • 2.48 fmt:编排文本文件

2.Linux 文件管理命令

2.44 awk:模式匹配语言

  • 作用:利用一组用户提供的命令来将一组文件和用户提供的扩展正则表达式进行比较,一 次一行,然后在任何与扩展正则表达式匹配的行上执行操作。

  • 用法:

    awk [options] 'script' var=value file(s)

    awk [options] -f scriptfile var=value file(s)

主要选项如下:

命令描述
-F fs or --field-separator fs指定输入文件的分隔符,fs 是一个字符串或是一个正则表达式,如-F:。
-v var=value or --asign var=value赋值一个用户定义变量。
-f scripfile or --file scriptfile从脚本文件中读取 awk 命令。
-mf nnn and -mr nnn对 nnn 值设置内在限制,-mf 选项限制分配给 nnn 的最大块数目;-mr 选项限制记录的最大数目。这两个功能是 Bell 实验室版 awk 的扩展功能,在标准 awk中不适用。
-W compact or --compat, -W traditional or –traditional在兼容模式下运行 awk。所以 gawk的行为和标准的 awk 完全一样,所有的 awk 扩展都被忽略。
-W copyleft or --copyleft, -W copyright or –copyright打印简短的版权信息。
-W help or --help, -W usage or –usage打印全部 awk 选项和每个选项的简短说明。
-W lint or –lint打印不能向传统 UNIX 平台移植的结构的警告。
-W lint-old or --lint-old打印关于不能向传统 UNIX 平台移植的结构的警告。
-W posix打开兼容模式。但有以下限制,不识别\x、函数关键字、func、换码序列;当 fs 是一个空格时,将新行作为一个域分隔符;操作符=不能代替=;fflush无效。
-W re-interval or --re-inerval允许间隔正则表达式的使用,参考 grep 中的 POSIX 字符类,如括号表达式[[:alpha:]]。
-W source program-text or --source program-text使用 program-text 作为源代码,可与-f命令混用。

awk 脚本是由模式和操作组成的,即 pattern {action},如$ awk ‘/root/’ test,$ awk ‘$3 < 100’ test。二者是可选的,如果没有模式,则 action 应用到全部记录;如果没有 action,则输出匹配 全部记录。在默认情况下,每一个输入行都是一条记录,但用户可通过 RS 变量指定不同的分 隔符进行分隔。

说明 awk 命令的模式搜索比 grep 命令的搜索更常用,且它允许用户在输入文本行上执 行多个操作。awk 命令编程语言不需要编译,并允许用户使用变量、数字函数、字符 串函数和逻辑运算符。awk 命令受到 LANG、LC_ALL、PATH 等环境变量的影响。

awk 是 Linux 下的一个命令,它对其他命令的输出、对文件的处理都十分强大。其实它更 像一门编程语言,可以自定义变量,有条件语句,有循环,有数组,有正则,有函数等。它读 取输出或者文件的方式是一行一行地读,根据用户给出的条件进行查找,并在找出的行中进行 操作,感觉它的设计思想真的很简单,但是结合实际情况,具体操作起来就没有那么简单了。 它有 3 种形式:awk,gawk,nawk,平时所说的 awk 其实就是 gawk。

1.变量

变量及其描述如表
在这里插入图片描述

2.运算符

运算符及其描述如表

在这里插入图片描述

3.awk 的正则

匹配符及其描述如表

在这里插入图片描述

4.字符串函数

字符串函数及其描述如表

在这里插入图片描述

5.数学函数

数学函数及其返回值如表

在这里插入图片描述

案例练习

(1)显示文件 hello.c 中的行号和第三字段。

#awk '{printf"%03d%s\n",NR,$1}' hello.c 
001/* 
002#include 
003int 
004{ 
005printf("Hello, 
006return 
007}

(2)显示长于 7 个字符的文件的行。

# awk 'length >7' hello.c 
/* hello.c - Canonical "Hello, World!" program */ 
#include <stdio.h> 
int main(void) printf("Hello, Linux programming world!\n"); return 0;

(3)以相反顺序打印前两个字段。

awk 'length >7' hello.c 
/* hello.c - Canonical "Hello, World!" program */ 
#include <stdio.h> 
int main(void) printf("Hello, Linux programming world!\n");return 0; 
[root@localhost tmp]# awk '{ print $2, $1 }' hello.c 
hello.c /* 
<stdio.h> #include 
main(void) int 
{ 
Linux printf("Hello, 
0; return 
}

2.45 wc:输出文件中的行数、单词数、字节数

  • 作用:对每个文件输出行、单词和字节统计数,如果指定了多于一个文件,则还有一个行数的总计。如果指定的文件是“-”,则读取标准输入。

  • 用法:wc [选项]…[文件]

  • 主要选项如下。

    主要选项如下:

    命令描述
    -c, --bytes, --chars输出字节统计数。
    -l, --lines输出换行符统计数
    -L, --max-line-length输出最长的行的长度
    -w, --words输出单词统计数。

    案例练习

    显示文件 hello.c 中的单词数。

    # wc -w hello.c 
    20 hello.c
    

2.46 comm:比较排序文件

  • 作用:逐行比较两个已排序的文件。

  • 用法:comm [选项]...文件 1 文件 2

  • 主要选项如下

如果不附带选项,程序会生成三列输出。第一列包含文件 1 特有的行,第二列包含文件 2 特有的行,而第三列包含两个文件共有的行。

命令描述
-1不输出文件 1 特有的行。
-2不输出文件 2 特有的行。
-3不输出两个文件共有的行。
--check-order检查输入是否被正确排序,即使所有输入行均成对。
--nocheck-order不检查输入是否被正确排序。
--output-delimiter=STR依照 STR 分列
--help显示此帮助信息并退出。
--version显示版本信息并退出。

案例练习

比较排序 FILE1 和 FILE2,共有部分不显示。

comm -3 FILE1 FILE2 
SSSS 
222 

2.47 join:将两个文件中指定栏位内容相同的行连接起来

  • 作用:找出两个文件中指定栏位内容相同的行并加以合并,再输出到标准输出设备。
  • 用法:join [选项]文件 1 文件 2
  • 主要选项如下

针对每一对具有相同内容的输入行,整合为一行写到标准输出,默认的内容连接区块是由 第一个空白符代表的分界符号。当文件 1 或文件 2 都被指定为“-”时,程序将从标准输入读 取数据。

命令描述
-a 文件编号文件编号的值可以是 1 或 2,分别对应文件 1 和文件 2。此选项用于根据指定文件编号输出不成对的行目。
-e 字符将缺失的输入区块替换为指定字符。
-i,--ignore-case比较时忽略大小写。
-j 域等于“-1 域-2 域”。
-o 格式按照指定格式构造输出行。
-t 字符使用指定字符作为输入和输出的分隔符。
-v 文件编号类似-a 文件编号,但禁止组合输出行。
-1 域在文件 1 的此域组合。
-2 域在文件 2 的此域组合。
--check-order检查输入行是否正确排序,即使所有输入行均是成对的。
--nocheck-order不检查输入是否正确排序。
--header将首行视作域的头部,直接输出而不对其进行匹配。
--help显示此帮助信息并退出。
--version显示版本信息并退出。

2.48 fmt:编排文本文件

  • 作用:从指定的文件里读取内容,将其按照指定格式重新编排后,输出到标准输出设备。

    若指定的文件名为“-”,则 fmt 命令会从标准输入设备读取数据。

  • 用法:fmt [-宽度] [选项]… [文件]…

    重新格式化文件中的每个段落并输出到标准输出。

    选项“-宽度”是“–width=数字”的缩写。

  • 主要选项如下。

    长选项必须使用的参数对于短选项也是必须使用的。

    命令描述
    -c --crown-margin保持前两行的缩进。
    -p,–prefix=字符串只对以指定字符串开头的行重新格式化,将前缀重新附着到被重新格式化的行上。
    -s,–split-only分割过长的行,但不自动补足。
    -t,–tagged-paragraph缩进首行以使其不同于第二行。
    -u,–uniform-spacing每两个单词间保留一个空格,每句之后保留两个空格。
    -w,–width=宽度最大行宽(默认为 75 列宽度)。
    –help显示此帮助信息并退出。
    –version显示版本信息并退出。

    应用实例如下。

    重新排版 hello.c 文件。

    # fmt hello.c 
    /* hello.c - Canonical "Hello, World!" program */ #include <stdio.h> 
    int main(void) { printf("Hello, Linux programming world!\n"); return 0; 
    } 
    

这篇关于Linux 文件管理命令Lawk wc comm join fmt的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/952536

相关文章

linux-基础知识3

打包和压缩 zip 安装zip软件包 yum -y install zip unzip 压缩打包命令: zip -q -r -d -u 压缩包文件名 目录和文件名列表 -q:不显示命令执行过程-r:递归处理,打包各级子目录和文件-u:把文件增加/替换到压缩包中-d:从压缩包中删除指定的文件 解压:unzip 压缩包名 打包文件 把压缩包从服务器下载到本地 把压缩包上传到服务器(zip

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor

【Python编程】Linux创建虚拟环境并配置与notebook相连接

1.创建 使用 venv 创建虚拟环境。例如,在当前目录下创建一个名为 myenv 的虚拟环境: python3 -m venv myenv 2.激活 激活虚拟环境使其成为当前终端会话的活动环境。运行: source myenv/bin/activate 3.与notebook连接 在虚拟环境中,使用 pip 安装 Jupyter 和 ipykernel: pip instal

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

30常用 Maven 命令

Maven 是一个强大的项目管理和构建工具,它广泛用于 Java 项目的依赖管理、构建流程和插件集成。Maven 的命令行工具提供了大量的命令来帮助开发人员管理项目的生命周期、依赖和插件。以下是 常用 Maven 命令的使用场景及其详细解释。 1. mvn clean 使用场景:清理项目的生成目录,通常用于删除项目中自动生成的文件(如 target/ 目录)。共性规律:清理操作

软考系统规划与管理师考试证书含金量高吗?

2024年软考系统规划与管理师考试报名时间节点: 报名时间:2024年上半年软考将于3月中旬陆续开始报名 考试时间:上半年5月25日到28日,下半年11月9日到12日 分数线:所有科目成绩均须达到45分以上(包括45分)方可通过考试 成绩查询:可在“中国计算机技术职业资格网”上查询软考成绩 出成绩时间:预计在11月左右 证书领取时间:一般在考试成绩公布后3~4个月,各地领取时间有所不同

安全管理体系化的智慧油站开源了。

AI视频监控平台简介 AI视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒,省去繁琐重复的适配流程,实现芯片、算法、应用的全流程组合,从而大大减少企业级应用约95%的开发成本。用户只需在界面上进行简单的操作,就可以实现全视频的接入及布控。摄像头管理模块用于多种终端设备、智能设备的接入及管理。平台支持包括摄像头等终端感知设备接入,为整个平台提

Linux_kernel驱动开发11

一、改回nfs方式挂载根文件系统         在产品将要上线之前,需要制作不同类型格式的根文件系统         在产品研发阶段,我们还是需要使用nfs的方式挂载根文件系统         优点:可以直接在上位机中修改文件系统内容,延长EMMC的寿命         【1】重启上位机nfs服务         sudo service nfs-kernel-server resta