Linux 文件管理命令Lawk wc comm join fmt

2024-05-01 19:52

本文主要是介绍Linux 文件管理命令Lawk wc comm join fmt,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

    • 2.Linux 文件管理命令
    • 2.44 awk:模式匹配语言
      • 1.变量
      • 2.运算符
      • 3.awk 的正则
      • 4.字符串函数
      • 5.数学函数
      • 案例练习
    • 2.45 wc:输出文件中的行数、单词数、字节数
    • 案例练习
    • 2.46 comm:比较排序文件
      • 案例练习
    • 2.47 join:将两个文件中指定栏位内容相同的行连接起来
    • 2.48 fmt:编排文本文件

2.Linux 文件管理命令

2.44 awk:模式匹配语言

  • 作用:利用一组用户提供的命令来将一组文件和用户提供的扩展正则表达式进行比较,一 次一行,然后在任何与扩展正则表达式匹配的行上执行操作。

  • 用法:

    awk [options] 'script' var=value file(s)

    awk [options] -f scriptfile var=value file(s)

主要选项如下:

命令描述
-F fs or --field-separator fs指定输入文件的分隔符,fs 是一个字符串或是一个正则表达式,如-F:。
-v var=value or --asign var=value赋值一个用户定义变量。
-f scripfile or --file scriptfile从脚本文件中读取 awk 命令。
-mf nnn and -mr nnn对 nnn 值设置内在限制,-mf 选项限制分配给 nnn 的最大块数目;-mr 选项限制记录的最大数目。这两个功能是 Bell 实验室版 awk 的扩展功能,在标准 awk中不适用。
-W compact or --compat, -W traditional or –traditional在兼容模式下运行 awk。所以 gawk的行为和标准的 awk 完全一样,所有的 awk 扩展都被忽略。
-W copyleft or --copyleft, -W copyright or –copyright打印简短的版权信息。
-W help or --help, -W usage or –usage打印全部 awk 选项和每个选项的简短说明。
-W lint or –lint打印不能向传统 UNIX 平台移植的结构的警告。
-W lint-old or --lint-old打印关于不能向传统 UNIX 平台移植的结构的警告。
-W posix打开兼容模式。但有以下限制,不识别\x、函数关键字、func、换码序列;当 fs 是一个空格时,将新行作为一个域分隔符;操作符=不能代替=;fflush无效。
-W re-interval or --re-inerval允许间隔正则表达式的使用,参考 grep 中的 POSIX 字符类,如括号表达式[[:alpha:]]。
-W source program-text or --source program-text使用 program-text 作为源代码,可与-f命令混用。

awk 脚本是由模式和操作组成的,即 pattern {action},如$ awk ‘/root/’ test,$ awk ‘$3 < 100’ test。二者是可选的,如果没有模式,则 action 应用到全部记录;如果没有 action,则输出匹配 全部记录。在默认情况下,每一个输入行都是一条记录,但用户可通过 RS 变量指定不同的分 隔符进行分隔。

说明 awk 命令的模式搜索比 grep 命令的搜索更常用,且它允许用户在输入文本行上执 行多个操作。awk 命令编程语言不需要编译,并允许用户使用变量、数字函数、字符 串函数和逻辑运算符。awk 命令受到 LANG、LC_ALL、PATH 等环境变量的影响。

awk 是 Linux 下的一个命令,它对其他命令的输出、对文件的处理都十分强大。其实它更 像一门编程语言,可以自定义变量,有条件语句,有循环,有数组,有正则,有函数等。它读 取输出或者文件的方式是一行一行地读,根据用户给出的条件进行查找,并在找出的行中进行 操作,感觉它的设计思想真的很简单,但是结合实际情况,具体操作起来就没有那么简单了。 它有 3 种形式:awk,gawk,nawk,平时所说的 awk 其实就是 gawk。

1.变量

变量及其描述如表
在这里插入图片描述

2.运算符

运算符及其描述如表

在这里插入图片描述

3.awk 的正则

匹配符及其描述如表

在这里插入图片描述

4.字符串函数

字符串函数及其描述如表

在这里插入图片描述

5.数学函数

数学函数及其返回值如表

在这里插入图片描述

案例练习

(1)显示文件 hello.c 中的行号和第三字段。

#awk '{printf"%03d%s\n",NR,$1}' hello.c 
001/* 
002#include 
003int 
004{ 
005printf("Hello, 
006return 
007}

(2)显示长于 7 个字符的文件的行。

# awk 'length >7' hello.c 
/* hello.c - Canonical "Hello, World!" program */ 
#include <stdio.h> 
int main(void) printf("Hello, Linux programming world!\n"); return 0;

(3)以相反顺序打印前两个字段。

awk 'length >7' hello.c 
/* hello.c - Canonical "Hello, World!" program */ 
#include <stdio.h> 
int main(void) printf("Hello, Linux programming world!\n");return 0; 
[root@localhost tmp]# awk '{ print $2, $1 }' hello.c 
hello.c /* 
<stdio.h> #include 
main(void) int 
{ 
Linux printf("Hello, 
0; return 
}

2.45 wc:输出文件中的行数、单词数、字节数

  • 作用:对每个文件输出行、单词和字节统计数,如果指定了多于一个文件,则还有一个行数的总计。如果指定的文件是“-”,则读取标准输入。

  • 用法:wc [选项]…[文件]

  • 主要选项如下。

    主要选项如下:

    命令描述
    -c, --bytes, --chars输出字节统计数。
    -l, --lines输出换行符统计数
    -L, --max-line-length输出最长的行的长度
    -w, --words输出单词统计数。

    案例练习

    显示文件 hello.c 中的单词数。

    # wc -w hello.c 
    20 hello.c
    

2.46 comm:比较排序文件

  • 作用:逐行比较两个已排序的文件。

  • 用法:comm [选项]...文件 1 文件 2

  • 主要选项如下

如果不附带选项,程序会生成三列输出。第一列包含文件 1 特有的行,第二列包含文件 2 特有的行,而第三列包含两个文件共有的行。

命令描述
-1不输出文件 1 特有的行。
-2不输出文件 2 特有的行。
-3不输出两个文件共有的行。
--check-order检查输入是否被正确排序,即使所有输入行均成对。
--nocheck-order不检查输入是否被正确排序。
--output-delimiter=STR依照 STR 分列
--help显示此帮助信息并退出。
--version显示版本信息并退出。

案例练习

比较排序 FILE1 和 FILE2,共有部分不显示。

comm -3 FILE1 FILE2 
SSSS 
222 

2.47 join:将两个文件中指定栏位内容相同的行连接起来

  • 作用:找出两个文件中指定栏位内容相同的行并加以合并,再输出到标准输出设备。
  • 用法:join [选项]文件 1 文件 2
  • 主要选项如下

针对每一对具有相同内容的输入行,整合为一行写到标准输出,默认的内容连接区块是由 第一个空白符代表的分界符号。当文件 1 或文件 2 都被指定为“-”时,程序将从标准输入读 取数据。

命令描述
-a 文件编号文件编号的值可以是 1 或 2,分别对应文件 1 和文件 2。此选项用于根据指定文件编号输出不成对的行目。
-e 字符将缺失的输入区块替换为指定字符。
-i,--ignore-case比较时忽略大小写。
-j 域等于“-1 域-2 域”。
-o 格式按照指定格式构造输出行。
-t 字符使用指定字符作为输入和输出的分隔符。
-v 文件编号类似-a 文件编号,但禁止组合输出行。
-1 域在文件 1 的此域组合。
-2 域在文件 2 的此域组合。
--check-order检查输入行是否正确排序,即使所有输入行均是成对的。
--nocheck-order不检查输入是否正确排序。
--header将首行视作域的头部,直接输出而不对其进行匹配。
--help显示此帮助信息并退出。
--version显示版本信息并退出。

2.48 fmt:编排文本文件

  • 作用:从指定的文件里读取内容,将其按照指定格式重新编排后,输出到标准输出设备。

    若指定的文件名为“-”,则 fmt 命令会从标准输入设备读取数据。

  • 用法:fmt [-宽度] [选项]… [文件]…

    重新格式化文件中的每个段落并输出到标准输出。

    选项“-宽度”是“–width=数字”的缩写。

  • 主要选项如下。

    长选项必须使用的参数对于短选项也是必须使用的。

    命令描述
    -c --crown-margin保持前两行的缩进。
    -p,–prefix=字符串只对以指定字符串开头的行重新格式化,将前缀重新附着到被重新格式化的行上。
    -s,–split-only分割过长的行,但不自动补足。
    -t,–tagged-paragraph缩进首行以使其不同于第二行。
    -u,–uniform-spacing每两个单词间保留一个空格,每句之后保留两个空格。
    -w,–width=宽度最大行宽(默认为 75 列宽度)。
    –help显示此帮助信息并退出。
    –version显示版本信息并退出。

    应用实例如下。

    重新排版 hello.c 文件。

    # fmt hello.c 
    /* hello.c - Canonical "Hello, World!" program */ #include <stdio.h> 
    int main(void) { printf("Hello, Linux programming world!\n"); return 0; 
    } 
    

这篇关于Linux 文件管理命令Lawk wc comm join fmt的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/952536

相关文章

Linux使用nload监控网络流量的方法

《Linux使用nload监控网络流量的方法》Linux中的nload命令是一个用于实时监控网络流量的工具,它提供了传入和传出流量的可视化表示,帮助用户一目了然地了解网络活动,本文给大家介绍了Linu... 目录简介安装示例用法基础用法指定网络接口限制显示特定流量类型指定刷新率设置流量速率的显示单位监控多个

ElasticSearch+Kibana通过Docker部署到Linux服务器中操作方法

《ElasticSearch+Kibana通过Docker部署到Linux服务器中操作方法》本文介绍了Elasticsearch的基本概念,包括文档和字段、索引和映射,还详细描述了如何通过Docker... 目录1、ElasticSearch概念2、ElasticSearch、Kibana和IK分词器部署

Linux流媒体服务器部署流程

《Linux流媒体服务器部署流程》文章详细介绍了流媒体服务器的部署步骤,包括更新系统、安装依赖组件、编译安装Nginx和RTMP模块、配置Nginx和FFmpeg,以及测试流媒体服务器的搭建... 目录流媒体服务器部署部署安装1.更新系统2.安装依赖组件3.解压4.编译安装(添加RTMP和openssl模块

linux下多个硬盘划分到同一挂载点问题

《linux下多个硬盘划分到同一挂载点问题》在Linux系统中,将多个硬盘划分到同一挂载点需要通过逻辑卷管理(LVM)来实现,首先,需要将物理存储设备(如硬盘分区)创建为物理卷,然后,将这些物理卷组成... 目录linux下多个硬盘划分到同一挂载点需要明确的几个概念硬盘插上默认的是非lvm总结Linux下多

SpringBoot中使用 ThreadLocal 进行多线程上下文管理及注意事项小结

《SpringBoot中使用ThreadLocal进行多线程上下文管理及注意事项小结》本文详细介绍了ThreadLocal的原理、使用场景和示例代码,并在SpringBoot中使用ThreadLo... 目录前言技术积累1.什么是 ThreadLocal2. ThreadLocal 的原理2.1 线程隔离2

linux进程D状态的解决思路分享

《linux进程D状态的解决思路分享》在Linux系统中,进程在内核模式下等待I/O完成时会进入不间断睡眠状态(D状态),这种状态下,进程无法通过普通方式被杀死,本文通过实验模拟了这种状态,并分析了如... 目录1. 问题描述2. 问题分析3. 实验模拟3.1 使用losetup创建一个卷作为pv的磁盘3.

Linux环境变量&&进程地址空间详解

《Linux环境变量&&进程地址空间详解》本文介绍了Linux环境变量、命令行参数、进程地址空间以及Linux内核进程调度队列的相关知识,环境变量是系统运行环境的参数,命令行参数用于传递给程序的参数,... 目录一、初步认识环境变量1.1常见的环境变量1.2环境变量的基本概念二、命令行参数2.1通过命令编程

Linux之进程状态&&进程优先级详解

《Linux之进程状态&&进程优先级详解》文章介绍了操作系统中进程的状态,包括运行状态、阻塞状态和挂起状态,并详细解释了Linux下进程的具体状态及其管理,此外,文章还讨论了进程的优先级、查看和修改进... 目录一、操作系统的进程状态1.1运行状态1.2阻塞状态1.3挂起二、linux下具体的状态三、进程的

Linux编译器--gcc/g++使用方式

《Linux编译器--gcc/g++使用方式》文章主要介绍了C/C++程序的编译过程,包括预编译、编译、汇编和链接四个阶段,并详细解释了每个阶段的作用和具体操作,同时,还介绍了调试和发布版本的概念... 目录一、预编译指令1.1预处理功能1.2指令1.3问题扩展二、编译(生成汇编)三、汇编(生成二进制机器语

数据库使用之union、union all、各种join的用法区别解析

《数据库使用之union、unionall、各种join的用法区别解析》:本文主要介绍SQL中的Union和UnionAll的区别,包括去重与否以及使用时的注意事项,还详细解释了Join关键字,... 目录一、Union 和Union All1、区别:2、注意点:3、具体举例二、Join关键字的区别&php