shell编程--awk

2024-09-05 01:28
文章标签 编程 shell awk

本文主要是介绍shell编程--awk,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

作用

切片,显示信息的,按列显示,也是逐行处理的

语法

awk [options] 'commands' file

==options

-F可以指定分割符,默认分隔符为空格或制表符TAB,-F

==command(时空)

BEGIN{}

{}

END{}

awk -F: 'BEGIN{print "awk开始"}{print $0}END{print "awk结束"}' passwd.txt#############################################################
awk开始
root:x:0:0:root:/root:/bin/bash1
daemon:x:1:1:daemon:/usr/sbin:/usr/sbin/nologin2
bin:x:2:2:bin:/bin:/usr/sbin/nologin3
sys:x:3:3:sys:/dev:/usr/sbin/nologin4
sync:x:4:65534:sync:/bin:/bin/sync5
games:x:5:60:games:/usr/games:/usr/sbin/nologin6
man:x:6:12:man:/var/cache/man:/usr/sbin/nologin7
lp:x:7:7:lp:/var/spool/lpd:/usr/sbin/nologin8
mail:x:8:8:mail:/var/mail:/usr/sbin/nologin9
news:x:9:9:news:/var/spool/news:/usr/sbin/nologin10
awk结束
awk [options] 'pattern{action}' {filenames}

pattern:表示AWK在数据中查找的内容,就是匹配模式

action:在找到匹配内容时所执行的一系列命令

选项参数说明

选项参数功能
-F指定输入文件拆分分隔符
-v赋值一个用户定义变量

awk内置变量

内置变量含义
ARGC命令行参数个数
ARGV命令行参数排列
ENVIRON支持队列中系统环境变量的使用
FILENAMEawk浏览的文件名
FNR浏览文件的记录数
FS设置输入域分隔符,等价于命令行 -F选项
NF浏览记录的域的个数, 根据分隔符分割后的列数(列数)
NR已读的记录数, 也是行号(行号)
OFS输出域分隔符
ORS输出记录分隔符
RS控制记录分隔符
$n$0变量是指整条记录。$1表示当前行的第一个域,$2表示当前行的第二个域,......以此类推。
$NF$NF是number finally,表示最后一列的信息,跟变量NF是有区别的,变量NF统计的是每行列的总数

示例

#数据准备
cp /etc/passwd ./#默认每行空格切割数据
echo "abc 123 456" | awk '{print $1"&"$2"&"$3}'#打印含有匹配信息的行
awk '/root/ {print $0}' passwd
awk '/root/' passwd#打印匹配行中第7列数据
awk -F: '/root/ {print $7}' passwd#统计passwd:  文件名,每行的行号,每行的列数,对应的完整行内容
awk -F: '{print "文件名:" FILENAME "行号" NR "列数" NF "内容" $0}' passwd
#使用printf替代print,可以让代码阅读型更好
awk -F: '{printf("文件名:%s,行号 %s,列数 %s 内容 %s\n",FILENAME,NR,NF,$0)}' passwd#打印第二行信息
awk -F ':' 'NR==2{printf("filename:%s,%s\n",FILENAME,$0)}' passwd#查找以c开头的资源
ls -a | awk '/^c/'#打印第一列
awk -F: '{print $1}' passwd#打印最后1列
awk -F: '{print $NF}' passwd# 打印倒数第二列
awk -F: '{print $(NF-1)}'#打印10到20行的第一列
awk -F: '{if(NR>=10 && NR<=20) print $1}' passwd#多分隔符使用
echo "abc/123:456" | awk -F "[:/]" '{print $0,$1,$2,$3}'
echo "one:two/three" | awk -F '[:/]' '{printf("%s\n%s\n%s\n%s\n",$0,$1,$2,$3)}'#添加开始与结束内容
echo -e  "abc\nabc" | awk 'BEGIN{print "开始..."} {print $0} END{print "结束..."}'#使用循环拼接分割后的字符串
echo "1111    222 33 44" | awk -v str="" '{for(n=1;n<=NF;n++)  { str=str$n } print str}'#操作指定数字运算echo "2.1" | awk -v i=1 '{print $0+i}'#切割ip
ifconfig | awk '/broadcast/{print $0}' | awk '{print $2}'#显示空行行号
sed 'G' sed.txt | awk '/^$/{print NR}'#

小结

grep , sed ,awk , cut 文本字符串操作四剑客的区别

grep:用于查找匹配的行

cut: 截取数据. 截取某个文件中的列, 重点是按照列分割, 这个命令不适合截取文件中有多个空白字符的字段

sed: 增删改查数据. sed用于在文件中以行来截取数据进行增\删\改\查

awk:截取分析数据. 可以在某个文件中是以竖列来截取分析数据, 如果字段之间含有很多空白字符也可以获取需要的数据, awk是一种语言,可以深入分析文件数据

这篇关于shell编程--awk的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1137575

相关文章

C#多线程编程中导致死锁的常见陷阱和避免方法

《C#多线程编程中导致死锁的常见陷阱和避免方法》在C#多线程编程中,死锁(Deadlock)是一种常见的、令人头疼的错误,死锁通常发生在多个线程试图获取多个资源的锁时,导致相互等待对方释放资源,最终形... 目录引言1. 什么是死锁?死锁的典型条件:2. 导致死锁的常见原因2.1 锁的顺序问题错误示例:不同

PyCharm接入DeepSeek实现AI编程的操作流程

《PyCharm接入DeepSeek实现AI编程的操作流程》DeepSeek是一家专注于人工智能技术研发的公司,致力于开发高性能、低成本的AI模型,接下来,我们把DeepSeek接入到PyCharm中... 目录引言效果演示创建API key在PyCharm中下载Continue插件配置Continue引言

Linux中shell解析脚本的通配符、元字符、转义符说明

《Linux中shell解析脚本的通配符、元字符、转义符说明》:本文主要介绍shell通配符、元字符、转义符以及shell解析脚本的过程,通配符用于路径扩展,元字符用于多命令分割,转义符用于将特殊... 目录一、linux shell通配符(wildcard)二、shell元字符(特殊字符 Meta)三、s

shell脚本快速检查192.168.1网段ip是否在用的方法

《shell脚本快速检查192.168.1网段ip是否在用的方法》该Shell脚本通过并发ping命令检查192.168.1网段中哪些IP地址正在使用,脚本定义了网络段、超时时间和并行扫描数量,并使用... 目录脚本:检查 192.168.1 网段 IP 是否在用脚本说明使用方法示例输出优化建议总结检查 1

C#反射编程之GetConstructor()方法解读

《C#反射编程之GetConstructor()方法解读》C#中Type类的GetConstructor()方法用于获取指定类型的构造函数,该方法有多个重载版本,可以根据不同的参数获取不同特性的构造函... 目录C# GetConstructor()方法有4个重载以GetConstructor(Type[]

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor

【Python编程】Linux创建虚拟环境并配置与notebook相连接

1.创建 使用 venv 创建虚拟环境。例如,在当前目录下创建一个名为 myenv 的虚拟环境: python3 -m venv myenv 2.激活 激活虚拟环境使其成为当前终端会话的活动环境。运行: source myenv/bin/activate 3.与notebook连接 在虚拟环境中,使用 pip 安装 Jupyter 和 ipykernel: pip instal

【编程底层思考】垃圾收集机制,GC算法,垃圾收集器类型概述

Java的垃圾收集(Garbage Collection,GC)机制是Java语言的一大特色,它负责自动管理内存的回收,释放不再使用的对象所占用的内存。以下是对Java垃圾收集机制的详细介绍: 一、垃圾收集机制概述: 对象存活判断:垃圾收集器定期检查堆内存中的对象,判断哪些对象是“垃圾”,即不再被任何引用链直接或间接引用的对象。内存回收:将判断为垃圾的对象占用的内存进行回收,以便重新使用。

Go Playground 在线编程环境

For all examples in this and the next chapter, we will use Go Playground. Go Playground represents a web service that can run programs written in Go. It can be opened in a web browser using the follow

深入理解RxJava:响应式编程的现代方式

在当今的软件开发世界中,异步编程和事件驱动的架构变得越来越重要。RxJava,作为响应式编程(Reactive Programming)的一个流行库,为Java和Android开发者提供了一种强大的方式来处理异步任务和事件流。本文将深入探讨RxJava的核心概念、优势以及如何在实际项目中应用它。 文章目录 💯 什么是RxJava?💯 响应式编程的优势💯 RxJava的核心概念