Linux 文件类信息统计指令(grep、awk、sort、uniq)

2024-04-07 12:18

本文主要是介绍Linux 文件类信息统计指令(grep、awk、sort、uniq),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

    • grep过滤关键字
    • cat 查看文件
      • cat 配合awk筛选文件中某一列
      • cat配合awk、sort、uniq做数据统计
      • cat配合grep、awk、sort、uniq做数据统计

grep过滤关键字

cat file |grep -o word |wc -l 统计file文件中word这个关键字出现的个数cat file |grep  word |wc -l 统计file文件中word这个关键字出现的行数

在这里插入图片描述

cat 查看文件

cat --help

在这里插入图片描述

cat /home/presslogs/mhp-swagger/access_log.2020-01-22.log xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 97
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 115
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 257
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 115
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 105
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 105
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 115
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 257
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 257
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 588
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/cache/removeCacheEnumDict HTTP/1.1" 200 60
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getHosParam HTTP/1.1" 200 223
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/cache/removeCacheEnumDict HTTP/1.1" 200 60
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 78
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/cache/removeCacheEnumDict HTTP/1.1" 200 60
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/cache/removeCacheEnumDict HTTP/1.1" 200 60
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getHosParam HTTP/1.1" 200 76
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getHosParam HTTP/1.1" 200 156
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/cache/removeCacheEnumDict HTTP/1.1" 200 60
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 211
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 85
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 588
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/cache/removeCacheEnumDict HTTP/1.1" 200 60
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 115
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 115
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 211
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 588
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 85
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 88
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 105
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getEnum HTTP/1.1" 200 97
xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getHosParam HTTP/1.1" 200 209
.........................
................
.......

cat 配合awk筛选文件中某一列

cat 文件名 |awk -F'按照什么切分'  '显示内容'
cat /home/presslogs/mhp-swagger/access_log.2020-01-22.log |awk -F' '  '{print $7}'xxx.xxx.xxx.xx - - [22/Jan/2020:15:08:12 +0800] "POST /cfg/service/getHosParam HTTP/1.1" 200 209

按照空格切分后分成如下几部分

>xxx.xxx.xxx.xx
>-
>-
>[22/Jan/2020:15:08:12
>+0800]
>"POST
>/cfg/service/getHosParam
>HTTP/1.1"
>200
>209

cat配合awk、sort、uniq做数据统计

cat 文件名 |awk -F'按照什么切分'  '显示内容'
sort 排序指令
uniq 可检查文本文件中重复出现的行列
cat /home/presslogs/mhp-swagger/access_log.2020-01-22.log |awk -F' '  '{print $7}'|sort -n|uniq -c|sort -nr

在这里插入图片描述

cat配合grep、awk、sort、uniq做数据统计

cat 文件名 |grep word|awk -F'按照什么切分'  '显示内容'
grep 过滤
sort 排序指令
uniq 可检查文本文件中重复出现的行列
cat /home/presslogs/mhp-swagger/access_log.2020-01-22.log |grep Enum|awk -F' '  '{print $7}'|sort -n|uniq -c|sort -nr

在这里插入图片描述

这篇关于Linux 文件类信息统计指令(grep、awk、sort、uniq)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/882584

相关文章

linux生产者,消费者问题

pthread_cond_wait() :用于阻塞当前线程,等待别的线程使用pthread_cond_signal()或pthread_cond_broadcast来唤醒它。 pthread_cond_wait() 必须与pthread_mutex 配套使用。pthread_cond_wait()函数一进入wait状态就会自动release mutex。当其他线程通过pthread

Linux 安装、配置Tomcat 的HTTPS

Linux 安装 、配置Tomcat的HTTPS 安装Tomcat 这里选择的是 tomcat 10.X ,需要Java 11及更高版本 Binary Distributions ->Core->选择 tar.gz包 下载、上传到内网服务器 /opt 目录tar -xzf 解压将解压的根目录改名为 tomat-10 并移动到 /opt 下, 形成个人习惯的路径 /opt/tomcat-10

RedHat运维-Linux文本操作基础-AWK进阶

你不用整理,跟着敲一遍,有个印象,然后把它保存到本地,以后要用再去看,如果有了新东西,你自个再添加。这是我参考牛客上的shell编程专项题,只不过换成了问答的方式而已。不用背,就算是我自己亲自敲,我现在好多也记不住。 1. 输出nowcoder.txt文件第5行的内容 2. 输出nowcoder.txt文件第6行的内容 3. 输出nowcoder.txt文件第7行的内容 4. 输出nowcode

【Linux进阶】UNIX体系结构分解——操作系统,内核,shell

1.什么是操作系统? 从严格意义上说,可将操作系统定义为一种软件,它控制计算机硬件资源,提供程序运行环境。我们通常将这种软件称为内核(kerel),因为它相对较小,而且位于环境的核心。  从广义上说,操作系统包括了内核和一些其他软件,这些软件使得计算机能够发挥作用,并使计算机具有自己的特生。这里所说的其他软件包括系统实用程序(system utility)、应用程序、shell以及公用函数库等

Windows/macOS/Linux 安装 Redis 和 Redis Desktop Manager 可视化工具

本文所有安装都在macOS High Sierra 10.13.4进行,Windows安装相对容易些,Linux安装与macOS类似,文中会做区分讲解 1. Redis安装 1.下载Redis https://redis.io/download 把下载的源码更名为redis-4.0.9-source,我喜欢跟maven、Tomcat放在一起,就放到/Users/zhan/Documents

通过高德api查询所有店铺地址信息

通过高德api查询所有店铺地址电话信息 需求:通过高德api查询所有店铺地址信息需求分析具体实现1、申请高德appkey2、下载types city 字典值3、具体代码调用 需求:通过高德api查询所有店铺地址信息 需求分析 查询现有高德api发现现有接口关键字搜索API服务地址: https://developer.amap.com/api/webservice/gui

Linux系统稳定性的奥秘:探究其背后的机制与哲学

在计算机操作系统的世界里,Linux以其卓越的稳定性和可靠性著称,成为服务器、嵌入式系统乃至个人电脑用户的首选。那么,是什么造就了Linux如此之高的稳定性呢?本文将深入解析Linux系统稳定性的几个关键因素,揭示其背后的技术哲学与实践。 1. 开源协作的力量Linux是一个开源项目,意味着任何人都可以查看、修改和贡献其源代码。这种开放性吸引了全球成千上万的开发者参与到内核的维护与优化中,形成了

SQL Server中,查询数据库中有多少个表,以及数据库其余类型数据统计查询

sqlserver查询数据库中有多少个表 sql server 数表:select count(1) from sysobjects where xtype='U'数视图:select count(1) from sysobjects where xtype='V'数存储过程select count(1) from sysobjects where xtype='P' SE

Linux 下的Vim命令宝贝

vim 命令详解(转自:https://www.cnblogs.com/usergaojie/p/4583796.html) vi: Visual Interface 可视化接口 vim: VI iMproved VI增强版 全屏编辑器,模式化编辑器 vim模式: 编辑模式(命令模式)输入模式末行模式 模式转换: 编辑-->输入: i: 在当前光标所在字符的前面,转为输入模式

Linux和Mac分卷压缩

使用 zip 命令压缩文件 使用 zip 命令压缩文件,并结合 split 命令来分卷: zip - largefile | split -b 500k 举例: zip - ./tomcat.dmg |split -b 500k 上述命令将文件 largefile 压缩成 zip 包并分卷成不超过 500k 的文件,分解后文件名默认是 x* ,后缀为 2 位a-z 字母,如 aa、ab。