学习笔记Day12:初探LInux 2

2024-03-20 00:28
文章标签 linux 学习 笔记 初探 day12

本文主要是介绍学习笔记Day12:初探LInux 2,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Linux初探

同一个目录中不允许出现文件及文件夹重名

查看文件
  1. cat (Concatenate)查看文本文件内容,输出到屏幕(标准输出流)

    • 常用参数

      • -A打印所有字符,包括特殊字符(换行符、制表符等)
      • -n/-b标记行号,-n标记空行,-b不标记空行
    • 常见用法

      cat > file创建一个新文件file,并可以将简单内容写入文件。

      >为重定向符,意为把cat原本输出到屏幕的内容写入file的文件,会覆盖。

      >>追加符,可以继续写入文件,不覆盖。

      zcat可以读压缩文件

    tac倒着看文件(从倒数第一行开始输出)

  2. head 查看文件的前n行(默认10行)

    tail查看文件的后n行(默认10行)

    • 常用参数

      • -n设置看多少行的参数
    • 常见用法

      cat file.txt | head -n3 等价 head -n3 file.txt

      |管道符号

  3. more逐页查看文件,按空格翻页,按回车换行,q退出

    less more的升级版,常用的查看文件命令

    • 常见参数

      • -N 显示行号
      • -S 单行显示(可以上下左右翻阅)
    • 常见用法

      /keyword进行关键词搜索;n/N上下跳转关键词。

  4. wcword count)统计文本

    • 常见参数

      • -l 统计行数(比较常用)
      • -w 统计字符串数,连在一起的字母是一个字符串。
      • -c 统计字节数,包括特殊字符,如换行符和制表符等。
    • 常见用法

      wc -l file1.txt file2.txt file3.txt 输出三个文件行数及总计行数

  5. cut 文本分割

    • 常见参数:

      • -d 指定分隔符,默认\t;
      • -f输出哪几列(字段fields)
    • 常见用法:

      less -SN Data/example.gtf | cut -f 1,3-5 | less 以默认制表符分割成列,取出1,3,4,5列(不会乱序)

  6. sort 排序

    • 常见参数:

      • -n 按照数值从小到大排序(默认是按照字符串理解数字的)
      • -V 字符串中含数值时,按照数值从小到大排序
      • -r 逆向排序
      • -k 按照哪一列进行排序
      • -t 指定分隔符
    • 常见用法

      less exp.csv | sort -k 3 -n| less -SN 根据第3列按照数值排序

  7. uniq 去除重复行,只能去除上下挨着的重复行,需要结合sort使用

    • 常见参数

      • -C 统计每个字符串连续出现的行数
    • 常见用法

      cat file.gtf | cut -f3 | sort | uniq -c 将文件以制表符分割的第三列排序后统计出现了多少次(联想R的table)

  8. paste 文本合并

    • 常见参数
      • -d 指定分隔符
      • -s 按行合并
    • 常见用法
      • paste file1 file2 默认按列合并
      • seq 20 | paste - - 很有意思!试一下!
  9. tr 字符替换

    • 常见参数

      • -d 删除
      • -s 缩减连续重复字符
    • 常见用法

      tr 'a' 'A' 把小写a换成大写A,全部替换

      tr ' ' '\t'把空格替换成制表符

      tr '\n' ' '把换行符替换成空格

MD5
  1. 生成md5值:md5sum file1

  2. 验证md5值:md5sum -c file1.md5

小TIPs
  • 特殊符号:^I\t 制表符;$\n 换行符
  • 把输入文件当作输出文件!会清空文件!需要存为另一个文件

生物信息学常见数据格式

fasta (fasta,fa,fna,faa,fas)

基于文本表示核酸序列的

特征:两部分, id行和序列行

  1. id行:以">"开头,有时候会包含注释信息,如chr1、chr2
  2. 序列行:一个字母表示一个碱基/氨基酸,ATCGN或二十种氨基酸
fastq

一种保存生物序列(通常核酸序列)及其测序质量得分信息的文本格式。

特征:四行组成(行内信息必须一行写完)

  1. 第一行:以@开头,之后为序列的标识符以及描述信息
  2. 第二行:为序列信息,如ATCG等
  3. 第三行:以+开头,之后可以再次加上序列的标识及描述信息(可无信息)
  4. 第四行:为碱基质量值,与第二行序列对应,长度相等
gff

在这里插入图片描述

gtf

在这里插入图片描述

  • gene_idtranscript_id非常重要!!

  • 强制对齐column -t

引用自生信技能树课程~

这篇关于学习笔记Day12:初探LInux 2的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/827692

相关文章

linux生产者,消费者问题

pthread_cond_wait() :用于阻塞当前线程,等待别的线程使用pthread_cond_signal()或pthread_cond_broadcast来唤醒它。 pthread_cond_wait() 必须与pthread_mutex 配套使用。pthread_cond_wait()函数一进入wait状态就会自动release mutex。当其他线程通过pthread

51单片机学习记录———定时器

文章目录 前言一、定时器介绍二、STC89C52定时器资源三、定时器框图四、定时器模式五、定时器相关寄存器六、定时器练习 前言 一个学习嵌入式的小白~ 有问题评论区或私信指出~ 提示:以下是本篇文章正文内容,下面案例可供参考 一、定时器介绍 定时器介绍:51单片机的定时器属于单片机的内部资源,其电路的连接和运转均在单片机内部完成。 定时器作用: 1.用于计数系统,可

问题:第一次世界大战的起止时间是 #其他#学习方法#微信

问题:第一次世界大战的起止时间是 A.1913 ~1918 年 B.1913 ~1918 年 C.1914 ~1918 年 D.1914 ~1919 年 参考答案如图所示

[word] word设置上标快捷键 #学习方法#其他#媒体

word设置上标快捷键 办公中,少不了使用word,这个是大家必备的软件,今天给大家分享word设置上标快捷键,希望在办公中能帮到您! 1、添加上标 在录入一些公式,或者是化学产品时,需要添加上标内容,按下快捷键Ctrl+shift++就能将需要的内容设置为上标符号。 word设置上标快捷键的方法就是以上内容了,需要的小伙伴都可以试一试呢!

Linux 安装、配置Tomcat 的HTTPS

Linux 安装 、配置Tomcat的HTTPS 安装Tomcat 这里选择的是 tomcat 10.X ,需要Java 11及更高版本 Binary Distributions ->Core->选择 tar.gz包 下载、上传到内网服务器 /opt 目录tar -xzf 解压将解压的根目录改名为 tomat-10 并移动到 /opt 下, 形成个人习惯的路径 /opt/tomcat-10

Tolua使用笔记(上)

目录   1.准备工作 2.运行例子 01.HelloWorld:在C#中,创建和销毁Lua虚拟机 和 简单调用。 02.ScriptsFromFile:在C#中,对一个lua文件的执行调用 03.CallLuaFunction:在C#中,对lua函数的操作 04.AccessingLuaVariables:在C#中,对lua变量的操作 05.LuaCoroutine:在Lua中,

AssetBundle学习笔记

AssetBundle是unity自定义的资源格式,通过调用引擎的资源打包接口对资源进行打包成.assetbundle格式的资源包。本文介绍了AssetBundle的生成,使用,加载,卸载以及Unity资源更新的一个基本步骤。 目录 1.定义: 2.AssetBundle的生成: 1)设置AssetBundle包的属性——通过编辑器界面 补充:分组策略 2)调用引擎接口API

RedHat运维-Linux文本操作基础-AWK进阶

你不用整理,跟着敲一遍,有个印象,然后把它保存到本地,以后要用再去看,如果有了新东西,你自个再添加。这是我参考牛客上的shell编程专项题,只不过换成了问答的方式而已。不用背,就算是我自己亲自敲,我现在好多也记不住。 1. 输出nowcoder.txt文件第5行的内容 2. 输出nowcoder.txt文件第6行的内容 3. 输出nowcoder.txt文件第7行的内容 4. 输出nowcode

Javascript高级程序设计(第四版)--学习记录之变量、内存

原始值与引用值 原始值:简单的数据即基础数据类型,按值访问。 引用值:由多个值构成的对象即复杂数据类型,按引用访问。 动态属性 对于引用值而言,可以随时添加、修改和删除其属性和方法。 let person = new Object();person.name = 'Jason';person.age = 42;console.log(person.name,person.age);//'J

【Linux进阶】UNIX体系结构分解——操作系统,内核,shell

1.什么是操作系统? 从严格意义上说,可将操作系统定义为一种软件,它控制计算机硬件资源,提供程序运行环境。我们通常将这种软件称为内核(kerel),因为它相对较小,而且位于环境的核心。  从广义上说,操作系统包括了内核和一些其他软件,这些软件使得计算机能够发挥作用,并使计算机具有自己的特生。这里所说的其他软件包括系统实用程序(system utility)、应用程序、shell以及公用函数库等