biostar handbook: 第二周笔记汇总+第三周任务布置

2024-06-23 21:18

本文主要是介绍biostar handbook: 第二周笔记汇总+第三周任务布置,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

第二周已经结束了,我不确定大家对Linux到底了解到了什么程度,但是我觉得再给一周时间让初学者去熟悉Linux肯定是必要的。于是这一周的任务不会太难,只需要让大家去理解本体论(ontology)。

笔记汇总

这周有一些小伙伴开始遭遇人生抉择,有一些则是要出差赶路,所以上交作业不算太多。可能大家对自己的要求有点高了,其实我一直强调的是笔记的不断迭代,只要你写了一点内容就可以发出来,后来不断修改,趋于完善。

  • grep基础命令选项
  • 文档查看与处理工具
  • 基础正则表达式
  • 作业2 无法逾越的鸿沟——CPU及其指令集(arm、x86、avx)
  • Biostar学习笔记(2)
  • Linux 常用命令(一)
  • Biostar handbook学习笔记二—linux常用命令的学习与使用
  • YXF-biostar 基本命令
  • Linux常用的命令及初窥正则表达式--The learning notes of the biostar handbook(2)
  • biostar lesson3 linux学习日记;java版本;awk
  • bash 命令
  • biostarhandbook(二)|命令行世界生存法则
  • linux基础命令和相关帮助文档说明
  • Biostar入门学习笔记(1):Some basic but useful code
  • Biostar_Handbook(2)Linux命令行学习

任务布置

本周的学习任务是第五章。我们不求多,不求快,只要稳扎稳打,所以就只要学习这一章。但是下一周的任务,我有种要一次性学习6~9章的内容。不过不用慌,这一次就第五章。

作为一位大学统计棉花表皮毛的苦逼生物狗,深刻体会什么叫做经验,也就是人类模式识别能力的强大和不精确性。当时的导师教我如何根据表皮毛的长短和浓密进行基因型的判定,但是我一直纠结长和短,密和疏之间的分界。在读研的时候,师姐会让我提供基因Genomic序列,这来自于TAIR的定义,此外TAIR还定义了full length cDNA和full length CDS。我经常纠结这些序列和我GFF里面的CDS,mRNA,gene的关系是什么?直到我把所有序列都拿出来,进行多序列联配才发现它们之间的差异。

计算机科学来自于多学科的交互,比如说数学,语言学,逻辑学等。为了保证互联网的通信,代码的复用,API的调用等,计算机协会制定了很多协议进行标准化。比如说“意思意思”这句话在中文的语境千变万化,但是在计算机里面可能就会翻译成mean of mean。为了能让计算机分析生物数据,就要生物学的一些概念进行精确定义,而不是“只可意会,不可言传”

Unfortunately, biological terminology is notoriously ambiguous; the same word is often used to describe more than one thing and there are many dialects. For example, does a coding sequence (CDS) contain the stop codon or is the stop codon part of the 3'-untranslated region (3' UTR)?

There really is no right or wrong answer to such questions, but consistency is crucial when attempting to compare annotations from different sources, or even when comparing annotations performed by the same group over an extended period of time.

因此,大家需要去理解一下什么叫做基因本体论,还有序列本体论,也就是gff文件里面的其中两列内容。

然后你就开始尝试去理解什么叫做富集分析。也就是别人要你去做富集分析,计算机做的事情是啥。这会涉及到一些统计学知识,比如说超几何分布,你就可以去翻翻教科书了。这部分内容请参考Y叔和Jimmy激烈交流的故事。

  • 富集分析
  • 富集基因之注释缺失
  • 落入窠臼

最后用unix的命令行分析你研究物种的gff文件,问题则是靠你自己提出了,比如说最多的feature是什么?

这篇关于biostar handbook: 第二周笔记汇总+第三周任务布置的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1088295

相关文章

Tolua使用笔记(上)

目录   1.准备工作 2.运行例子 01.HelloWorld:在C#中,创建和销毁Lua虚拟机 和 简单调用。 02.ScriptsFromFile:在C#中,对一个lua文件的执行调用 03.CallLuaFunction:在C#中,对lua函数的操作 04.AccessingLuaVariables:在C#中,对lua变量的操作 05.LuaCoroutine:在Lua中,

AssetBundle学习笔记

AssetBundle是unity自定义的资源格式,通过调用引擎的资源打包接口对资源进行打包成.assetbundle格式的资源包。本文介绍了AssetBundle的生成,使用,加载,卸载以及Unity资源更新的一个基本步骤。 目录 1.定义: 2.AssetBundle的生成: 1)设置AssetBundle包的属性——通过编辑器界面 补充:分组策略 2)调用引擎接口API

C++工程编译链接错误汇总VisualStudio

目录 一些小的知识点 make工具 可以使用windows下的事件查看器崩溃的地方 dumpbin工具查看dll是32位还是64位的 _MSC_VER .cc 和.cpp 【VC++目录中的包含目录】 vs 【C/C++常规中的附加包含目录】——头文件所在目录如何怎么添加,添加了以后搜索头文件就会到这些个路径下搜索了 include<> 和 include"" WinMain 和

《offer来了》第二章学习笔记

1.集合 Java四种集合:List、Queue、Set和Map 1.1.List:可重复 有序的Collection ArrayList: 基于数组实现,增删慢,查询快,线程不安全 Vector: 基于数组实现,增删慢,查询快,线程安全 LinkedList: 基于双向链实现,增删快,查询慢,线程不安全 1.2.Queue:队列 ArrayBlockingQueue:

操作系统实训复习笔记(1)

目录 Linux vi/vim编辑器(简单) (1)vi/vim基本用法。 (2)vi/vim基础操作。 进程基础操作(简单) (1)fork()函数。 写文件系统函数(中等) ​编辑 (1)C语言读取文件。 (2)C语言写入文件。 1、write()函数。  读文件系统函数(简单) (1)read()函数。 作者本人的操作系统实训复习笔记 Linux

LVGL快速入门笔记

目录 一、基础知识 1. 基础对象(lv_obj) 2. 基础对象的大小(size) 3. 基础对象的位置(position) 3.1 直接设置方式 3.2 参照父对象对齐 3.3 获取位置 4. 基础对象的盒子模型(border-box) 5. 基础对象的样式(styles) 5.1 样式的状态和部分 5.1.1 对象可以处于以下状态States的组合: 5.1.2 对象

DDS信号的发生器(验证篇)——FPGA学习笔记8

前言:第一部分详细讲解DDS核心框图,还请读者深入阅读第一部分,以便理解DDS核心思想 三刷小梅哥视频总结! 小梅哥https://www.corecourse.com/lander 一、DDS简介         DDS(Direct Digital Synthesizer)即数字合成器,是一种新型的频率合成技术,具有低成本、低功耗、高分辨率、频率转换时间短、相位连续性好等优点,对数字信

【汇总】vivado_zynq学习资料

DMA:https://www.xilinx.com/support/answers/57550.html

如何设置windows计划任务

如何设置windows计划任务 前言:在工作过程中写了一个python脚本,用于调用jira接口查询bug单数量,想要在本地定时任务执行,每天发送到钉钉群提醒,写下操作步骤用于记录。 1. 准备 Python 脚本 确保你的 Python 脚本已经保存到一个文件,比如 jira_reminder.py。 2. 创建批处理文件 为了方便任务计划程序运行 Python 脚本,创建一个批处理文

数据库原理与安全复习笔记(未完待续)

1 概念 产生与发展:人工管理阶段 → \to → 文件系统阶段 → \to → 数据库系统阶段。 数据库系统特点:数据的管理者(DBMS);数据结构化;数据共享性高,冗余度低,易于扩充;数据独立性高。DBMS 对数据的控制功能:数据的安全性保护;数据的完整性检查;并发控制;数据库恢复。 数据库技术研究领域:数据库管理系统软件的研发;数据库设计;数据库理论。数据模型要素 数据结构:描述数据库