RNA结构调控翻译_2022_Deciphering the role of RNA structure in translation efficiency

本文主要是介绍RNA结构调控翻译_2022_Deciphering the role of RNA structure in translation efficiency,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文献核心内容总结

背景

本文探讨了RNA二级结构在翻译效率(Translation Efficiency, TE)中的作用。RNA二级结构在转录后调控过程中扮演重要角色,包括剪接、定位、稳定性和翻译。RNA结构的稳定性尤其在翻译起始位点附近对于促进翻译效率具有重要影响。然而,目前对整个mRNA结构与翻译效率的全局关系的理解仍然有限。本研究利用高通量RNA结构探测数据,系统研究了RNA结构在调控翻译效率中的作用。

研究方法

本文采用了一种机器学习方法,具体流程包括:

  1. 选择高TE组(前25%)和低TE组(后25%)的转录本。
  2. 构建特征空间,包括序列特征和结构特征。序列特征包括核苷酸频率、密码子频率、氨基酸频率、GC含量、密码子重复率、氨基酸重复率、CDS长度和UTR长度。结构特征包括体内(in vivo)、体外(in vitro)和计算机模拟(in silico)的结构特征。
  3. 进行100次随机分割,将数据分为训练集和测试集,对每次随机分割进行十倍交叉验证来调整超参数,并在测试集上评估模型性能。

主要结果

  1. mESCs中的3’ UTR结构:通过随机森林模型和弹性网络模型对小鼠胚胎干细胞(mESCs)的转录本进行建模,发现3’ UTR的结构信息对预测翻译效率最为重要。特别是3’ UTR在体内的结构对小鼠胚胎干细胞的翻译效率具有显著影响。高TE组的转录本在3’ UTR区域的结构更开放,而低TE组的转录本则更为紧密。

  2. 体内和体外结构差异:在mESCs中,高TE组和低TE组在3’ UTR区域的体内和体外结构差异显著。高TE转录本在体内的3’ UTR结构更为开放,而在体外则较为紧密。

  3. 斑马鱼中的3’ UTR结构:在斑马鱼胚胎中,3’ UTR结构对翻译效率也很重要,但其模式与mESCs不同。斑马鱼的高TE转录本在3’ UTR区域体内和体外的结构差异不如mESCs显著。

讨论

RNA二级结构在翻译调控中扮演复杂的角色。本文的研究揭示了3’ UTR结构在翻译效率调控中的重要性,尤其是在小鼠胚胎干细胞中。这种结构差异可能通过RNA结合蛋白(RBPs)的结合来影响翻译效率。此外,本文发现体内和体外结构的差异在不同生物中表现不同,这可能与生物复杂程度及其调控机制有关。

结论

本文系统分析了RNA序列和结构特征对mRNA翻译效率的影响。结果表明,3’ UTR在体内的结构是预测翻译效率的最重要结构特征,这一发现为未来研究提供了新的方向,揭示了RNA结构在翻译调控中的关键作用。

机器学习流程和代码

文献详细描述了机器学习的流程,包括数据选择、特征构建、模型训练和评估。使用了随机森林和弹性网络模型,并进行了多次交叉验证和随机分割。代码和相关数据集可在以下链接中获取:

  • MFAS
  • Translation efficiency datasets

文献中提供了代码的链接和详细的实验步骤,便于读者复现和进一步研究。

这篇关于RNA结构调控翻译_2022_Deciphering the role of RNA structure in translation efficiency的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1060972

相关文章

usaco 1.3 Mixing Milk (结构体排序 qsort) and hdu 2020(sort)

到了这题学会了结构体排序 于是回去修改了 1.2 milking cows 的算法~ 结构体排序核心: 1.结构体定义 struct Milk{int price;int milks;}milk[5000]; 2.自定义的比较函数,若返回值为正,qsort 函数判定a>b ;为负,a<b;为0,a==b; int milkcmp(const void *va,c

自定义类型:结构体(续)

目录 一. 结构体的内存对齐 1.1 为什么存在内存对齐? 1.2 修改默认对齐数 二. 结构体传参 三. 结构体实现位段 一. 结构体的内存对齐 在前面的文章里我们已经讲过一部分的内存对齐的知识,并举出了两个例子,我们再举出两个例子继续说明: struct S3{double a;int b;char c;};int mian(){printf("%zd\n",s

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

OpenCV结构分析与形状描述符(11)椭圆拟合函数fitEllipse()的使用

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C++11 算法描述 围绕一组2D点拟合一个椭圆。 该函数计算出一个椭圆,该椭圆在最小二乘意义上最好地拟合一组2D点。它返回一个内切椭圆的旋转矩形。使用了由[90]描述的第一个算法。开发者应该注意,由于数据点靠近包含的 Mat 元素的边界,返回的椭圆/旋转矩形数据

论文翻译:ICLR-2024 PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS

PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS https://openreview.net/forum?id=KS8mIvetg2 验证测试集污染在黑盒语言模型中 文章目录 验证测试集污染在黑盒语言模型中摘要1 引言 摘要 大型语言模型是在大量互联网数据上训练的,这引发了人们的担忧和猜测,即它们可能已

C语言程序设计(选择结构程序设计)

一、关系运算符和关系表达式 1.1关系运算符及其优先次序 ①<(小于) ②<=(小于或等于) ③>(大于) ④>=(大于或等于 ) ⑤==(等于) ⑥!=(不等于) 说明: 前4个优先级相同,后2个优先级相同,关系运算符的优先级低于算术运算符,关系运算符的优先级高于赋值运算符 1.2关系表达式 用关系运算符将两个表达式(可以是算术表达式或关系表达式,逻辑表达式,赋值表达式,字符

Science|癌症中三级淋巴结构的免疫调节作用与治疗潜力|顶刊精析·24-09-08

小罗碎碎念 Science文献精析 今天精析的这一篇综述,于2022-01-07发表于Science,主要讨论了癌症中的三级淋巴结构(Tertiary Lymphoid Structures, TLS)及其在肿瘤免疫反应中的作用。 作者类型作者姓名单位名称(中文)通讯作者介绍第一作者Ton N. Schumacher荷兰癌症研究所通讯作者之一通讯作者Daniela S. Thomm

excel翻译软件有哪些?如何高效提翻译?

你是否曾在面对满屏的英文Excel表格时感到头疼?项目报告、数据分析、财务报表... 当这些重要的信息被语言壁垒阻挡时,效率和理解度都会大打折扣。别担心,只需3分钟,我将带你轻松解锁excel翻译成中文的秘籍。 无论是职场新人还是老手,这一技巧都将是你的得力助手,让你在信息的海洋中畅游无阻。 方法一:使用同声传译王软件 同声传译王是一款专业的翻译软件,它支持多种语言翻译,可以excel

oracle11.2g递归查询(树形结构查询)

转自: 一 二 简单语法介绍 一、树型表结构:节点ID 上级ID 节点名称二、公式: select 节点ID,节点名称,levelfrom 表connect by prior 节点ID=上级节点IDstart with 上级节点ID=节点值 oracle官网解说 开发人员:SQL 递归: 在 Oracle Database 11g 第 2 版中查询层次结构数据的快速

Tomcat下载压缩包解压后应有如下文件结构

1、bin:存放启动和关闭Tomcat的命令的路径。 2、conf:存放Tomcat的配置,所有的Tomcat的配置都在该路径下设置。 3、lib:存放Tomcat服务器的核心类库(JAR文件),如果需要扩展Tomcat功能,也可将第三方类库复制到该路径下。 4、logs:这是一个空路径,该路径用于保存Tomcat每次运行后产生的日志。 5、temp:保存Web应用运行过程中生成的临时文件