分歧时间估计与被子植物的年代-文献精读43

2024-09-01 03:12

本文主要是介绍分歧时间估计与被子植物的年代-文献精读43,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Ad fontes: divergence-time estimation and the age of angiosperms
回归本源:分歧时间估计与被子植物的年代

摘要

准确的分歧时间对于解释和理解谱系演化的背景至关重要。在过去的几十年里,有关冠被子植物推测的分子年龄(通常估计为晚侏罗世至二叠纪)与化石记录(将被子植物置于早白垩纪)之间的差异,引发了广泛的争论。如果冠被子植物早在二叠纪甚至三叠纪就已经出现,这将对生命之树中最具影响力的类群之一的起源的古生态背景产生重大影响。我们在此论证,并通过模拟展示,分子数据和松弛时钟模型推测的较老年龄受到谱系特异性速率异质性的误导,而这种异质性是由于在维管植物演化过程中多次发生的生活史变化导致的。为了克服年龄估计中持续存在的差异,应该开发更具生物学依据和现实性的模型,并在接受与我们最有力证据存在重大出入的推论之前,首先考虑我们的结果在生物学上的含义。

在16世纪和17世纪的宗教改革期间,像改革运动破坏偶像派这样的大众运动试图剥离基督教崇拜中的多余元素,以更接近真理(图1)。我们借用这一比喻来讨论被子植物的分歧时间,目的有二:首先,尽管分歧时间技术取得了进展,并且古生物学家、系统学家和进化生物学家对此高度关注,但年龄估计往往与化石记录大相径庭,导致一些人质疑分子年龄估计的可信度,另一些人则建议我们重新解释被子植物的化石历史。像破坏偶像派一样,我们的目标是简化有关被子植物冠年龄的讨论,聚焦于生物学,去除方法论争论中的不必要复杂性。我们认为,考虑到我们对种子植物生物学的理解,分子年龄与化石估计之间的差异是可以预期的。然而,我们也主张,分子年龄估计趋向于推测较老年代的倾向,可能源于错误和模型误设(例如,Beaulieu等,2015;Brown & Smith,2018;Budd & Mann,2024)。

安特卫普圣母教堂的毁坏,发生于1566年8月20日的破坏圣像运动期间,由Frans Hogenberg雕刻(公共领域)。 其次,就像破坏偶像派将他们的活动集中在图像而非个人上一样,我们的批评是针对方法,而不是研究人员。我们是最早提出冠被子植物的三叠纪分子年龄的研究者之一(如Smith等,2010年),同时我们也探讨了导致分子年龄估计偏大的偏差问题(Beaulieu等,2015年;Brown & Smith,2018年)。分歧时间的方法必须发展得更符合生物学的现实,特别是解决模拟谱系特异性速率异质性的挑战。即便是那些所谓的松弛时钟方法,虽然承认速率是变化的,但在面对显著且生物学上现实的谱系速率变化时,仍然倾向于高估分子年龄(Dornburg等,2012年;Wertheim等,2012年;Beaulieu等,2015年)。因此,我们倡导改进理解被子植物演化时间的方式,并认为目前尚未有证据表明冠被子植物的年龄显著早于化石记录所暗示的年龄。

化石记录显示了什么?

最近几篇综述讨论了早期被子植物的化石记录(如Friis等,2010年,2011年;Coiro等,2019年),我们不打算在此简单概述这些工作。相反,我们强调与被子植物年龄的分歧时间估计问题相关的化石记录中一些最重要的方面。

最早的确凿被子植物化石来自于瓦朗吉尼亚期的单沟纹花粉记录,年代为约1.398–1.326亿年前(Friis等,2011年;Coiro等,2019年)。虽然伯里亚期/瓦朗吉尼亚期和伯里亚期/提托尼期的边界尚未正式确立,但这些研究中使用的地层框架为被子植物提供了一个可靠的最小冠年龄。一些三叠纪的单沟纹花粉记录被发现,但被认为是干被子植物或位于其他种子植物冠类之前的干系上(Coiro等,2019年)。宏观化石(即不需要在显微镜下观察的显著遗骸)直到巴列姆期约1.257–1.214亿年前才能自信地被归入冠被子植物(Gomez等,2015年)。三沟花粉,与真双子叶植物的出现有关,也出现在巴列姆期。然而,尽管三沟花粉的出现无疑为被子植物出现提供了可靠的最小冠年龄,并在一些研究中被如此使用,但这可以说是过于保守的(见Smith等,2010年)。相反,巴列姆期的三沟花粉出现应被视为真双子叶植物的最小年龄。

展示冠类内任何成员特征的化石为该冠类的出现提供了最小年龄。起源必须早于我们最早的化石证据的年代,这一早期时间范围的广度尚不确定,且常常成为争论的来源。值得注意的是,埋藏学偏差可能会影响我们的解释。鉴于早期被子植物的生态假说(Feild等,2004年),化石记录可能无法充分保存它们或其特征器官。例如,如果被子植物出现在干旱环境中,它们可能不会在化石沉积物中得到体现(Behrensmeyer等,2000年)。此外,准确估计类群的祖先形态,尤其是较老的类群,存在挑战。我们是否有足够的知识来识别化石记录中的早期被子植物?我们在寻找一棵树、一株灌木,还是一种草本植物?

这些问题在被子植物古生物学领域中司空见惯。然而,鉴于我们对化石记录的现有理解,没有明确证据表明被子植物在瓦朗吉尼亚期前50–1亿年期间被隐藏。对化石记录的严格解释表明,如果被子植物起源于早白垩纪,它们必须在此后不久发生剧烈的多样化,并经历了非凡且广泛的迁移,遍布全球各地。目前,化石记录并未排除被子植物晚侏罗纪起源的可能性,但更早的时期则不太可能(Coiro等,2019年)。

分子模型显示了什么?

如今常用的分歧时间估计方法采用‘松弛时钟’模型,允许谱系间存在一定程度的速率变化。流行的实施方法包括Beast中的贝叶斯非相关对数正态方法(UCLN)(Drummond等,2006年),MCMCTree中的相关速率模型(Rannala & Yang,2007年),r8s和treePL中的惩罚似然法(Sanderson,2002年;Smith & O'Meara,2012年),lsd2和iqtree中的最小二乘法(To等,2016年),以及RelTime,这是一种在Mega中实现的通过最小化速率变化的算法方法(Tamura等,2018年)。许多研究者使用这些方法对冠被子植物推测的年龄进行了总结(如Magallón等,2015年;Barba-Montoya等,2018年;Sauquet等,2022年)。在不重复他们工作的情况下,我们简要总结了出现的一些总体模式。

冠被子植物的年龄,可能比其他任何分类群都更激发了有关分子钟模型与化石记录相比的效用的激烈争论(Smith等,2010年;Doyle,2012年;Beaulieu等,2015年;Barba-Montoya等,2018年;Coiro等,2019年)。即便冠类的年龄被约束在反映白垩纪的化石年龄(Magallón等,2015年;Foster等,2017年),目前的分子系统学估计也暗示被子植物的冠类年龄集中在三叠纪,大约2亿年前,甚至更早(图2;Bell等,2010年;Smith等,2010年;Clarke等,2011年;Zeng等,2014年;Magallón等,2015年;Barba-Montoya等,2018年;Sauquet等,2022年)。值得注意的是,Silvestro等(2021年)使用一种仅应用于化石数据的复杂模型,发现了一些支持被子植物冠类群在晚二叠纪起源的证据。尽管分子年代测定方法通过进一步放宽替代率遗传的假设并将化石校准视为概率先验而逐渐增加了复杂性和精确性,但化石记录与被子植物分子年龄估计之间的差距仍然存在(图2)。如果认为分子分歧时间更接近事实,这就需要假设被子植物在相当长一段时间内在生态上并不占主导地位,或者它们局限于不太可能化石化的环境中生存(Feild等,2004年;Smith等,2010年)。

分歧时间估计(线条)与冠被子植物和冠双子叶植物最早化石证据的关系(彩色框)。X轴代表时间(百万年)。这些线条反映了Barba-Montoya等(2018年)和Sauquet等(2022年)汇编的各项研究中的可信区间,并与Coiro等(2019年)获得的最早单沟纹和三沟纹被子植物花粉记录的年龄一起放置。

分子分歧时间是否构成证据?

要判断分歧时间估计是否构成类群年龄的证据,需探讨我们对“证据”的理解,以及这些分析的结果是否符合这些标准。证据通常用于支持或反驳某个假设或理论。设想一种情景,如果我们在一个2亿年前的地层中发现了具有被子植物冠类共近现性状的化石花朵,我们将不得不推定被子植物冠类的年龄至少为2亿年。假设我们发现了一朵具有被子植物冠类共近现性状的1亿年前的化石花朵,这个年轻的化石并不能否定被子植物的更早起源,并为被子植物至少已有1亿年历史提供了进一步证据。

我们能对分子分歧时间得出类似的结论吗?这些时间表明被子植物的年龄比化石记录早5000-1亿年。化石的年龄是基于地质层和形态特征确定的,而分子分歧时间则依赖于估计的每个位点的替代率来推断替代速率的整体分布。每个位点的替代率估计混淆了速率和时间。分歧时间分析提供了一种通过使用假设分子进化速率变化的模型来分离两者的方法。例如,我们必须评估替代速率是否严格钟式且在各个分支间共享,是否以无相关方式随机变化,或者是否在亲代和子代分支间自相关并大体共享。我们必须确保模型违例和偏差不会过度影响估计,以评估推测的年龄是否支持特定的假设。虽然这些模型简化了复杂过程,但明确的假设和对模型局限性的理解有助于评估推论的稳健性。如果数据与模型吻合良好,且结果并非单纯由模型驱动,那么分子数据中的较老年龄估计可能在缺乏绝对时间的直接观察情况下,微弱地支持较老的年龄。因此,我们必须时刻问自己,我们的数据与我们的模型吻合得有多好?

植物中谱系特异性速率异质性的证据是什么?

替代速率在生命之树中有许多潜在的相关性,包括但不限于世代时间、种群规模、新陈代谢速率和体型(Martin & Palumbi,1993年;Gillooly等,2005年;Galtier等,2006年;Nikolaev等,2007年;Nabholz等,2008年;Smith & Donoghue,2008年;Bromham,2009年;Lanfear等,2010年)。植物谱系在进化速率(无论是分子还是形态学)上存在差异,这一点已经被推测了至少一个世纪,分析结果通常只证实了这些假设。

不深入文献讨论,我们注意到几个例子,这些例子展示了替代速率异质性的模式。生命史属性(如一年生与多年生、草本与木本)是陆地植物中替代速率变化的关键相关性。在被子植物中,分子速率的变化往往与生活史的变化有关(Smith & Donoghue,2008年;Smith & Beaulieu,2009年),在草本和木本谱系间,速率可能快3-5倍(Smith & Donoghue,2008年)。无论这些变化发生在配子体和孢子体阶段,还是在总体繁殖速率中,植物的进化都凸显了生活史的变化。严格坚持分子钟模型与基础生物学的冲突如此剧烈,以至于其使用会显著影响最终的年龄估计。事实上,陆地植物分歧时间的一些分析与化石记录之间的差异,可以部分归因于在存在谱系特异性分子替代速率变化的情况下假设了严格的分子钟(如Heckman等,2001年;Sanderson等,2004年)。

这对分歧时间方法意味着什么问题?

谱系特异性速率使分歧时间的估计变得复杂,因为我们不能假设一个谱系的替代速率准确代表了树中其他谱系的替代速率。例如,如果我们在包含嵌套有世代时间更长的谱系的树上应用较短世代时间(因而更快的时钟)的谱系的替代速率,模型可能会错误地将长分支上的许多替代解释为代表更长的时间持续,而不是更快的速率。这种错误的模型设定将倾向于将整个类群的年龄推回到过去,这种情况可能会“下传”到距离较远的节点。确实,在被子植物的情况下,高度争议的三叠纪年龄可能由多次向更快速生活史策略的转变所解释,这表现为被子植物中嵌套类群中的一般更快的替代速率,推迟了推测的冠部分子年龄(Beaulieu等,2015年)。当考虑被子植物在所有种子植物中的年龄时,这种现象变得更加复杂,因为它们的姐妹群裸子植物表现出的替代速率比平均开花植物慢4倍(Buschiazzo等,2012年)。

为了更好地展示生活史演化对分歧时间估计的挑战,我们进行了系列模拟(参见支持信息方法S1)。虽然不打算覆盖所有情景,但这些模拟展示了生物现象和方法学限制如何阻止我们充分估计从分子数据集推测的被子植物分歧时间。此外,为了剥离一些方法学的复杂性,我们专注于一种常用方法——惩罚似然法。这种方法允许谱系间速率异质性,同时只考虑构建的分子系统发生树和化石,排除了系统发生推论的考虑。然而,这里讨论的偏差也适用于其他常用方法(参见Beaulieu等,2015年;Brown & Smith,2018年;Budd & Mann,2024年对其他方法偏差的讨论)。模拟的冠被子植物、裸子植物和种子植物的年龄分别为1.5亿年、3亿年和3.5亿年。我们选择这些年龄是为了提出这样一个问题:如果冠被子植物的真实年龄与当前化石记录一致,在存在速率异质性的情况下,当前方法可能会在多大程度上估计出更老的年龄?在这里,我们假设速率异质性是由于生活史变化导致的,这通过首先使用基本替代速率,然后将对应被子植物的速率乘以2倍,并将对应裸子植物的速率乘以0.5倍来实现。我们还假设在每个类群内的异质性具有广泛的替代速率变化(Γ形状=1)或较窄的谱系内分布(Γ形状=100)。

图3中强调了两个关键且普遍的发现。首先,我们发现无论在类群内或类群间的替代速率异质性程度如何,当化石(我们从灭绝类群中采样获得)被用作最小和最大约束时,分歧时间都会被严重低估。这值得注意,因为看起来直观的是,使用固定约束作为一种手段来不允许由于替代速率异质性导致的冲突推动年龄向后。然而,这产生了相反的效果,使得冠类的年龄偏得过于年轻。其次,我们发现当校准仅用作最小年龄约束时,被子植物的年龄被大幅高估了约90百万年(图3c平均偏差=-89.4百万年;图3d平均偏差=-91.2百万年)。对于替代速率更慢的裸子植物,推测的年龄倾向于根据谱系内的速率异质性被低估或高估(图3c平均偏差=-89.4百万年;图3d平均偏差=-91.2百万年)。总体而言,使用更宽的Γ分布所应用的更高随机性的速率的影响是使年龄估计更为宽泛(图3c)。然而,高估被子植物冠类年龄的模式依然存在(图3c,d)。我们注意到,即使我们使用不同的分歧时间算法(即lsd2),当我们大幅增加树的大小或树是在高灭绝率下生成的情况下,过度估计仍然存在(图S1-S4)。

在存在显著的谱系内和谱系间替代速率异质性的情况下,冠年龄的模拟偏差。真实的进化树包含400个物种,总体上由冠年龄分别对应于被子植物(Angio.)、裸子植物(Gymno.)和种子植物的类群组成。谱系间的替代速率异质性是通过将基础替代速率乘以2倍应用于对应被子植物的分支,并乘以0.5倍应用于对应裸子植物的分支来生成的。我们还假设每个类群内的异质性具有广泛的替代速率变化(Γ形状=1;a,c)或较窄的谱系内分布(Γ形状=100;b,d)。小提琴图显示了中位数和四分位范围。无论谱系内和谱系间替代速率的异质性程度如何,当化石被用作最小和最大约束时,分歧时间都被严重低估(a,b)。然而,当校准(Calib.)仅用作最小年龄约束时,被子植物的年龄被严重高估(c,d)。一般而言,通过使用较宽的Γ分布应用更高的随机性速率,其影响是相比较窄的Γ分布(b,d)产生了更广泛变化的年龄估计(a,c)。

失去与生物学的联系

尽管在速率和日期估计方法上有所进展,但要更准确地估计替代速率固有的谱系特异性异质性,从而影响分歧时间估计的根本障碍仍然存在。首先,这些模型普遍缺乏生物学的现实性。替代速率在物种之间或随着时间的变化通常不均匀,甚至在近亲之间也可能显著变化(Cho等,2004年)。虽然有研究专门探讨了替代速率变化的相关性,但较少有研究利用这些信息来为分歧时间估计提供模型。例如,对于一些贝叶斯非相关模型,速率的分布是为了统计上的便利而选择的,而非基于生物学的现实。例如,在某些情况下,基础模型假设具有高速率的祖先分支没有更大或更小的可能性产生低速率或高速率的后代分支,这与速率是可遗传的观念相违背(Lynch,2010年)。另一方面,惩罚似然法是在预期谱系通常继承进化速率的情况下开发的,这在相对较小的密切相关生物体数据集上似乎是合理的。然而,随着数据集包括更广泛采样的谱系,尤其是在生活史演化频繁发生的植物中,这种合理性变得不那么可靠。

除了我们用来分析这些数据的模型缺乏生物学现实性外,我们对类群年龄的较老估计的古生物学、进化和古生态学含义的讨论也很少。例如,正如一些分子分歧时间所表明的那样,被子植物冠类起源于二叠纪的后果是什么?二叠纪主要有热带和亚热带气候,主要由银杏目、松柏类、蕨类植物、种子蕨和苏铁类植物等占据。温带生物群落由种子蕨、楔叶植物、蕨类植物、科达尔类、石松类和舌羊齿等代表(例如,DiMichele等,2001年)。如果冠被子植物在这一时期起源,它们不仅必须在化石记录中隐藏超过1亿年,而且还必须在一个与最早发现化石的古生态背景完全不同的背景下起源。

同样,如果冠被子植物在三叠纪至早侏罗纪期间出现,这将发生在一个比晚二叠纪至早三叠纪明显更冷的地球上,当时苏铁类、贝尼特类、蕨类植物、松柏类和银杏目植物主导了较温和的气候(Mander等,2010年;Bonis & Kürschner,2016年;Kustatscher等,2018年)。如果冠被子植物确实在这一时期起源,它们在化石记录中可能很稀少,并且适应了与目前化石记录推测的明显不同的古生态条件。尽管环境差异不排除这一可能性,但提出冠被子植物的古老起源具有重要的进化意义,然而这些在现有文献中常常被忽视。任何关于冠被子植物二叠纪或三叠纪起源的断言都必须面对这样一个可能性,即由于气候和生态系统的巨大差异,它们表现出与现代代表明显不同的形态学和生态学特征。虽然这些地质时期的化石确实存在,但它们缺乏被子植物的定义性心皮。这种古老起源的提出与我们对被子植物进化的理解之间的不一致,凸显了重新评估早期陆地和种子植物进化的必要性,或者至少促使我们重新评估分子分歧时间所暗示的年龄。

结论

分歧时间分析得出的带有时间标记的系统发生树在将生物系统置于更广泛的进化背景中发挥了关键作用。它们是许多比较分析的重要信息来源,例如那些追踪时间上多样性动态的分析,以及那些试图揭示进化的速度和模式的分析。我们上面的讨论强调了我们对适用于生命之树各类群的分歧时间方法的更广泛的担忧(另见Budd & Mann,2024年)。当我们的结果呈现出一个与生命历史显著不同的观点时,例如在植物生命的情况下,考虑我们模型或解释中的错误可能比直接排除冲突数据更合理。像16世纪和17世纪的破坏偶像运动一样,简化分析并专注于基础生物学可能会带来更清晰的证据理解。分析的复杂性可能让我们离证据更远,更重要的是,离生物学更远。

这篇关于分歧时间估计与被子植物的年代-文献精读43的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1125776

相关文章

服务器集群同步时间手记

1.时间服务器配置(必须root用户) (1)检查ntp是否安装 [root@node1 桌面]# rpm -qa|grep ntpntp-4.2.6p5-10.el6.centos.x86_64fontpackages-filesystem-1.41-1.1.el6.noarchntpdate-4.2.6p5-10.el6.centos.x86_64 (2)修改ntp配置文件 [r

MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页:https://tangyuan96.github.io/minigpt_3d_project_page/ 代码:https://github.com/TangYuan96/MiniGPT-3D 论文:https://arxiv.org/pdf/2405.01413 MiniGPT-3D在多个任务上取得了SoTA,被ACM MM2024接收,只拥有47.8M的可训练参数,在一张RTX

批处理以当前时间为文件名创建文件

批处理以当前时间为文件名创建文件 批处理创建空文件 有时候,需要创建以当前时间命名的文件,手动输入当然可以,但是有更省心的方法吗? 假设我是 windows 操作系统,打开命令行。 输入以下命令试试: echo %date:~0,4%_%date:~5,2%_%date:~8,2%_%time:~0,2%_%time:~3,2%_%time:~6,2% 输出类似: 2019_06

【MRI基础】TR 和 TE 时间概念

重复时间 (TR) 磁共振成像 (MRI) 中的 TR(重复时间,repetition time)是施加于同一切片的连续脉冲序列之间的时间间隔。具体而言,TR 是施加一个 RF(射频)脉冲与施加下一个 RF 脉冲之间的持续时间。TR 以毫秒 (ms) 为单位,主要控制后续脉冲之前的纵向弛豫程度(T1 弛豫),使其成为显著影响 MRI 中的图像对比度和信号特性的重要参数。 回声时间 (TE)

BERT 论文逐段精读【论文精读】

BERT: 近 3 年 NLP 最火 CV: 大数据集上的训练好的 NN 模型,提升 CV 任务的性能 —— ImageNet 的 CNN 模型 NLP: BERT 简化了 NLP 任务的训练,提升了 NLP 任务的性能 BERT 如何站在巨人的肩膀上的?使用了哪些 NLP 已有的技术和思想?哪些是 BERT 的创新? 1标题 + 作者 BERT: Pre-trainin

LeetCode:64. 最大正方形 动态规划 时间复杂度O(nm)

64. 最大正方形 题目链接 题目描述 给定一个由 0 和 1 组成的二维矩阵,找出只包含 1 的最大正方形,并返回其面积。 示例1: 输入: 1 0 1 0 01 0 1 1 11 1 1 1 11 0 0 1 0输出: 4 示例2: 输入: 0 1 1 0 01 1 1 1 11 1 1 1 11 1 1 1 1输出: 9 解题思路 这道题的思路是使用动态规划

O(n)时间内对[0..n^-1]之间的n个数排序

题目 如何在O(n)时间内,对0到n^2-1之间的n个整数进行排序 思路 把整数转换为n进制再排序,每个数有两位,每位的取值范围是[0..n-1],再进行基数排序 代码 #include <iostream>#include <cmath>using namespace std;int n, radix, length_A, digit = 2;void Print(int *A,

LeetCode:3177. 求出最长好子序列 II 哈希表+动态规划实现n*k时间复杂度

3177. 求出最长好子序列 II 题目链接 题目描述 给你一个整数数组 nums 和一个非负整数k 。如果一个整数序列 seq 满足在下标范围 [0, seq.length - 2] 中 最多只有 k 个下标i满足 seq[i] != seq[i + 1] ,那么我们称这个整数序列为好序列。请你返回 nums中好子序列的最长长度。 实例1: 输入:nums = [1,2,1,1,3],

未雨绸缪:环保专包二级资质续期工程师招聘时间策略

对于环保企业而言,在二级资质续期前启动工程师招聘的时间规划至关重要。考虑到招聘流程的复杂性、企业内部需求的变化以及政策标准的更新,建议环保企业在二级资质续期前至少提前6至12个月启动工程师招聘工作。这个时间规划可以细化为以下几个阶段: 一、前期准备阶段(提前6-12个月) 政策与标准研究: 深入研究国家和地方关于环保二级资质续期的最新政策、法规和标准,了解对工程师的具体要求。评估政策变化可

用Python实现时间序列模型实战——Day 14: 向量自回归模型 (VAR) 与向量误差修正模型 (VECM)

一、学习内容 1. 向量自回归模型 (VAR) 的基本概念与应用 向量自回归模型 (VAR) 是多元时间序列分析中的一种模型,用于捕捉多个变量之间的相互依赖关系。与单变量自回归模型不同,VAR 模型将多个时间序列作为向量输入,同时对这些变量进行回归分析。 VAR 模型的一般形式为: 其中: ​ 是时间  的变量向量。 是常数向量。​ 是每个时间滞后的回归系数矩阵。​ 是误差项向量,假