一、文章基本信息
二、摘要
在禾本科植物中,ρ全基因组复制事件产生了三对富集抗病基因(核苷酸结合位点亮氨酸富集重复,NBSLRR)但转录水平较低的古重复染色体对。尽管它们具有进化重要性,但一直缺乏对古重复染色体对的系统性科内研究。我们利用核型分析和进化分析方法研究了37个禾本科基因组,绘制了NBSLRR基因分布图,并检查了代表性物种的转录组和表观基因组模式,以表征古重复染色体对的进化和调控。我们的研究结果表明,古重复染色体对在整个禾本科进化历史中持续存在,在不同亚科中表现出不同的重排模式。值得注意的是,其中一个古重复染色体对在多个亚科中始终富集抗病基因,并表现出保守的低转录活性。该古重复染色体对还在转录起始位点周围表现出保守的CHH低甲基化。进一步分析表明,该古重复染色体对维持着更封闭的染色质状态,并与抑制基因表达的组蛋白修饰相关。这些结果暗示,该古重复染色体对基因的低转录水平可能受到多种表观遗传机制的调控。本研究增进了我们对禾本科ρWGD后古重复染色体对的形成、多样化和表观遗传调控的理解。
三、 主要结果
1. 图1:禾本科古重复染色体对的核型演化
本部分首次基于37个高质量禾本科基因组,系统重建了ρWGD后古重复染色体对的演化动态。图1a以菠萝(保留σWGD后核型)和栽培稻(保留ρWGD后核型)为参考,展示了从单子叶祖先核型(AMK,n=5)经τ、σWGD及重排至禾本科祖先核型(AGK preρ,n=7),再到ρWGD后核型(AGK postρ,n=12)的完整路径。图1b通过菠萝与水稻的共线性分析,揭示了AGK postρ中三对PdCPs(AGK1→Chr01/05、AGK6→Chr08/09、AGK7→Chr11/12)的分散性起源——每对均对应菠萝中两条以上染色体,证明ρWGD后发生了谱系特异的染色体融合与重排。图1c整合六大亚科代表性物种的核型演化图谱,核心发现是:PdCPs虽普遍保留,但其命运高度谱系特异——稻亚科中,菰经历近期WGD后仅存一对PdCPs;竹亚科中,多倍体物种的亚基因组间存在“保守亚基因组”与“重排亚基因组”的分化;早熟禾亚科中,从针茅族到小麦族,染色体数目从24条锐减至7条,仅AGK1来源的单条染色体被保留;黍亚科中,从基部(9条)到衍生(7条)类群,染色体趋向融合丢失,PdCPs逐渐消失;虎尾草亚科在ρWGD后先稳定于n=10,再经历WGD形成n=20多倍体。图例包括:核型演化示意图、菠萝水稻共线性圈图、六大亚科核型演化模式图。
2. 图2:禾本科NBSLRR基因
本部分对37个禾本科物种的15,769个NBSLRR抗病基因进行了系统鉴定与进化分析。图2a显示,CNL亚家族占绝对主导(60.12%),TN型最少(0.57%),该构型与菠萝(外群)一致,表明抗病基因家族的基本架构在单子叶植物中保守。图2b的核心发现是:AGK7来源的PdCPs在除早熟禾亚科外的所有亚科中均显著富集NBSLRR基因(占比20.12%-48.52%),其富集程度远高于AGK1(5.73%-20.34%)和AGK6(5.62%-19.29%)。早熟禾亚科例外是由于小麦族彻底丢失了AGK7同源染色体。图2c以水稻和高粱为例,揭示了AGK7内部的不对称分布:与OsChr12/SbChr08相比,与OsChr11/SbChr05同源的染色体(R11谱系)承载了显著更多的NBSLRR基因。图2de整合多个物种、多个组织的转录组数据,证实NBSLRR基因在所有正常组织中均保持极低的、显著低于非NBSLRR基因的本底表达水平。图2f的关键发现是:稻瘟病侵染后,NBSLRR基因的诱导倍数(log2FC)显著高于非NBSLRR基因,表明其具备“静默-快速响应”的调控特性。图例包括:NBSLRR亚家族分类堆叠柱状图、各亚科AGK1/6/7富集度箱线图、染色体分布点图、组织表达箱线图、病原侵染前后表达变化小提琴图。
3. 图3:禾本科古重复染色体对的转录水平
本部分首次报道了一个跨禾本科、跨物种、跨组织的保守基因组学现象:AGK7来源的PdCPs(而非AGK1/6)在染色体尺度上系统性低表达。图3a汇总六大亚科代表性物种数据,显示所有保留AGK7同源染色体的物种,其AGK7染色体上所有基因的中位表达水平均显著低于基因组整体平均水平。图3bc在水稻和高粱中精细剖析了三对PdCPs的表达行为:AGK7染色体(Os11/12, Sb05/08)表达量显著偏低,而AGK1(Os01/05)和AGK6(Os08/09)与基因组水平无差异。尤为关键的是,R11谱系(Os11, Sb05)的表达水平显著低于其同源伙伴R12(Os12, Sb08)。图3de显示,即使在经历了染色体断裂重排的物种(二穗短柄草、瘤颖草)中,重排后的AGK7来源染色体片段仍然保持显著的低表达状态,而其他重排片段的表达已恢复至基因组平均水平。图3f通过“去除NBSLRR基因后重新计算”的策略,严谨证明:AGK7染色体的低表达是整条染色体的固有属性,而非由其上富集的NBSLRR基因的低表达所导致。图例包括:跨物种AGK7表达水平箱线图、水稻/高粱各染色体表达箱线图(AGK7紫色高亮)、重排物种表达箱线图、有无NBSLRR基因的对比箱线图。
4. 图4:古重复染色体对的甲基化调控模式
本部分通过整合多个物种、多个组织的全基因组重亚硫酸盐测序数据,揭示了AGK7来源PdCPs上保守且独特的DNA甲基化景观。图4a以水稻和高粱叶片为例,展示AGK7染色体具有显著高于基因组平均的CG和CHG甲基化水平,以及显著低于平均的CHH甲基化水平。AGK1/6无此特征。图4b的基因区域meta图显示,AGK7染色体的CG/CHG高甲基化富集于基因体、TSS和TES区域,CHH低甲基化特异地富集于TSS周围。这种模式在水稻和高粱中完全保守,且在R11谱系(Os11, Sb05)上比R12谱系更强。图4c在经历WGD和重排的巨菌草中证实,尽管CG/CHG模式发生组织特异性改变,CHH在TSS/TES的低甲基化依然严格保守。图4de的DNA甲基化抑制剂(AzaD)处理实验是关键的功能验证:抑制甲基化后,AGK7染色体表达水平显著但小幅提升(~4.6%),表明DNA甲基化是维持其低表达状态的必要但不充分条件。图例包括:染色体甲基化水平箱线图、基因区域甲基化meta图、巨菌草多组织甲基化meta图、AzaD处理前后甲基化/表达变化图。
5. 图5:古重复染色体对的染色质可及性与组蛋白修饰
本部分整合ATACseq和ChIPseq数据,揭示了AGK7来源PdCPs上多层级的、协同的表观遗传抑制状态。图5a的染色质可及性分析显示,在水稻和高粱中,AGK7染色体TSS上游区域的开放程度显著低于基因组平均水平,且R11谱系的抑制程度强于R12谱系。相关性分析证实,TSS开放程度与基因表达水平呈显著正相关。图5b的组蛋白修饰全景图是核心发现:与全基因组平均水平相比,AGK7染色体(尤其R11谱系)呈现三重复合抑制信号——转录延伸标志H3K36me3在基因体区域显著缺失,转录抑制标志H3K27me3在基因体区域显著富集,转录启动标志H3K4me3在TSS区域显著减少。这些信号在按表达水平排序的热图中清晰可见,高表达基因区段对应高H3K36me3/H3K4me3、低H3K27me3,而AGK7染色体整体偏向热图底部(低表达区域)。图例包括:TSS周围ATACseq信号meta图及箱线图、组蛋白修饰热图及meta图。
四、总结
本研究是植物比较基因组学与表观基因组学交叉领域的一项鸿篇巨制。其核心成就是通过对覆盖禾本科全部六大核心亚科、37个基因组的系统核型分析,整合转录组、DNA甲基化组、染色质可及性组及组蛋白修饰组的多维数据,首次在科级水平上完整描绘了ρWGD所诞生的三对“古重复染色体对”跨越近亿年的演化命运与功能特化全景。主要贡献如下:
综上,这项工作将“古染色体”从一个抽象的进化概念,转化为具有明确功能身份、可遗传修饰、可实验操作的生物学实体,是植物多倍体演化研究的一座新里程碑。