贾继增介绍,小麦是世界最重要农作物之一,基因组巨大而且复杂,和其他作物相比转座子含量特别高。这使得小麦基因组测序组装异常困难。粗山羊草是小麦D基因组供体种,对小麦品种改良非常重要。该研究团队在2013年完成了粗山羊草基因组草图的绘制,研究成果在《自然》上发表,4年多来已被引用412次,成为小麦研究领域高被引论文之一。然而受当时技术条件所限,研究的深入与基因组信息的利用不足。
近年来,该团队利用二代、三代等测序技术与最新的组装技术,对D基因组重新测序和组装,将组装质量提高210倍,完成了染色体级别的D基因组精细图谱的绘制。利用高质量的组装结果,准确地进行了基因注释,构建了基因分布图、基因表达图、假基因分布图、重复序列分布图、甲基化分布图、重组率分布图和smallRNA分布图。研究发现,粗山羊草基因组中有一批基因在近期发生了复制。
研究还重点分析了TE对基因组结构、基因复制、假基因形成与基因表达的影响,发现有近1/2的基因中携带有TE,是已测序基因组中携带TE基因最多的物种,也是迄今为止报道的假基因数量最多的物种。TE通常还抑制基因的表达。