竹类植物是竹亚科(Bambusoideae)植物的总称,与水稻、小麦、大麦和燕麦同属于禾本科BOP分支,具有重要的经济、生态和文化价值。2013年以来,毛竹和芸香竹的基因组草图,以及麻竹参考基因组相继完成。近日,中国科学院昆明植物研究所李德铢研究团队在 Nature Genetics 的论文发布了11个代表各主要分支和倍性的竹类植物参考基因组(Ma et al., 2024)。至此发布的竹类植物基因组已有18个,其中6个为草图,12个为染色体水平的高质量参考基因组(2个草本竹类和10个木本竹类)(图1)。为更好地服务竹类植物的系统进化和功能研究,有效归纳和整理这些海量组学和分类学数据已经成为一个非常迫切的需求。
图1 已发表的竹类植物基因组信息。其中,HB为草本竹类,NWG为新热带木本竹类,PWB为旧热带木本竹类,TWB为温带木本竹类。2x,4x,6x为各分支的染色体倍性。H、A、B、C、D分别代表草本竹类和木本竹类的4个祖先亚基因组。
近日,Molecular Plant 在线发表了李德铢研究团队题为 BambooBase: A comprehensive database of bamboo omics and systematics 的论文。该文公布的竹类组学和分类学信息平台(BambooBase,https://bamboo.genobank.org/)(图2),收录了竹类植物18个基因组、476个转录组和16个表观基因组的数据,以及135个属的分类学信息(图3A)。研究团队基于序列相似性和基因共线性信息,构建了竹亚科物种基因组/亚基因组间的同源基因数据集(图3B)。平台提供了丰富的生物信息学工具,方便用户对不同竹类植物基因以及基因同源关系进行查询、分析和可视化(图3C)。用户可以在Help栏目查阅平台使用手册。BambooBase用户界面友好,是一个集成竹类多组学和分类学资源的信息平台,可为全球从事竹类相关研究的人员提供一站式数据支持。
图2 BambooBase主页
竹类植物经历过多次异源多倍化事件,各主要分支间具有复杂的网状演化关系(Ma et al., 2024),同源基因的鉴定比较困难。该平台选择水稻作为外类群,以亚基因组为单位,通过整合序列相似性和基因共线性信息,将13个基因组27个亚基因组的基因聚类划分到166,307个共线直系同源基因簇(Syntelog Groups,SGs)。与仅使用序列相似性信息聚类方法获得的基因簇相比,SGs在区分直系同源基因和旁系同源基因方面表现更优。此外,同严格要求基因拷贝数符合染色体倍性的“完美拷贝”(perfect-copy)方法(Guo et al., 2019)相比,SGs提供了更灵活和更全面的直系同源基因数据集。平台用户可以从目标基因出发,查询其所在同源基因簇的所有基因列表和基因树(图3E)。
图3 BambooBase平台主要模块和功能
BambooBase为每个基因建立一张“卡片”(图3F),记录包括基因注释、各类组织和不同发育阶段表达量等基本信息,而且可以从该卡片链接到基因组可视化(图3I)和同源基因(图3E)等模块以及相关外部数据库。另外,平台提供了丰富的查询、分析和可视化工具,如微观和宏观尺度(亚)基因组共线性(图3G,H)、序列搜索比对(图3J)、引物设计、同一竹种(如毛竹)不同拼接组装版本的基因ID转换(图3K)、功能基因富集(图3L)和共表达网络分析等。
除了多组学数据外,竹类系统发育工作组(BPG II)版面集中介绍了竹亚科已知全部3个族135属的主要分类学信息(图3D),包括每个属发表时的原始文献、异名、模式种、形态学描述和地理分布等。此外,还提供了一些主要属的相关研究文献、标本及活体照片和所含物种等信息。
中国科学院昆明植物研究所刘云龙副研究员、博士生高舒扬、金桂花副研究员、周梦媛博士、安徽农业大学高琪娟博士为论文第一作者,昆明植物研究所刘云龙副研究员、马朋飞研究员和李德铢研究员为论文共同通讯作者,安徽农业大学夏恩华教授参与该数据库的构建工作。本研究依托国家重大科技基础设施中国西南野生生物种质资源库完成,得到中国科学院战略性先导科技专项(No. XDB31000000)、云南省科技厅科技计划项目(No.202101AT070175)、国家自然科学基金国际合作项目(No.32120103003)和云南省生物资源数字化开发应用(202002AA100007)等项目的支持。
文章链接
(责任编辑:李雪)
|