棉花是全球最重要的经济作物之一。它的纤维,俗称皮棉,是纺织工业主要的天然资源。大约3300万公顷(约占世界5%的耕地)用于棉花种植。
一个国际科研小组公布了最简单的棉花基因组,在这项研究中,研究人员追踪棉花和纤维发展了数百万年的演变。
他们希望从基因组信息中寻找到纤维素合成的奥秘,为下一代的生物燃料提供参考。相关论文发表在Nature杂志上。
由棉花制成的物品在我们日常的生活中随时可见,然而,对于生物能源的研究者而言,纤维成分比颜色和质地等其他因素研究显得更为重要。
棉的种植,加工和制造,是全球主要产业。在美国,超过20万的国内就业与棉花生产和加工相关,每年增长棉纤维,棉子油和粕副产品价值近十亿。
除了它的经济价值,棉花也是一种研究多倍体化、细胞伸长和细胞壁生物合成的极好的模式系统。
现在,包括美国能源部联合基因组研究所(DOE JGI)等31个机构组成的国际科研小组,提出了一种高品质的组件,最简单的棉花(雷蒙德氏棉)基因组图谱。
该团队对比了从这个物种的祖先基因组与美国农业部(USDA)提供的其他几个棉花的基因组信息。
研究人员测序和组装了雷蒙德氏棉的草图基因组,雷蒙德氏棉的祖先被公认为是生成皮棉的经济上重要的棉花种类陆地棉(G.hirsutum)和海岛棉(G. barbadense)D亚基因组的供体。超过73%的组装序列被锚定在13条雷蒙德氏棉染色体上。
基因组包括了40,976个蛋白质编码基因,92.2%得到了转录数据的进一步证实。研究人员获得了在双子叶植物中有可能共享了paleohexaploidization事件以及在1300-2000万年前棉花全基因组复制(WGD)事件的证据。
在雷蒙德氏棉基因组中确定了总共2,355个保守块,大约有40%的平行基因存在于超过1个保守块中,表明在进化过程中基因组经历了重要的染色体重排。近57%的基因组由转座元件(transposable elements ,Tes)构成,其中大部分可能来自长末端重复序列(long terminal repeat,LTRs)扩增。研究人员在对陆地棉(G.hirsutum)和海岛棉(G. barbadense)种对纤维形成起关键作用的基因间观察到了定性差异。
通过系统进化分析揭示棉花以及可可(T. cacao)有可能是唯一具有棉酚生物合成CDN1基因家族的植物物种。研究人员从雷蒙德氏棉胚珠和叶组织cDNA文库中获得了约10GB的Illumina高通量读段(reads),并以单碱基对分辨率进行了全基因组绘图。
跨越9个真核生物物种比较基因组学揭示了,在雷蒙德氏棉与拟南芥之间保守的选择性剪接(AS)事件,但在双子叶植物、单子叶植物和其他物种间各不相同。KNOX基因家族由同源结构域转录因子构成,从前报道与叶形态发育相关。
AS事件导致了雷蒙德氏棉中转录因子生物化学功能所必需的同源结构域丢失。在棉花叶发育过程中伴随着显著不同的表达水平,新研究数据揭示了AS在植物的形态发生中有可能具有的新的潜在的调控机制。
在美国多数地区种植的棉花为多倍体,由棉花种类A和D杂交而成,作为一个最接近的现存亲本的的四倍体棉花基因组(含四组染色体),二倍体G. 雷蒙德被选定为测序部分,因为它有一个较小的基因组和较少的重复元素。D-基因组棉与A-基因组棉不同,不会产生可纺性纤维。这项研究由美国农业部提供的数据使团队得以跟踪棉花的血统,杂交和基因复制,从而了解纤维的发展演变。
这次研究将有助于加速棉花基因功能研究,特别是纤维素的生物合成,从而改善生物燃料的生产。