当机器学习模型在水稻基因组的海洋中精准捕捞,一对阻碍作物抗旱性的“刹车”基因OsRAV11/12终于浮出水面。王华锋教授团队通过整合机器学习和功能基因组学方法,发现水稻中的OsRAV11/12基因是抗旱性的负调控因子。该研究近期发表在International Journal of Biological Macromolecules期刊上。研究团队训练了随机森林、XGBoost和前馈神经网络三种机器学习模型,对大量水稻转录组数据进行分析。其中XGBoost模型表现最佳,准确率高达90%,预测出20个潜在的抗旱相关候选基因。
AI筛选基因:从海量数据到关键目标
王华锋教授团队面临着一个生物学难题:如何从水稻数万个基因中找出那些真正控制抗旱性的关键基因?研究团队收集了来自9项独立研究的158个水稻转录组样本,覆盖不同抗旱性的水稻品种。他们训练了三种不同的机器学习模型——随机森林、XGBoost和前馈神经网络,旨在找出基因表达模式与抗旱性之间的隐藏关联。在三种模型中,XGBoost表现出最卓越的性能,不仅达到了90%的分类准确率,AUC值(曲线下面积)更是高达0.97,显示出极佳的预测能力。通过可解释AI技术,研究人员量化了每个基因对模型预测的贡献度,从而识别出最具影响力的抗旱响应基因。
基因验证:从预测到实证
机器学习模型将目标指向了RAV转录因子家族的两个成员——OsRAV11和OsRAV12。为了验证AI预测,研究团队通过CRISPR/Cas9基因编辑技术创制了OsRAV11/12的敲除株系,同时也建立了这些基因的过表达株系。在干旱胁迫下,敲除株系表现出显著增强的抗旱性,存活率高达80%-85%,而野生型仅有57.5%。相反,过表达株系对干旱更加敏感,证实了这些基因对抗旱性的负向调控作用。
生物学机制:基因如何影响抗旱性
深入分析揭示,OsRAV11/12通过多种生理途径影响水稻的抗旱性。在干旱条件下,敲除株系能维持更低的气孔导度,减少水分流失,同时积累更高的脱落酸水平。这些植株还表现出氧化损伤的减轻,丙二醛含量显著降低,表明细胞膜受损程度较小。转录组分析进一步表明,敲除株系中应激响应和蛋白质折叠过程相关基因上调,而过表达株系则出现生长相关基因的不适当表达。
研究意义:为抗旱育种提供新靶点
该研究不仅揭示了水稻抗旱性的新调控基因,更展示了一种基因发掘的新范式。研究首次明确OsRAV11/12作为抗旱负调控因子的功能,为水稻抗旱育种提供了新的遗传靶点和种质资源。机器学习与功能基因组学的结合,大幅提高了基因发现的效率和准确性,为解析复杂农艺性状的遗传基础提供了新思路。通过精准编辑这些负调控因子,育种家有望培育出具有更强抗旱性的水稻新品种,对于应对气候变化、保障粮食安全具有重要意义。
随着全球气候变化加剧,干旱已成为威胁水稻生产的主要因素之一。王华锋教授团队的这项研究,如同为作物育种家提供了一份精确的“基因地图”。未来,这种结合人工智能与基因功能验证的研究模式,有望加速作物遗传改良进程,为全球粮食安全保驾护航。这篇研究成果发表于International Journal of Biological Macromolecules 2025年11月的第329卷第1期。据最新数据,该期刊的影响因子为8.5,属于JCR1区。该期刊主要关注蛋白质、大分子碳水化合物、糖蛋白、蛋白聚糖、木质素、生物多酸和核酸等生物大分子的结构与功能研究。

(图文:王华锋,审核:王睿)