7月30日,上海人工智能实验室联合崖州湾国家实验室、中国农业大学等单位,推出生物育种领域自主科学发现系统“丰登·基因科学家”(GeneScientist)。“基因科学家”是在种业大模型“丰登”(SeedLLM)的基础上进一步研发的科研智能体,目前已具备模拟分子生物学家自主开展作物基因功能研究。
在“基因科学家”的辅助下,科研人员在主粮作物中成功发现了数十个此前未被报导的基因功能,并获得实验证实,未来有望帮助提高作物分子生物学家提升科研效率,助力提升作物品质、缩短育种周期。
在日前召开的在世界人工智能大会2025科学前沿全体会议上,上海人工智能实验室推出“书生”科学发现平台,并联合多家顶尖科研机构及企业发布十项“突破性科学智能联合创新成果,“丰登”因其在国内首次确立大模型育种的技术路线入围其中。
作物育种的核心是精准改造基因组以优化农艺性状。为实现这一目标,必须系统理解基因与性状的关系,特别是基因通过何种分子机制调控性状形成。长期以来,基因功能研究只能依赖科研人员的经验积累,面临周期长、研究效率难以提升的瓶颈。
以水稻育种为例,自2005年水稻全基因组测序完成以来,全球已投入大量资金用于其基因功能研究。但目前仍有约90%的水稻基因功能尚未明确;玉米、大豆等主要作物的未知功能基因占比更高。这表明人工主导的传统研究模式难以满足现代育种需求,亟需借助人工智能等前沿技术推动研究范式的智能化转型。
上海人工智能实验室联合高校科研机构,利用“丰登”大语言模型开展了两方面工作:首先整合全球学术论文、专业著作和实验数据等多源信息,构建“基因-性状-环境”三维知识图谱;进而建立全球首个作物基因功能研究推理链数据库,汇聚30万条“假设-实验-结论”标准格式的数据链条,形成可复用的“科研路径图谱”。该数据库是当前覆盖范围最广、结构最完备的作物基因研究数据资源之一。
在水稻研究中,智能体成功生成多轮实验方案,科研人员依据方案开展实验,发现了多个基因的新功能。例如,一个此前未被报道的基因可通过调控植物激素平衡影响株高,另有多个基因被证实与光合效率密切相关。在玉米研究中,智能体精准预测出多个与株高、穗位等关键农艺性状紧密相关的候选基因,相关结论与连续三年独立开展的田间试验验证结果高度一致。