科大讯飞登上Nature子刊:AI解化学奥赛题超越人类选手平均水平
近日,国际学术期刊《通讯-化学》(Communications Chemistry)刊发了一项引发业界关注的研究成果。来自科大讯飞研究院与认知智能全国重点实验室的联合团队,构建了一套面向化学领域的多模态评测基准,系统检验了当前主流大模型的科学推理能力,并首次揭示了AI在处理科学图像时存在的“视觉失配”现象。
这一发现被认为对未来科学智能的发展具有重要参考价值。

让AI“看懂”化学图表,难在哪里?
化学研究离不开分子结构式、反应机理图、实验装置示意图等视觉信息。与普通图像识别不同,理解这些科学图像需要AI同时具备符号解析与逻辑推演能力——这恰恰是当前多模态大模型的薄弱环节。
研究团队构建的USNCO-V评测基准,收录了二十余年美国化学奥林匹克竞赛中的473道图文结合题目,覆盖分子结构、实验装置、反应曲线等多种类型。这一基准填补了AI for Science领域在化学视觉推理系统性分析方向的空白。
测试结果:顶尖模型超越人类选手平均成绩
研究对包括GPT-5、OpenAI o3、Gemini-2.5-Pro在内的40款主流多模态大模型进行了系统评估。结果显示,表现最佳的GPT-5以93.2%的准确率位居榜首,显著超越参赛选手44.6%的平均成绩。
然而,研究也发现了一个耐人寻味的现象:部分模型在移除图像输入后,答题准确率反而提升。这一“视觉干扰效应”表明,当前AI在处理科学图像时,视觉与语言模块尚未实现真正的协同工作。
业内专家指出,这一发现对于改进下一代多模态模型具有重要指导意义。
人工智能国家队的AI for Science版图
作为国内人工智能领域的代表性企业,科大讯飞近年来在AI for Science方向持续布局。依托认知智能全国重点实验室和国家新一代人工智能开放创新平台,该公司已在多个科学领域取得进展。
据公开资料显示,科大讯飞与中国科学院共建的“星火科研助手”平台,目前已服务全国1300余所高校的17万余名科研人员;在化工领域,其与中科院大连化物所合作研发的智能化工大模型已迭代至3.0版本;在核聚变研究方向,其团队联合中国科学技术大学在《Nuclear Fusion》发表的PaMMA-Net模型,突破了等离子体磁测量演化建模的技术瓶颈。
值得关注的是,科大讯飞在推进全国产技术路线方面的努力。该公司强调其星火大模型实现了全栈自主可控,从底层算力到上层应用均采用国产化方案,这在当前国际技术竞争背景下具有特殊意义。
从“语言理解”到“科学理解”
有分析人士认为,此次研究成果的发表,标志着国内大模型企业正从通用智能向科学智能纵深拓展。当AI不仅能够处理日常对话,还能理解复杂的科学图表、进行专业领域的逻辑推演时,其应用价值将发生质的飞跃。
不过,研究也坦承当前技术仍存在明显短板——在分子结构识别与实验装置理解等任务上,即便是最先进的模型也表现欠佳。这意味着AI真正成为科学家的得力助手,仍有相当长的路要走。
随着国内多家科技企业加速布局AI for Science赛道,这一领域的竞争正在升温。而此次Nature子刊论文的发表,或许只是国内人工智能国家队在科学智能领域发力的一个缩影。
- 剑桥艺术CSVPA突破100枚伦敦艺术大学本科直录录取通知书
- 加拿大央行宣布下调基准利率至3.75%
- 中国少女Cassie心怀爱豆梦 为实现梦想勇赴韩国
- 甄选大医生余萍院长:以医术铸就辉煌,以仁心赢得尊敬
- 创新突破!必胜客引入宇树机器人解锁科技感用餐体验
- 快云鲸:以创新实力引领行业,用品质赢得信赖
- Galderma Successfully Issued an Inaugural CHF 500 Million Bond
- 兰希黎探访益植爱工厂 给兰粉最安心的守护
- 微芯生物与美助医药强强联手,共促临床试验质量提升!
- 国资委公布考核结果:北京管道以“智慧+”改革登顶双百企业标杆
- 药品市场分析是企业在竞争激烈的医药行业中“突出重围”的关键
- ExaGrid与Cohesity扩大合作,推出全新认证集成,为Cohesity NetBackup和DataProtect客户提供无缝备份存储解决方案
- 誉满杏林扬国粹 胸怀天下济苍生记中国顶级著名中医专家——王皓之
- 以技术创新赋能构网,华为全场景构网解决方案亮相Intersolar Europe
- 非遗中国游:必胜客打造舌尖上的文化旅程
- 海能达携行业特色解决方案亮相第四届长沙国际工程机械展览会
- Ambiq Democratizes Edge AI with the Apollo330 Plus Series SoCs
- 洲际酒店集团全新生活方式品牌Atwell筑格酒店大中华区首店亮相上海
- 平安养老险山西分公司提醒:购买金融产品,请选择正规金融渠道
- 贤德酒坊:让好酒走进千家万户的智慧电商平台
推荐
-
中央气象台连发四则气象灾害预警
暴雪橙色预警+冰冻橙色预警+大雾黄色预警+
资讯
-
大家一起关注新疆乌什7.1级地震救援见闻
看到热气腾腾的抓饭马上就要出锅、村里大家
资讯
-
海南大学生返校机票贵 有什么好的解决办法吗?
近日,有网友在“人民网领导留言板&rdqu
资讯
-
奥运冠军刘翔更新社交账号晒出近照 时隔473天更新动态!
2月20日凌晨2点,奥运冠军刘翔更新社交账号晒
资讯
-
透过数据看城乡居民医保“含金量” 缴费标准是否合理?
记者从国家医保局了解到,近期,全国大部分地区
资讯
-
周星驰新片《少林女足》在台湾省举办海选,吸引了不少素人和足球爱好者前来参加
周星驰新片《少林女足》在台湾省举办海选,吸
资讯
-
王自如被强制执行3383万
据中国执行信息公开网消息,近期,王自如新增一
资讯
-
男子“机闹”后航班取消,同机旅客准备集体起诉
1月4日,一男子大闹飞机致航班取消的新闻登上
资讯
-
看新东方创始人俞敏洪如何回应董宇辉新号分流的?
(来源:中国证券报)
东方甄选净利润大幅下滑
资讯
-
国足13次出战亚洲杯首次小组赛0进球
北京时间1月23日消息,2023亚洲杯小组
资讯

