九章云极发布新AI慢思考模型,开放性技术路径赋能复杂推理
近日,中国人民大学STILL项目团队、北京智源研究院团队、九章云极DataCanvas联合发布了大模型慢思考推理系列研究成果:在DataCanvas Alaya NeW智算操作系统上完成初步复现类R1推理模型,并向外界完整开源了强化学习与监督微调的训练代码与训练数据。进一步,创新性提出使用代码工具来增强模型推理性能,在AIME 2024数学推理测试中超越DeepSeek-R1的模型性能。
该研究成果发布在知名技术社区GitHub后,引发了广泛关注。
自DeepSeek-R1技术报告公布后,慢思考推理模型的复现仍然面临训练细节缺失、超参数调试复杂等共性难题,九章云极DataCanvas联合团队通过AI基础设施深度融合实现突破。研究开源了该模型在DataCanvas Alaya NeW智算操作系统上完成的强化学习与监督微调全过程完整训练日志、训练数据及容器化部署方案,为当前大多数的复杂推理大模型复现提供了从理论到实践的完整闭环支持。
值得关注的是,DeepSeek以及蒸馏模型在推理过程中无法调用外部代码工具。针对这一问题,该研究结果介绍了九章云极新的工具增强推理模型STILL-3-Tool-32B在AIME 2024基准测试上的领先表现。研究结果显示,该模型在AIME 2024基准测试中取得了81.70%准确率(采样),超越了DeepSeek-R1满血版,以15.56%的显著优势超越其基座训练模型,与OpenAI o3-mini持平,并超越OpenAI o1。
研究结果显示,DataCanvas Alaya NeW智算操作系统在开源工具链与基座模型适配、算法与算力协同、逻辑推理与多步决策等复杂任务框架方面表现出明显优势。业界人员表示,这一成果不仅验证了九章云极在大模型慢思考推理、强化学习训练框架方面的深厚积累,也为开源模型复现提供了新的思路和方法。
在业界看来,完整复现DeepSeek-R1模型存在较高技术门槛,但也为此带来较大研究契机。此前包括HuggingFace、伯克利大学、上海交大等机构均有相关复现研究,九章云极凭借强大的技术储备和人才储备,通过长期深耕,系统掌握大模型慢思考推理技术。同时,九章云极注重技术的开源与产品化,致力于让普通开发者像拼乐高积木一样快速搭建出类R1性能的推理模型,实现了 "低成本高回报" 的技术跃迁。
据悉,该相关研究成果已形成论文《An Empirical Study on Eliciting and Improving R1-like Reasoning Models》,已在全球科研人员前沿成果预印版论文网站arXiv发表。
- 年货进京1号线 黑土苏打入万家——热烈庆祝东方黑土(北京)食品科技有限公司入选北京地铁1号线年货进京专列
- 瑶海区人大常委会副主任、党组成员甄大勇等领导一行莅临谷器数据考察调研
- 东南亚电商,驶入48小时履约赛道
- 深耕“三农”沃土,中国人寿财险 助力谱写乡村振兴新画卷
- 【2024开年巨献】中国文学艺术界影响力人物——戴明辉
- 中华春节符号(陕西分部)全国系列游学——访咸阳清渭楼活动落幕
- 泰国LRC生殖中心国际妇女节特别企划:解码抗衰科学与生育力密码
- 酷酷设计师3D广告门头及形象墙设计大赛获奖名单!
- 人类、激情、地球: Mary Kay发布2024年可持续发展报告
- Magellan 900i:一掌可握 尽扫天下
- 富春弹簧:勇闯科创之路,小弹簧配件撬动大国工业
- 临商银行北城支行营业部不断加强技能训练 全面提高业务素质
- 张仲景大药房|“仲情·仲益”系列公益活动走进吴洪口村
- 远程醇氢电动双雄上市 以新质生产力推动内蒙绿色运力变革
- EBC Financial Group Expands Asset Management Capabilities with Second Australian Financial Services
- 5月25日喻言生日音乐会燃情开启,超高人气秒售罄
- 3W奖金!智能自行车首透!酷骑杯2025张家界自行车骑游大赛启幕
- 广东省辽宁商会十五周年盛典暨“百县千镇万村高质量发展工程”结对签约仪式在穗举行
- 《传承雷锋精神·塑造中国文化》---大国学者
- 马丽再度亮相央视春晚,精彩表现引爆全场
推荐
-
中央气象台连发四则气象灾害预警 暴雪橙色预警+冰冻橙色预警+大雾黄色预警+ 资讯
-
看新东方创始人俞敏洪如何回应董宇辉新号分流的? (来源:中国证券报) 东方甄选净利润大幅下滑 资讯
-
透过数据看城乡居民医保“含金量” 缴费标准是否合理? 记者从国家医保局了解到,近期,全国大部分地区 资讯
-
新增供热能力3200万平方米 新疆最大热电联产项目开工 昨天(26日),新疆最大的热电联产项目—&md 资讯
-
产业数字化 为何需要一朵实体云? 改革开放前,国内供应链主要依靠指标拉动,其逻 资讯
-
国足13次出战亚洲杯首次小组赛0进球 北京时间1月23日消息,2023亚洲杯小组 资讯
-
一个“江浙沪人家的孩子已经不卷学习了”的新闻引发议论纷纷 星标★ 来源:桌子的生活观(ID:zzdshg) 没 资讯
-
奥运冠军刘翔更新社交账号晒出近照 时隔473天更新动态! 2月20日凌晨2点,奥运冠军刘翔更新社交账号晒 资讯
-
大家一起关注新疆乌什7.1级地震救援见闻 看到热气腾腾的抓饭马上就要出锅、村里大家 资讯
-
中国减排方案比西方更有优势 如今,人为造成的全球变暖是每个人都关注的问 资讯