九章云极发布新AI慢思考模型,开放性技术路径赋能复杂推理
近日,中国人民大学STILL项目团队、北京智源研究院团队、九章云极DataCanvas联合发布了大模型慢思考推理系列研究成果:在DataCanvas Alaya NeW智算操作系统上完成初步复现类R1推理模型,并向外界完整开源了强化学习与监督微调的训练代码与训练数据。进一步,创新性提出使用代码工具来增强模型推理性能,在AIME 2024数学推理测试中超越DeepSeek-R1的模型性能。
该研究成果发布在知名技术社区GitHub后,引发了广泛关注。
自DeepSeek-R1技术报告公布后,慢思考推理模型的复现仍然面临训练细节缺失、超参数调试复杂等共性难题,九章云极DataCanvas联合团队通过AI基础设施深度融合实现突破。研究开源了该模型在DataCanvas Alaya NeW智算操作系统上完成的强化学习与监督微调全过程完整训练日志、训练数据及容器化部署方案,为当前大多数的复杂推理大模型复现提供了从理论到实践的完整闭环支持。
值得关注的是,DeepSeek以及蒸馏模型在推理过程中无法调用外部代码工具。针对这一问题,该研究结果介绍了九章云极新的工具增强推理模型STILL-3-Tool-32B在AIME 2024基准测试上的领先表现。研究结果显示,该模型在AIME 2024基准测试中取得了81.70%准确率(采样),超越了DeepSeek-R1满血版,以15.56%的显著优势超越其基座训练模型,与OpenAI o3-mini持平,并超越OpenAI o1。
研究结果显示,DataCanvas Alaya NeW智算操作系统在开源工具链与基座模型适配、算法与算力协同、逻辑推理与多步决策等复杂任务框架方面表现出明显优势。业界人员表示,这一成果不仅验证了九章云极在大模型慢思考推理、强化学习训练框架方面的深厚积累,也为开源模型复现提供了新的思路和方法。
在业界看来,完整复现DeepSeek-R1模型存在较高技术门槛,但也为此带来较大研究契机。此前包括HuggingFace、伯克利大学、上海交大等机构均有相关复现研究,九章云极凭借强大的技术储备和人才储备,通过长期深耕,系统掌握大模型慢思考推理技术。同时,九章云极注重技术的开源与产品化,致力于让普通开发者像拼乐高积木一样快速搭建出类R1性能的推理模型,实现了 "低成本高回报" 的技术跃迁。
据悉,该相关研究成果已形成论文《An Empirical Study on Eliciting and Improving R1-like Reasoning Models》,已在全球科研人员前沿成果预印版论文网站arXiv发表。
- 夏日恣意而动,Crocs 卡骆驰推出全新慕斯中跟人字拖
- 国寿财险高质量发展再推演:在与国共振中释放增长能效
- “中俄建交75周年展”在华夏教育集团太阳谷华夏学校展出
- 夏日热水器焕新,A.O.史密斯AI-LiNK燃气热水器助力全家畅享一夏
- 中信银行太原分行优质服务获表扬
- 先正达集团新增独立董事
- 瑞派宠物医生:匠心传承医术精髓,铸就宠主坚实后盾
- 衡泰信助力2024女子中巡锦标赛,共铸“她力量,正青春”新篇章!
- 联想凌拓推出“救急1110灾备一体化解决方案”,筑牢企业和组织数据安全屏障
- WS专家调查表明:使用WhatsApp工具,我在海外市场的客户续约率飙升至85%
- 揭秘湖南省好然居新材料有限公司以其独特的构图和鲜艳的色彩打破单调感
- 越捷航空启动“双十一”24小时大促 所有航线均享大幅优惠
- 嗨翻天!武汉极地海洋公园很多鱼音乐节极地之夜电音party嗨翻浪漫夏夜
- AACSB Recognizes 26 Business Schools Leading Boldly
- 中国人寿财险推出多项客户节品牌活动 满足广大客户多样化综合金融需求
- 以情绘境·才华横溢——书画名家王煜航百家媒体聚焦报道
- 金花葵:珍稀植物的卓越价值与广阔市场前景
- Customized Carbon Fiber Sheets for High-Performance Drones
- SBT选用Brightcove技术支持其全新流媒体服务平台的推出
- 孩子努力 无限可能
- 早并网、多创收!起明光伏「巧客立」快装支架系统实现三方友好!
- 东莞市盛威家具有限公司 —— 定制化软垫、软包/硬包、安全带、木制品制造业品牌
- 聚焦数智跃升,2025鼎捷数智高峰论坛暨生态伙伴大会开启数智盛宴
- Boehringer Ingelheim and Cue Biopharma partner to develop next-generation treatment for autoimmune a
- 国寿财险娄底中支:快速理赔显诚信 服务周到见真情
- Moody’s收购Numerated Growth Technologies,拓展贷款技术解决方案
- 仲景宛西制药联动焦作云台山汉服花朝节,开启春日养生局
- 超实用!春节小长假地暖怎么用?大金官方建议
- 湖南伏羲门集团眼健康视光中心:如何解决青少年视力问题?
- 通过全球最严TGA认证,优思益打造全系列高品质健康产品
推荐
-
王自如被强制执行3383万 据中国执行信息公开网消息,近期,王自如新增一 资讯
-
一个“江浙沪人家的孩子已经不卷学习了”的新闻引发议论纷纷 星标★ 来源:桌子的生活观(ID:zzdshg) 没 资讯
-
中央气象台连发四则气象灾害预警 暴雪橙色预警+冰冻橙色预警+大雾黄色预警+ 资讯
-
抖音直播“新红人”进攻本地生活领域 不难看出,抖音本地生活正借由直播向本地生活 资讯
-
周星驰新片《少林女足》在台湾省举办海选,吸引了不少素人和足球爱好者前来参加 周星驰新片《少林女足》在台湾省举办海选,吸 资讯
-
透过数据看城乡居民医保“含金量” 缴费标准是否合理? 记者从国家医保局了解到,近期,全国大部分地区 资讯
-
私域反哺公域一周带火一家店! 三四线城市奶茶品牌茶尖尖两年时间做到GMV 资讯
-
大家一起关注新疆乌什7.1级地震救援见闻 看到热气腾腾的抓饭马上就要出锅、村里大家 资讯
-
奥运冠军刘翔更新社交账号晒出近照 时隔473天更新动态! 2月20日凌晨2点,奥运冠军刘翔更新社交账号晒 资讯
-
看新东方创始人俞敏洪如何回应董宇辉新号分流的? (来源:中国证券报) 东方甄选净利润大幅下滑 资讯