九章云极发布新AI慢思考模型,开放性技术路径赋能复杂推理
近日,中国人民大学STILL项目团队、北京智源研究院团队、九章云极DataCanvas联合发布了大模型慢思考推理系列研究成果:在DataCanvas Alaya NeW智算操作系统上完成初步复现类R1推理模型,并向外界完整开源了强化学习与监督微调的训练代码与训练数据。进一步,创新性提出使用代码工具来增强模型推理性能,在AIME 2024数学推理测试中超越DeepSeek-R1的模型性能。
该研究成果发布在知名技术社区GitHub后,引发了广泛关注。
自DeepSeek-R1技术报告公布后,慢思考推理模型的复现仍然面临训练细节缺失、超参数调试复杂等共性难题,九章云极DataCanvas联合团队通过AI基础设施深度融合实现突破。研究开源了该模型在DataCanvas Alaya NeW智算操作系统上完成的强化学习与监督微调全过程完整训练日志、训练数据及容器化部署方案,为当前大多数的复杂推理大模型复现提供了从理论到实践的完整闭环支持。
值得关注的是,DeepSeek以及蒸馏模型在推理过程中无法调用外部代码工具。针对这一问题,该研究结果介绍了九章云极新的工具增强推理模型STILL-3-Tool-32B在AIME 2024基准测试上的领先表现。研究结果显示,该模型在AIME 2024基准测试中取得了81.70%准确率(采样),超越了DeepSeek-R1满血版,以15.56%的显著优势超越其基座训练模型,与OpenAI o3-mini持平,并超越OpenAI o1。
研究结果显示,DataCanvas Alaya NeW智算操作系统在开源工具链与基座模型适配、算法与算力协同、逻辑推理与多步决策等复杂任务框架方面表现出明显优势。业界人员表示,这一成果不仅验证了九章云极在大模型慢思考推理、强化学习训练框架方面的深厚积累,也为开源模型复现提供了新的思路和方法。
在业界看来,完整复现DeepSeek-R1模型存在较高技术门槛,但也为此带来较大研究契机。此前包括HuggingFace、伯克利大学、上海交大等机构均有相关复现研究,九章云极凭借强大的技术储备和人才储备,通过长期深耕,系统掌握大模型慢思考推理技术。同时,九章云极注重技术的开源与产品化,致力于让普通开发者像拼乐高积木一样快速搭建出类R1性能的推理模型,实现了 "低成本高回报" 的技术跃迁。
据悉,该相关研究成果已形成论文《An Empirical Study on Eliciting and Improving R1-like Reasoning Models》,已在全球科研人员前沿成果预印版论文网站arXiv发表。
- “王西志”品牌面粉入选第三届乡村振兴赋能计划——品牌兴农典型案例
- 2024走遍中国·寻找最美教师大型公益活动颁奖典礼在京隆重举行
- 花鸟画名家林涛先生新作赏析
- 中医超微势能疗法 解锁儿童健康与智力的双重密码
- 2025年“九江银行杯”瑞昌·李永波羽毛球公开赛新闻发布会顺利召开!
- 2024年第三届北京国际艺术设计玩具展览会成功开幕!
- Explosive Growth of Crypto Millionaires in 2024
- Hong Kong Super March: Top Ten International Art and Culture Events in the Spotlight
- 若水堂:购买陈皮常见问题(二)
- 何超莲首部电影《多想和你再见一面》今日上映,哭戏、唱歌看点满满
- 国泰君安国际荣获"2024年度最佳承销机构"及"2024年度最佳ESG承销机构"两项大奖
- Copenhagen Infrastructure Partners’ Zhong Neng offshore wind farm in Taiwan delivers first power
- TATA木门声音博物馆,开启静音艺术之旅
- Deriv recognised as “Most Innovative Broker - MEA 2025”
- 越捷航空荣膺2025年全球最安全航空公司之列 上榜AirlineRatingsTop10
- DGFY:Web3 金融新星的估值期望与市场潜力分析
- 意尔康喜提20辆红旗新车!壮民族品牌,扬爱国自信!
- 呵护光明,点亮希望!2024年台江区青少年近视防控工作启动
- 科茂助力山东研控废塑料化学循环项目正式开工
- 中山市政协常委、广东光阳电器有限公司董事长陈少藩参加市政协十三届四次会议并作大会发言
- Ultimate Risk Solutions 宣布与 Howden Group 建立全球合作伙伴关系
- 临商银行北京路支行:反洗钱知识进基层 筑牢金融安全防线
- CEA携手Dawex成立联合研发实验室,推进行业数据空间创新
- EB5排期4月狂退905天的底层原因,越港资本7期CMR梦想庄园EB5升级3重机制打破困局
- 杨树龙——中国著名的社会活动家、原中阿书画院院长、影响中国时代的十大创新人物
- 更便捷、更个性化,ICL摘镜体验升级!福州爱尔眼科医院“眼内镜近视手术门诊”正式成立
- 理大学者发现调节眼压的关键机制 有望启发青光眼治疗方案
- Adalvo Secures First EU Generic Approval for Liraglutide Pre-Filled Pen
- TATA木门携手世乒赛打造体育盛宴,展现中国品牌风采
- IPX9K/IPX6K喷射防水试验机,厂家
推荐
-
中国减排方案比西方更有优势 如今,人为造成的全球变暖是每个人都关注的问 资讯
-
新增供热能力3200万平方米 新疆最大热电联产项目开工 昨天(26日),新疆最大的热电联产项目—&md 资讯
-
透过数据看城乡居民医保“含金量” 缴费标准是否合理? 记者从国家医保局了解到,近期,全国大部分地区 资讯
-
海南大学生返校机票贵 有什么好的解决办法吗? 近日,有网友在“人民网领导留言板&rdqu 资讯
-
看新东方创始人俞敏洪如何回应董宇辉新号分流的? (来源:中国证券报) 东方甄选净利润大幅下滑 资讯
-
一个“江浙沪人家的孩子已经不卷学习了”的新闻引发议论纷纷 星标★ 来源:桌子的生活观(ID:zzdshg) 没 资讯
-
男子“机闹”后航班取消,同机旅客准备集体起诉 1月4日,一男子大闹飞机致航班取消的新闻登上 资讯
-
大家一起关注新疆乌什7.1级地震救援见闻 看到热气腾腾的抓饭马上就要出锅、村里大家 资讯
-
抖音直播“新红人”进攻本地生活领域 不难看出,抖音本地生活正借由直播向本地生活 资讯
-
奥运冠军刘翔更新社交账号晒出近照 时隔473天更新动态! 2月20日凌晨2点,奥运冠军刘翔更新社交账号晒 资讯