九章云极DataCanvas加速AI应用 助力新一代AI技术框架发布
强化学习(RL)领域再迎技术革新。继上周发布大模型慢思考推理技术获系列成果之后,九章云极DataCanvas联合研究团队再次发布新一代AI强化学习框架R1-Searcher及全链路工程代码。
近日,中国人民大学STILL项目团队、九章云极DataCanvas研究人员联合发布新技术论文称,提出了一种全新的强化学习方法R1-Searcher。据官方论文介绍,这是一种用于AI大型语言模型(LLMs)可自主调用外部搜索系统且可通过模型自我学习进行训练的强化学习(RL)方法,通过两阶段奖励机制(何时检索 + 如何利用)解决了现有模型处理知识密集型问题时的不足,在多跳问答、实时信息处理等场景展现出颠覆性潜力。
据公开资料显示,九章云极创始人方磊以联合研究者身份参与论文。该框架开源代码在GitHub上一经发布,引发AI界高度关注。
九章云极DataCanvas联合研究团队公布了该框架全参数开源方案,完整开放了从模型训练到推理部署的全链路工程代码,同步公开实践验证过的技术实例,为开发者提供可直接部署的工业化级大模型训练框架。论文实验结果显示,相比于最好的基线ReARTeR,R1-Searcher在2WikiMultiHopQA上提升了21.7%,在Bamboogle上准确率提升4.0个百分点(LLM-as-Judge评测集)。
该框架开源代码在GitHub上一经发布,引发了“模型框架与工程化部署”的深度探讨。讨论热点围绕论文公开的规模化部署方法——九章云极DataCanvas AIaya NeW智算操作系统支持的一键构建“检索-推理-反馈”闭环系统,通过将动态检索能力深度植入大型语言模型(LLMs)的推理本能;并通过全链路优化实现动态知识更新与实时性能调优,从根本上解决了域外/域内数据难度分布和数据多样性对训练的影响,在提高推理速度的同时、降低预训练成本,而不会牺牲性能方面起到关键贡献,使该R1-Searcher模型能够直接处理代码仓库或多轮对话(如客服场景),扩展了大语言模型在文档分析、代码生成、复杂推理等领域的应用边界。
九章云极DataCanvas研究团队这一“对症下药”式创新性设计,不仅解决了大模型知识时效性问题,更通过强化学习实现了检索策略的自主优化,在经济层面实现低成本高性能。有AI技术专家认为,该算法为垂直领域大模型开发提供了新范式,未来或催生更多实时智能应用。对于AI应用企业而言,这不仅意味着更准确的搜索结果,更代表着一种企业自主可运营的AI基础设施——像“水电煤”一样实时适配业务变化。
公开资料显示,RL(即Reinforcement Learning,强化学习)是一种通过智能体与环境的交互来学习最优策略的机器学习方法。RAG(即Retrieval Augmented Generation,检索增强生成)是将大量外部数据与基础模型相结合,进而增强了大语言模型(LLMs)的能力。
- PingPong福贸:外贸收款就用PingPong福贸,外贸收款新纪元
- Carbon Fiber Sheets for Structural Reinforcement in Industrial Buildings
- OPEX® Corporation荣获2024年SupplyTech Breakthrough年度分拣系统创新奖
- 新春置业还看交付力,招商蛇口是必选项
- C.K. McWhorter & McWhorter Family Trust Continue Dialogue with Sotheby’s International Realty
- 聚势合力 勇攀高峰2024牛电汽车科技7年庆典暨品牌战略发布会召开
- Bureau Veritas Targets a Step Change in Growth and Shareholder Returns
- 王骁领衔主演剧集《凡人歌》收官 描摹生活底色唱响凡人心声
- 博雅麦克风:年中大促“618无线嗨购”风暴,打造极致音频盛宴
- nCino to Participate in Upcoming Investor Event
- 畅溪制药与以岭药业达成战略合作,共同开发创新型吸入药物
- XPENG announces dealer partnerships in UAE Egypt Azerbaijan Jordan and Lebanon
- 以硬核实力,挑战凛冬之地——奇瑞风云T11挑战极限冬测圆满收官
- 最美增江游一期项目启航,增城区资产集团携手欧卡智舶开启智游新篇章
- 浪潮海岳中标深圳广电集团千万大单
- 罗永浩锐评老板超薄油烟机:高颜值,省空间、吸力大、噪音小
- 周荣发酒水致力于打造优质酒水供应链,引领电商行业新潮流
- LE SAUNDA莱尔斯丹2025年品牌VI焕新升级,开启蜕变新程,迈向无限可能
- 龙逸行赣商俱乐部:赣商的汇聚摇篮与腾飞基地
- Boehringer Ingelheim and partners start clinical development of a first-in-class, inhaled gene thera
- 广州球花医疗门诊在番禺开业
- 玻尿酸 42 年,凌博士的前行路
- 农发行常德市分行各项贷款余额达564.5亿元!政策性金融活水持续润泽“三农”
- 智原宣布加入英特尔晶圆代工设计服务联盟,满足下一代应用需求
- ThreatLocker® launches new solutions, further advances Zero Trust security resilience and adoption
- 品誉咨询——利润为王→企业持续发展的生命线
- instagram如何高效群发引流-ins引流效果最好软件推荐
- 2024世界睡眠日第六届中国睡眠产业峰会召开 睡眠博士携创新成果推动产业高质量发展
- 让厨房生活更健康,火星人集成灶携新品助阵2024双十一
- 黑芝麻智能招股进行中:身处热门赛道 巨大投资价值有望被激发
推荐
-
周星驰新片《少林女足》在台湾省举办海选,吸引了不少素人和足球爱好者前来参加 周星驰新片《少林女足》在台湾省举办海选,吸 资讯
-
一个“江浙沪人家的孩子已经不卷学习了”的新闻引发议论纷纷 星标★ 来源:桌子的生活观(ID:zzdshg) 没 资讯
-
男子“机闹”后航班取消,同机旅客准备集体起诉 1月4日,一男子大闹飞机致航班取消的新闻登上 资讯
-
私域反哺公域一周带火一家店! 三四线城市奶茶品牌茶尖尖两年时间做到GMV 资讯
-
中国减排方案比西方更有优势 如今,人为造成的全球变暖是每个人都关注的问 资讯
-
王自如被强制执行3383万 据中国执行信息公开网消息,近期,王自如新增一 资讯
-
中央气象台连发四则气象灾害预警 暴雪橙色预警+冰冻橙色预警+大雾黄色预警+ 资讯
-
看新东方创始人俞敏洪如何回应董宇辉新号分流的? (来源:中国证券报) 东方甄选净利润大幅下滑 资讯
-
新增供热能力3200万平方米 新疆最大热电联产项目开工 昨天(26日),新疆最大的热电联产项目—&md 资讯
-
奥运冠军刘翔更新社交账号晒出近照 时隔473天更新动态! 2月20日凌晨2点,奥运冠军刘翔更新社交账号晒 资讯