400 128 6709

行业新闻

复旦大学与美团联合发布 R-HORIZON,长链推理评测框架

发布时间:2025-10-29点击次数:

复旦大学携手美团longcat共同发布了 r-horizon——首个专注于系统性评估与提升大型推理模型(lrms)长链推理能力的评测框架与训练方法。

复旦大学与美团联合发布 R-HORIZON,长链推理评测框架

R-HORIZON 创新性地提出了“问题组合”(Query Composition)策略,通过在不同问题之间建立逻辑依赖关系,将原本独立的任务转化为复杂的多阶段推理流程。

以数学推理任务为例,该方法包含以下三个关键步骤:

  1. 信息提取:从原始问题中抽取关键数值、变量等核心要素
  2. 依赖构建:将前一个问题的解答结果作为后续问题的前提条件进行嵌入
  3. 链式求解:模型必须按顺序完成所有子任务,才能最终得出正确答案

核心优势:

  • 灵活扩展:支持任意长度的推理链条(如 n=2, 4, 8...),便于测试模型极限
  • 精准控制:可调节问题间的依赖强度,实现细粒度实验设计
  • 高效低成本:基于现有公开数据集自动生成复杂推理样本,无需人工标注

基于这一机制,研究团队构建了 R-HORIZON Benchmark,用于全面评估 LRMs 在多步推理场景下的表现,并同步生成大规模长链推理训练数据。结合强化学习(RLVR)技术,显著提升了模型的深层推理能力。

GoEnhance GoEnhance

全能AI视频制作平台:通过GoEnhance AI让视频创作变得比以往任何时候都更简单。

GoEnhance 347 查看详情 GoEnhance

复旦大学与美团联合发布 R-HORIZON,长链推理评测框架

R-HORIZON 方法流程示意图——从单一问题到多层依赖推理链的构建过程及应用方向

R-HORIZON 代表了大型推理模型研究范式的重大演进——不再局限于“能解决哪些问题”,而是深入探索“推理链条能延伸多远”。

主要技术贡献:

  • 发布首个面向长链推理的综合性评测基准,揭示 LRMs 的三大关键瓶颈
  • 提出可扩展的训练框架,提供低资源、高效益的能力增强路径
  • 进行深入的机制分析,为下一代推理模型的设计提供理论支持与实践指导
论文标题: R-HORIZON: How Far Can Your Large Reasoning Model Really Go in Breadth and Depth? 论文链接: https://www.php.cn/link/5a7a6185f07dab689218c182fcf3b4ae 项目主页: https://www.php.cn/link/b62b2fca53f1466b2d09f6f05325e357 开源代码: https://www.php.cn/link/b9b1446d5dac7a83f7478d31f514dcf1 数据集地址:https://www.php.cn/link/f54fd264edeb6c5043be90f1570d4ea3

以上就是复旦大学与美团联合发布 R-HORIZON,长链推理评测框架的详细内容,更多请关注其它相关文章!


# go  # 锦州工厂网站建设  # 德州全网seo软件  # 国内seo肆金手指六六三十  # 长春seo经验分享  # 网站优化矩阵怎么做  # 提出了  # 三大  # 多远  # 成长之路  # 这一  # 首个  # 链式  # 开源  # 联合发布  # 复旦大学  # 美团  # github  # git  # 济南网站建设及快速优化  # 郴州网站建设批发公司  # seo推广平台排名  # 江苏谷歌seo流程  # 机械网站优化企业排名 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 国网辉南供电:无人机空中巡检 全力护航端午佳节  下一个前沿:量子机器学习和人工智能的未来  AI进军债券交易,BondGPT来了!  成功孵化首个大型模型解决方案的重庆人工智能创新中心  农业产业升级:AI驱动的“崃·见田”开启农田未来展望  AI遇上大运丨热身拉伸、娱乐K歌……AI智能健身镜将亮相成都大运会  人工智能助力精准学习,猿辅导小猿学练机满足学生个性化学习需求  创新全场景清洁方案!海尔商用机器人首发上市  映宇宙数字人“映映”亮相ChinaJoy,展示AI黑科技实现用户互动  掌阅科技对话式AI应用“阅爱聊”开启内测  Meta 为打造元宇宙不惜下血本:VR 开发者年薪高达百万美元  轻量级的深度学习框架Tinygrad  AMD在ChinaJoy展示全新的锐龙AI笔记本,开创了人工智能领域的新时代!  MiracleVision视觉大模型功能介绍  刊·见 | 捕捉人工智能领域最新动态?收藏Applied Artificial Intelligence  挤爆服务器,北大法律大模型ChatLaw火了:直接告诉你张三怎么判  马斯克称人类是半机器人,记忆外包给了电脑  阿里达摩院向公众免费开放100项AI专利许可  丰田汽车研究院推出生成式人工智能汽车设计工具  鸿蒙生态带来了哪些新的流量可能性,包括AI、服务分发和原生智能等方面?  陈丹琦ACL学术报告来了!详解大模型「*」数据库7大方向3大挑战,3小时干货满满  技术如何使人变得懒惰?  “无人驾驶船”将首次亮相世界人工智能大会,下半年或开进上海迪士尼  人工智能快速发展 打开就业新空间  航拍无人机怎么选?大疆无人机盘点推荐  AI无法对传统文化符号进行解构和创新  OpenAI 引入个性化指令功能,消除对话中的重复偏好与信息  Spotify计划推出AI驱动的音乐播放器功能  “风乌”气象大模型科学家团队:用AI预报极端天气未来不是梦!  OpenOOD更新v1.5:全面、精确的分布外检测代码库及测试平台,支持在线排行榜、一键测试  高通发布长期产品计划,为工业和企业物联网产品提供全新组合方案  谷歌旗下 DeepMind 开发出 RoboCat AI 模型,能控制多种机器人执行一系列任务  华为余承东表示:鸿蒙可能拥有强大的人工智能大模型能力  人工智能驱动艺术,打开达利的超现实想象  鉴智机器人发布基于地平线征程5的标准视觉感知产品  五款 AI 网站构建器,任何人都能快速构建网站  无人机在电力巡检中的应用:全面解析高效巡检流程  生成式AI对云运维的3大挑战  配 3D 机器人头像,谷歌展示全新安卓 LOGO  食品分销跨国企业Sysco CIDO:我们的增长秘诀是以IT为中心  实践J*a开发,构建高性能的MongoDB数据迁移工具  海南科技职业大学第25届中国机器人及人工智能大赛海南赛区荣获一等奖等114项  国家发改委组织工业机器人产业高质量发展现场会  华为AI大模型将融入HarmonyOS 4  AIGC浪潮下,联想集团再加码计算与人工智能  13条咒语挖掘GPT-4最大潜力,Github万星AI导师火了,网友:隔行再也不隔山了  人工智能在重症监护室的未来  OpenAI 静默关闭 AI 文本检测工具,准确率仅为 26%  世界上第一个完全由人工智能驱动的图像编辑器!  当一切设备都受到人工智能的控制 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司