超越ChatGPT的AI智能体（英文）(1)

牵着乌龟去散步万象 2025-03-08 15

今天分享的是：超越ChatGPT的AI智能体（英文）(1)

报告共计：82页

超越ChatGPT的AI智能体（英文）(1)-第1张图片-

该文档围绕超越ChatGPT的AI智能体展开探讨，涵盖模型改进、能力提升及应用优化等多方面研究。在模型自我改进上，传统基于提示的自我改进 *** 对小模型效果不佳，为此提出TriPosT *** ，借助大语言模型或Python脚本作为编辑模型，收集小模型与大模型交互记录，处理为（尝试、反馈、更新）三元组数据，经筛选、平衡后对小模型进行加权监督微调训练，实验表明能提升模型在复杂任务上的表现，但存在依赖强编辑模型的局限。在提升模型能力方面，鉴于许多对话任务是决策过程，引入树搜索 *** ，通过提示大语言模型模拟国际象棋中的决策搜索过程，在说服任务中，基于此的GDP-Zero比基础大语言模型表现更优，不过在非对话任务扩展及训练迁移方面还需探索。针对视觉语言模型在计算机任务上的挑战，引入R-MCTS（带对比自反思的蒙特卡洛树搜索），在任务执行中搜索更佳轨迹，任务完成后进行对比自反思以优化后续执行，在VisualWebArena和OSWorld基准测试中，R-MCTS *** 能超越其他搜索算法，取得新的更优成绩；探索 *** 习通过对R-MCTS树的训练，让GPT-4o在无需搜索算法增强的情况下展现出计算扩展特 *** 。此外，Arklex提出智能可控的组织框架，具备混合控制、任务组合、人类干预和持续学习等功能，相比其他框架更具优势，文档还列出了相关研究的未来工作方向，如运用强化学习减少对树搜索的依赖、采用模型预测控制 *** 减少环境交互成本等。

以下为报告节选内容

展开全文

标签：英文超越 ChatGPT 智能

本文地址： http://www.ublook.com/post/33411.html