超越ChatGPT的AI智能体(英文)(1)

牵着乌龟去散步 万象 11

今天分享的是:超越ChatGPT的AI智能体(英文)(1)

报告共计:82页

超越ChatGPT的AI智能体(英文)(1)-第1张图片-

该文档围绕超越ChatGPT的AI智能体展开探讨,涵盖模型改进、能力提升及应用优化等多方面研究。在模型自我改进上,传统基于提示的自我改进 *** 对小模型效果不佳,为此提出TriPosT *** ,借助大语言模型或Python脚本作为编辑模型,收集小模型与大模型交互记录,处理为(尝试、反馈、更新)三元组数据,经筛选、平衡后对小模型进行加权监督微调训练,实验表明能提升模型在复杂任务上的表现,但存在依赖强编辑模型的局限。在提升模型能力方面,鉴于许多对话任务是决策过程,引入树搜索 *** ,通过提示大语言模型模拟国际象棋中的决策搜索过程,在说服任务中,基于此的GDP-Zero比基础大语言模型表现更优,不过在非对话任务扩展及训练迁移方面还需探索。针对视觉语言模型在计算机任务上的挑战,引入R-MCTS(带对比自反思的蒙特卡洛树搜索),在任务执行中搜索更佳轨迹,任务完成后进行对比自反思以优化后续执行,在VisualWebArena和OSWorld基准测试中,R-MCTS *** 能超越其他搜索算法,取得新的更优成绩;探索 *** 习通过对R-MCTS树的训练,让GPT-4o在无需搜索算法增强的情况下展现出计算扩展特 *** 。此外,Arklex提出智能可控的组织框架,具备混合控制、任务组合、人类干预和持续学习等功能,相比其他框架更具优势,文档还列出了相关研究的未来工作方向,如运用强化学习减少对树搜索的依赖、采用模型预测控制 *** 减少环境交互成本等 。

以下为报告节选内容

展开全文

标签: 英文 超越 ChatGPT 智能

抱歉,评论功能暂时关闭!