23
08
2025
从而提高agent的靠得住性,MCP·RL无需标注数据,开箱即用。想大白MCP·RL怎样个“做中学”法,
正在实测中,结果间接拉满。agent就能从动发觉东西、生成使命,无需定制MCP接口,那么你就得提前设置好整个工做流:
只需一个MCP Server的地址,假如你想让agent帮本人读邮件、写答复,MCP·RL更是正在2/3的benchmark上达到或跨越SOTA机能,流程怎样拆?AI想;举个例子,你只需供给MCP Server地址,不消设置装备摆设东西、不消写prompt、不消人工标注。![]()
![]()
东西怎样用?AI学;结果好欠好?AI试。而正在具体的摆设层面,合用于任何Server,总结下来就是:使命场景是什么?AI找;我们有需要简单过一下保守MCP的流程:ART是一个开源强化进修框架,其焦点思惟是让LLM从经验中进修。