NeFut Logo NeFut
EN 管理员登录

[AI学术] OpenClaw-Skill:为Agentic大型语言模型打造集体技能树搜索框架

发布于:2026-06-17 22:00 最后更新:2026-06-20 13:45
#AI #Machine Learning #LLM

在现实系统中为大型语言模型(LLM)代理提供有效技能,对于解决复杂任务至关重要。本文旨在开发一个框架,自动构建可重用的技能,以增强LLM在工具使用、多步推理和动态环境交互中的能力。为此,我们提出了集体技能树搜索(CSTS),一个基于树搜索的技能构建框架,旨在构建结构化、多样化和可泛化的技能树。

CSTS的核心思想是利用集体智慧,通过两个迭代阶段共同搜索、识别和组合有效技能:集体技能节点生成(CSN-Gen)和集体技能节点评估(CSN-Assess)。CSN-Gen利用多个模型的集体知识,探索每个子任务的多种候选技能,从而实现全面的技能探索。CSN-Assess则使用多个模型作为评审者,通过以下两种评分机制评估并选择技能节点:(1) 集体质量评分,聚合独立评估以产生对技能有效性的稳健估计;(2) 集体迁移评分,明确验证技能在不同模型间的泛化能力。

通过CSTS,我们构建了一套全面的技能树,并生成技能增强的训练数据,使模型能够有效学习和利用技能。此外,我们引入了集体技能强化学习,主动从技能树中选择多个相关技能,以拓宽解决方案空间,避免被单一技能及其导致的同质或次优解决方案所困扰。因此,我们训练的模型OpenClaw-Skill在长时间规划、工具使用和在挑战性基准上的泛化能力上表现出色。

博主点评: 本文提出的CSTS框架通过集体智慧的方式构建技能树,显著提升了LLM在复杂任务中的表现。采用多模型评估机制,不仅提高了技能的有效性,还增强了技能的迁移性,值得关注。未来的应用将可能改变LLM在动态环境中的适应能力。

原文链接: https://arxiv.org/abs/2606.16774

[h] 返回首页