自我反思的 AI 智能体,能够从纠错中学习,在本地存储偏好设置,并通过分层记忆管理实现持续优化提升。
Self-Improving Agent (With Self-Reflection) 为您的 AI 代理添加了一个持久化学习循环:它会评估自身的输出、记录用户的纠正内容,并将提炼出的经验以结构化的方式存储在本地记忆系统 ~/self-improving/ 中。知识按照热层、温层和冷层进行分级管理,确保最相关的模式始终处于上下文中,同时避免记忆臃肿。与单次会话记忆不同,改进效果会永久叠加累积——随着时间推移,代理在处理您的特定工作流程时会有可量化的提升,且无需手动维护。
npx clawhub@latest install self-improving点击本页顶部的 安装 按钮即可一键设置
~/self-improving/。记忆分为三个层级:memory.md(HOT,≤100 行,始终加载)、按项目和按领域划分的文件(WARM,在上下文匹配时加载),以及归档文件(COLD,在显式查询时加载)。这样可以在不超出限制的前提下,将最相关的知识保留在上下文中。
在 7 天内使用 3 次的模式将自动晋升至 HOT 存储。未使用的模式在 30 天后衰减至 WARM,并在 90 天后归档至 COLD。未经用户明确确认,任何内容都不会被删除。
在完成多步骤任务、收到反馈或修复错误后,Self-Improving Agent (With Self-Reflection) 会暂停并进行评估:结果是否符合预期、哪些方面可以改进,以及这是否是一个可复用的模式?经验教训将以结构化格式记录,并按照与用户纠正相同的规则进行提升和归纳。
该智能体能够识别纠正信号(如"不,那是错的"、"我之前告诉过你……"、"别再做 X 了")以及偏好信号(如"我喜欢你……"、"总是做 X"),并自动将其路由到正确的记忆层级。一次性或特定上下文的指令将被有意忽略。
项目专属模式存储在 projects/{name}.md 中,全局偏好存储在 HOT 中,领域模式(代码、写作)存储在 domains/ 目录中。当模式发生冲突时,最具体且最新的规则优先生效——若仍存在歧义,则会提示用户进行确认。
每一个来源于记忆的操作都会注明其文件和行号(例如,"使用 X(来自 projects/foo.md:12)")。系统可按需提供每周摘要,内容涵盖已学习、已降级和已归档的模式。Self-Improving Agent (With Self-Reflection) 从不存储凭据、健康数据或第三方信息,也从不读取 ~/self-improving/ 目录以外的文件。
开发者对代理的格式或架构选择进行一次纠正。代理将该纠正记录到 corrections.md 中,在第三次重复出现后将其提升至 domains/code.md。未来的会话将自动应用该规则,无需任何提醒。
对于一个持续数周的项目,代理将约定、命名决策和工作流偏好存储在 projects/{name}.md 中。每次会话在提及该项目时都会加载该温层文件,使代理始终与项目规则保持一致。
在生成多文件功能或长篇文档后,Self-Improving Agent (With Self-Reflection) 会反思间距、结构或语气是否可以做得更好,记录一条经验教训,并在下次触发类似任务时加以应用——无需用户重复指出同一问题。
用户表示"我希望回复简洁,不要有冗余的开场白。"智能体将此记录为全局热偏好,并在每次回复时引用该偏好,确保在未来所有对话中保持该风格,而无需用户重复声明。
登录后撰写评价
暂无评价。来分享你的使用体验吧!