수정 사항을 학습하고, 선호도를 로컬에 저장하며, 계층적 메모리 관리를 통해 지속적으로 발전하는 자기 성찰 AI 에이전트입니다.
Self-Improving Agent (With Self-Reflection)은 AI 에이전트에 지속적인 학습 루프를 추가합니다. 자체 출력을 평가하고, 사용자 수정 사항을 기록하며, 정제된 교훈을 ~/self-improving/의 구조화된 로컬 메모리 시스템에 저장합니다. 지식은 핫(hot), 웜(warm), 콜드(cold) 티어로 구성되어 메모리를 불필요하게 늘리지 않으면서도 가장 관련성 높은 패턴이 항상 컨텍스트 안에 유지됩니다. 단일 세션 메모리와 달리, 개선 사항은 영구적으로 누적됩니다. 수동 유지 관리 없이도 에이전트는 시간이 지남에 따라 사용자의 특정 워크플로에서 측정 가능한 수준으로 향상됩니다.
npx clawhub@latest install self-improving이 페이지 상단의 설치 버튼을 클릭하면 원클릭으로 설정할 수 있습니다
~/self-improving/에 로컬 파일 쓰기가 허용되지 않거나 불가능한 환경에 있는 경우.메모리는 세 가지 계층으로 나뉩니다: memory.md (HOT, ≤100줄, 항상 로드됨), 프로젝트별 및 도메인별 파일 (WARM, 컨텍스트 일치 시 로드됨), 그리고 아카이브 (COLD, 명시적 쿼리 시 로드됨). 이를 통해 한도를 초과하지 않으면서 가장 관련성 높은 지식을 컨텍스트 내에 유지합니다.
7일 동안 3번 사용된 패턴은 자동으로 HOT 저장소로 승격됩니다. 사용되지 않은 패턴은 30일 후 WARM으로 감소하고, 90일 후 COLD로 아카이브됩니다. 사용자의 명시적 확인 없이는 아무것도 삭제되지 않습니다.
다단계 작업을 완료하거나, 피드백을 받거나, 버그를 수정한 후, Self-Improving Agent (With Self-Reflection)은 잠시 멈추고 다음을 평가합니다: 결과가 의도에 부합했는지, 무엇을 개선할 수 있는지, 그리고 이것이 반복 가능한 패턴인지를 검토합니다. 교훈은 구조화된 형식으로 기록되며, 사용자 수정 사항과 동일한 규칙에 따라 승격됩니다.
에이전트는 수정 신호("아니요, 그건 틀렸어요", "전에 말했잖아요…", "X는 그만해요")와 선호도 신호("이렇게 해주면 좋겠어요…", "항상 X를 해주세요")를 인식하고, 이를 자동으로 올바른 메모리 계층으로 라우팅합니다. 일회성 또는 특정 상황에 한정된 지시는 의도적으로 무시됩니다.
프로젝트별 패턴은 projects/{name}.md에, 전역 설정은 HOT에, 도메인 패턴(코드, 글쓰기)은 domains/에 저장됩니다. 패턴이 충돌할 경우, 가장 구체적이고 최신의 규칙이 우선 적용되며, 모호한 경우에는 사용자에게 확인을 요청합니다.
메모리에서 가져온 모든 작업은 해당 파일과 줄을 인용합니다 (예: "X 사용 (projects/foo.md:12에서)"). 학습됨, 강등됨, 보관됨 패턴에 대한 주간 요약은 요청 시 확인할 수 있습니다. 이 스킬은 자격 증명, 건강 데이터 또는 제3자 정보를 저장하지 않으며, ~/self-improving/ 외부의 파일을 읽지 않습니다.
개발자가 에이전트의 포맷 또는 아키텍처 선택 사항을 한 번 수정합니다. 에이전트는 해당 수정 사항을 corrections.md에 기록하고, 세 번째 반복 발생 후 domains/code.md로 승격합니다. 이후 세션에서는 별도의 알림 없이 해당 규칙이 자동으로 적용됩니다.
여러 주에 걸친 프로젝트의 경우, 에이전트는 규칙, 명명 결정 사항, 워크플로우 기본 설정을 projects/{name}.md에 저장합니다. 각 세션에서 프로젝트가 언급될 때 해당 웜 티어 파일을 로드하여, 에이전트가 프로젝트 규칙에 일관되게 맞춰질 수 있도록 합니다.
멀티 파일 기능 또는 긴 문서를 생성한 후, Self-Improving Agent (With Self-Reflection)은 간격, 구조 또는 톤이 더 나을 수 있었는지 스스로 되돌아보고, 교훈을 기록한 뒤, 유사한 작업이 다음번에 실행될 때 이를 적용합니다 — 사용자가 동일한 문제를 두 번 지적할 필요 없이.
사용자가 "서문 없이 간결한 답변을 선호합니다."라고 말합니다. 에이전트는 이를 전역 HOT 선호도로 기록하고 모든 응답에서 이를 인용하여, 사용자가 선호도를 다시 언급하지 않아도 향후 모든 대화에서 해당 스타일이 유지되도록 합니다.
리뷰를 작성하려면 로그인
아직 리뷰가 없습니다. 첫 번째로 경험을 공유해 보세요!