Self-Improving Agent (With Self-Reflection)

Name: Self-Improving Agent (With Self-Reflection)
Author: Iván

Self-Improving Agent (With Self-Reflection) 스킬 개요

Self-Improving Agent (With Self-Reflection)은 AI 에이전트에 지속적인 학습 루프를 추가합니다. 자체 출력을 평가하고, 사용자 수정 사항을 기록하며, 정제된 교훈을 ~/self-improving/의 구조화된 로컬 메모리 시스템에 저장합니다. 지식은 핫(hot), 웜(warm), 콜드(cold) 티어로 구성되어 메모리를 불필요하게 늘리지 않으면서도 가장 관련성 높은 패턴이 항상 컨텍스트 안에 유지됩니다. 단일 세션 메모리와 달리, 개선 사항은 영구적으로 누적됩니다. 수동 유지 관리 없이도 에이전트는 시간이 지남에 따라 사용자의 특정 워크플로에서 측정 가능한 수준으로 향상됩니다.

사용 방법

Step 1: 터미널에서 실행하거나 AgentCellar에 설치

npx clawhub@latest install self-improving

또는

이 페이지 상단의 설치 버튼을 클릭하면 원클릭으로 설정할 수 있습니다

When to Use Self-Improving Agent (With Self-Reflection)

Best Fit

같은 에이전트 실수를 반복적으로 수정하면서 그 교정 사항이 세션 간에 유지되기를 원하는 경우.
일관된 스타일과 선호도가 중요한 반복적인 프로젝트나 도메인(코드, 글쓰기, 커뮤니케이션)에서 작업하는 경우.
다단계 작업 후 에이전트가 자체 출력을 스스로 감사하고 학습한 내용을 자동으로 기록하기를 원하는 경우.
지식이 시간이 지남에 따라 축적되어야 하며, 매 세션마다 컨텍스트를 다시 설명하기보다는 살아있는 선호도 프로필을 구축하고 싶은 경우.

When Not to Use

단일 세션이나 일회성 작업을 위한 메모리만 필요한 경우 — 이 스킬은 지속적이고 장기적인 학습을 위해 설계되었습니다.
에이전트가 수동적인 관찰이나 침묵으로부터 학습하기를 원하는 경우 — 이 스킬은 명시적인 수정 사항과 명시된 선호도만 기록합니다.
~/self-improving/에 로컬 파일 쓰기가 허용되지 않거나 불가능한 환경에 있는 경우.

주요 기능

계층적 메모리 아키텍처 (HOT / WARM / COLD)

메모리는 세 가지 계층으로 나뉩니다: memory.md (HOT, ≤100줄, 항상 로드됨), 프로젝트별 및 도메인별 파일 (WARM, 컨텍스트 일치 시 로드됨), 그리고 아카이브 (COLD, 명시적 쿼리 시 로드됨). 이를 통해 한도를 초과하지 않으면서 가장 관련성 높은 지식을 컨텍스트 내에 유지합니다.

자동 승격 및 강등

7일 동안 3번 사용된 패턴은 자동으로 HOT 저장소로 승격됩니다. 사용되지 않은 패턴은 30일 후 WARM으로 감소하고, 90일 후 COLD로 아카이브됩니다. 사용자의 명시적 확인 없이는 아무것도 삭제되지 않습니다.

중요한 작업 후 자기 성찰

다단계 작업을 완료하거나, 피드백을 받거나, 버그를 수정한 후, Self-Improving Agent (With Self-Reflection)은 잠시 멈추고 다음을 평가합니다: 결과가 의도에 부합했는지, 무엇을 개선할 수 있는지, 그리고 이것이 반복 가능한 패턴인지를 검토합니다. 교훈은 구조화된 형식으로 기록되며, 사용자 수정 사항과 동일한 규칙에 따라 승격됩니다.

수정 및 선호도에 대한 감지 트리거

에이전트는 수정 신호("아니요, 그건 틀렸어요", "전에 말했잖아요…", "X는 그만해요")와 선호도 신호("이렇게 해주면 좋겠어요…", "항상 X를 해주세요")를 인식하고, 이를 자동으로 올바른 메모리 계층으로 라우팅합니다. 일회성 또는 특정 상황에 한정된 지시는 의도적으로 무시됩니다.

네임스페이스 격리 및 충돌 해결

프로젝트별 패턴은 projects/{name}.md에, 전역 설정은 HOT에, 도메인 패턴(코드, 글쓰기)은 domains/에 저장됩니다. 패턴이 충돌할 경우, 가장 구체적이고 최신의 규칙이 우선 적용되며, 모호한 경우에는 사용자에게 확인을 요청합니다.

투명성 및 보안 경계

메모리에서 가져온 모든 작업은 해당 파일과 줄을 인용합니다 (예: "X 사용 (projects/foo.md:12에서)"). 학습됨, 강등됨, 보관됨 패턴에 대한 주간 요약은 요청 시 확인할 수 있습니다. 이 스킬은 자격 증명, 건강 데이터 또는 제3자 정보를 저장하지 않으며, ~/self-improving/ 외부의 파일을 읽지 않습니다.

활용 사례

지속적인 코딩 스타일 적용

개발자가 에이전트의 포맷 또는 아키텍처 선택 사항을 한 번 수정합니다. 에이전트는 해당 수정 사항을 corrections.md에 기록하고, 세 번째 반복 발생 후 domains/code.md로 승격합니다. 이후 세션에서는 별도의 알림 없이 해당 규칙이 자동으로 적용됩니다.

장기 프로젝트 컨텍스트

여러 주에 걸친 프로젝트의 경우, 에이전트는 규칙, 명명 결정 사항, 워크플로우 기본 설정을 projects/{name}.md에 저장합니다. 각 세션에서 프로젝트가 언급될 때 해당 웜 티어 파일을 로드하여, 에이전트가 프로젝트 규칙에 일관되게 맞춰질 수 있도록 합니다.

복잡한 작업 후 자체 감사

멀티 파일 기능 또는 긴 문서를 생성한 후, Self-Improving Agent (With Self-Reflection)은 간격, 구조 또는 톤이 더 나을 수 있었는지 스스로 되돌아보고, 교훈을 기록한 뒤, 유사한 작업이 다음번에 실행될 때 이를 적용합니다 — 사용자가 동일한 문제를 두 번 지적할 필요 없이.

커뮤니케이션 스타일 조정

사용자가 "서문 없이 간결한 답변을 선호합니다."라고 말합니다. 에이전트는 이를 전역 HOT 선호도로 기록하고 모든 응답에서 이를 인용하여, 사용자가 선호도를 다시 언급하지 않아도 향후 모든 대화에서 해당 스타일이 유지되도록 합니다.

에이전트에 연결 중...

npx clawhub@latest install self-improving

655현재 설치 수

178누적 설치 수

v1.0.0버전

소스 보기(ClawHub)

자주 묻는 질문

리뷰

0개 리뷰

리뷰를 작성하려면 로그인

아직 리뷰가 없습니다. 첫 번째로 경험을 공유해 보세요!