Self-Improving Agent (With Self-Reflection)

Name: Self-Improving Agent (With Self-Reflection)
Author: Iván

À la une

Agent IA auto-réflexif qui apprend à partir des corrections, stocke les préférences localement et s'améliore en permanence grâce à une gestion de la mémoire à plusieurs niveaux.

Ivánv1.0.0

Connexion à votre agent...

npx clawhub@latest install self-improving

655Installations actuelles

178Installations totales

v1.0.0Version

Voir le code source(ClawHub)

Aperçu du skill Self-Improving Agent (With Self-Reflection)

Self-Improving Agent (With Self-Reflection) ajoute une boucle d'apprentissage persistante à votre agent IA : il évalue ses propres résultats, enregistre les corrections des utilisateurs et stocke les leçons distillées dans un système de mémoire locale structuré à ~/self-improving/. Les connaissances sont organisées en niveaux chaud, tiède et froid, de sorte que les modèles les plus pertinents sont toujours en contexte sans surcharger la mémoire. Contrairement à la mémoire d'une seule session, les améliorations s'accumulent de façon permanente — l'agent devient de manière mesurable plus performant dans vos flux de travail spécifiques au fil du temps, sans maintenance manuelle.

Comment l’utiliser

Step 1: Exécutez dans votre terminal ou installez ce skill sur AgentCellar

npx clawhub@latest install self-improving

Cliquez sur le bouton Installer en haut de cette page pour une configuration en un clic

When to Use Self-Improving Agent (With Self-Reflection)

Best Fit

Vous corrigez fréquemment les mêmes erreurs de l'agent et souhaitez que ces corrections persistent d'une session à l'autre.
Vous travaillez sur des projets récurrents ou dans des domaines spécifiques (code, rédaction, communications) où un style cohérent et des préférences constantes sont importants.
Vous souhaitez un agent capable d'auditer lui-même ses propres résultats après des tâches à plusieurs étapes et d'enregistrer automatiquement les leçons apprises.
Les connaissances doivent s'accumuler au fil du temps — vous préférez construire un profil de préférences évolutif plutôt que de réexpliquer le contexte à chaque session.

When Not to Use

Vous n'avez besoin de mémoire que pour une seule session ou une tâche ponctuelle — cette compétence est conçue pour un apprentissage persistant à long terme.
Vous avez besoin que l'agent apprenne par observation passive ou par le silence ; cette compétence enregistre uniquement les corrections explicites et les préférences exprimées.
Vous vous trouvez dans un environnement où l'écriture de fichiers locaux dans ~/self-improving/ n'est pas autorisée ou possible.

Fonctionnalités clés

Architecture de mémoire à plusieurs niveaux (HOT / WARM / COLD)

La mémoire est répartie sur trois niveaux : memory.md (HOT, ≤100 lignes, toujours chargé), des fichiers par projet et par domaine (WARM, chargés selon la correspondance du contexte), et une archive (COLD, chargée sur requête explicite). Cela permet de maintenir les connaissances les plus pertinentes dans le contexte sans dépasser les limites.

Promotion et rétrogradation automatiques

Les modèles utilisés 3 fois en 7 jours sont automatiquement promus vers le stockage CHAUD. Les modèles inutilisés sont rétrogradés vers TIÈDE après 30 jours et archivés vers FROID après 90 jours. Rien n'est supprimé sans confirmation explicite de l'utilisateur.

Auto-réflexion après un travail significatif

Après avoir accompli des tâches en plusieurs étapes, reçu des retours ou corrigé des bogues, l'agent marque une pause pour évaluer : le résultat a-t-il correspondu à l'intention, qu'est-ce qui pourrait être amélioré et s'agit-il d'un schéma reproductible ? Les leçons apprises sont consignées dans un format structuré et promues selon les mêmes règles que les corrections des utilisateurs.

Déclencheurs de détection pour les corrections et les préférences

L'agent reconnaît les signaux de correction (« Non, c'est faux », « Je vous l'ai déjà dit… », « Arrêtez de faire X ») et les signaux de préférence (« J'aime quand vous… », « Faites toujours X ») et les achemine automatiquement vers le niveau de mémoire approprié. Les instructions ponctuelles ou spécifiques à un contexte sont intentionnellement ignorées.

Isolation des espaces de noms et résolution des conflits

Les patterns spécifiques à un projet restent dans projects/{name}.md, les préférences globales dans HOT, et les patterns par domaine (code, rédaction) dans domains/. En cas de conflit entre patterns, la règle la plus spécifique et la plus récente l'emporte — avec une invite à l'utilisateur si une ambiguïté persiste.

Limites de transparence et de sécurité

Chaque action issue de la mémoire cite son fichier et sa ligne (par ex. : « Utilisation de X (depuis projects/foo.md:12) »). Un résumé hebdomadaire des modèles appris, rétrogradés et archivés est disponible sur demande. Le skill ne stocke jamais d'identifiants, de données de santé ou d'informations tierces, et ne lit jamais de fichiers en dehors de ~/self-improving/.

Cas d'utilisation

Application persistante des règles de style de codage

Un développeur corrige une fois les choix de formatage ou d'architecture de l'agent. L'agent enregistre la correction dans corrections.md, et après la troisième récurrence, la promeut dans domains/code.md. Les sessions futures appliquent la règle automatiquement sans rappels.

Contexte de projet à long terme

Pour un projet s'étalant sur plusieurs semaines, l'agent stocke les conventions, les décisions de nommage et les préférences de flux de travail dans projects/{name}.md. Chaque session charge ce fichier de niveau intermédiaire lorsque le projet est mentionné, maintenant l'agent en accord constant avec les règles du projet.

Agent auto-audit après des tâches complexes

Après avoir généré une fonctionnalité multi-fichiers ou un long document, l'agent réfléchit à la possibilité d'améliorer l'espacement, la structure ou le ton, enregistre une leçon tirée de cette réflexion, et l'applique la prochaine fois qu'une tâche similaire est déclenchée — sans que l'utilisateur ait à signaler le même problème deux fois.

Calibration du style de communication

Un utilisateur déclare : « Je préfère des réponses concises sans préambule. » L'agent enregistre cela comme une préférence HOT globale et la cite dans chaque réponse, garantissant que le style est maintenu dans toutes les conversations futures sans avoir à reformuler la préférence.

Connexion à votre agent...

npx clawhub@latest install self-improving

655Installations actuelles

178Installations totales

v1.0.0Version

Voir le code source(ClawHub)

FAQ

Avis

0 avis

Se connecter pour écrire un avis

Aucun avis pour l'instant. Soyez le premier à partager votre expérience !