Agent IA auto-réflexif qui apprend à partir des corrections, stocke les préférences localement et s'améliore en permanence grâce à une gestion de la mémoire à plusieurs niveaux.
npx clawhub@latest install self-improvingSelf-Improving Agent (With Self-Reflection) ajoute une boucle d'apprentissage persistante à votre agent IA : il évalue ses propres résultats, enregistre les corrections des utilisateurs et stocke les leçons distillées dans un système de mémoire locale structuré à ~/self-improving/. Les connaissances sont organisées en niveaux chaud, tiède et froid, de sorte que les modèles les plus pertinents sont toujours en contexte sans surcharger la mémoire. Contrairement à la mémoire d'une seule session, les améliorations s'accumulent de façon permanente — l'agent devient de manière mesurable plus performant dans vos flux de travail spécifiques au fil du temps, sans maintenance manuelle.
npx clawhub@latest install self-improvingCliquez sur le bouton Installer en haut de cette page pour une configuration en un clic
~/self-improving/ n'est pas autorisée ou possible.La mémoire est répartie sur trois niveaux : memory.md (HOT, ≤100 lignes, toujours chargé), des fichiers par projet et par domaine (WARM, chargés selon la correspondance du contexte), et une archive (COLD, chargée sur requête explicite). Cela permet de maintenir les connaissances les plus pertinentes dans le contexte sans dépasser les limites.
Les modèles utilisés 3 fois en 7 jours sont automatiquement promus vers le stockage CHAUD. Les modèles inutilisés sont rétrogradés vers TIÈDE après 30 jours et archivés vers FROID après 90 jours. Rien n'est supprimé sans confirmation explicite de l'utilisateur.
Après avoir accompli des tâches en plusieurs étapes, reçu des retours ou corrigé des bogues, l'agent marque une pause pour évaluer : le résultat a-t-il correspondu à l'intention, qu'est-ce qui pourrait être amélioré et s'agit-il d'un schéma reproductible ? Les leçons apprises sont consignées dans un format structuré et promues selon les mêmes règles que les corrections des utilisateurs.
L'agent reconnaît les signaux de correction (« Non, c'est faux », « Je vous l'ai déjà dit… », « Arrêtez de faire X ») et les signaux de préférence (« J'aime quand vous… », « Faites toujours X ») et les achemine automatiquement vers le niveau de mémoire approprié. Les instructions ponctuelles ou spécifiques à un contexte sont intentionnellement ignorées.
Les patterns spécifiques à un projet restent dans projects/{name}.md, les préférences globales dans HOT, et les patterns par domaine (code, rédaction) dans domains/. En cas de conflit entre patterns, la règle la plus spécifique et la plus récente l'emporte — avec une invite à l'utilisateur si une ambiguïté persiste.
Chaque action issue de la mémoire cite son fichier et sa ligne (par ex. : « Utilisation de X (depuis projects/foo.md:12) »). Un résumé hebdomadaire des modèles appris, rétrogradés et archivés est disponible sur demande. Le skill ne stocke jamais d'identifiants, de données de santé ou d'informations tierces, et ne lit jamais de fichiers en dehors de ~/self-improving/.
Un développeur corrige une fois les choix de formatage ou d'architecture de l'agent. L'agent enregistre la correction dans corrections.md, et après la troisième récurrence, la promeut dans domains/code.md. Les sessions futures appliquent la règle automatiquement sans rappels.
Pour un projet s'étalant sur plusieurs semaines, l'agent stocke les conventions, les décisions de nommage et les préférences de flux de travail dans projects/{name}.md. Chaque session charge ce fichier de niveau intermédiaire lorsque le projet est mentionné, maintenant l'agent en accord constant avec les règles du projet.
Après avoir généré une fonctionnalité multi-fichiers ou un long document, l'agent réfléchit à la possibilité d'améliorer l'espacement, la structure ou le ton, enregistre une leçon tirée de cette réflexion, et l'applique la prochaine fois qu'une tâche similaire est déclenchée — sans que l'utilisateur ait à signaler le même problème deux fois.
Un utilisateur déclare : « Je préfère des réponses concises sans préambule. » L'agent enregistre cela comme une préférence HOT globale et la cite dans chaque réponse, garantissant que le style est maintenu dans toutes les conversations futures sans avoir à reformuler la préférence.
npx clawhub@latest install self-improvingSe connecter pour écrire un avis
Aucun avis pour l'instant. Soyez le premier à partager votre expérience !