能夠自我反思的 AI 代理,從修正中學習、在本地儲存偏好設定,並透過分層記憶管理持續永久改進。
Self-Improving Agent (With Self-Reflection) 為您的 AI 代理加入持續學習迴圈:它會評估自身的輸出、記錄使用者的修正,並將提煉出的經驗以結構化方式儲存於本地記憶體系統 ~/self-improving/。知識依熱、溫、冷三個層級進行組織,確保最相關的模式始終保留在上下文中,同時不會造成記憶體膨脹。與單次對話的記憶不同,改善效果會永久累積——代理會針對您的特定工作流程持續進步,且無需手動維護。
npx clawhub@latest install self-improving點擊本頁頂部的 安裝 按鈕即可一鍵設定
~/self-improving/。記憶分為三個層級:memory.md(HOT,≤100 行,始終載入)、每個專案與每個領域的檔案(WARM,於上下文匹配時載入),以及封存檔(COLD,於明確查詢時載入)。此設計可在不超出限制的前提下,將最相關的知識保留在上下文中。
在 7 天內使用 3 次的模式會自動升級至 HOT 儲存層。未使用的模式在 30 天後會衰退至 WARM 層,並在 90 天後封存至 COLD 層。未經使用者明確確認,任何資料均不會被刪除。
在完成多步驟任務、收到回饋或修復錯誤後,Self-Improving Agent (With Self-Reflection) 會暫停並進行評估:結果是否符合預期意圖、哪些地方可以改進,以及這是否為可重複的模式?所得到的教訓會以結構化格式記錄,並依照與使用者修正相同的規則加以提升。
此代理程式能識別更正訊號(例如「不,那是錯的」、「我之前告訴過你……」、「停止做 X」)以及偏好訊號(例如「我喜歡你……」、「永遠做 X」),並自動將其路由至正確的記憶層級。一次性或特定情境的指令則會被刻意忽略。
專案特定的模式儲存於 projects/{name}.md,全域偏好設定儲存於 HOT,而領域模式(程式碼、寫作)則儲存於 domains/。當模式發生衝突時,最具體且最新的規則優先適用——若仍存在歧義,則會提示使用者進行確認。
每個來自記憶的操作都會標註其檔案來源與行號(例如:「使用 X(來自 projects/foo.md:12)」)。每週的學習摘要,包含已學習、已降級及已封存的模式,可依需求隨時調閱。Self-Improving Agent (With Self-Reflection) 絕不儲存憑證、健康資料或第三方資訊,也絕不讀取 ~/self-improving/ 以外的任何檔案。
開發者糾正代理一次其格式或架構選擇。代理將此更正記錄至 corrections.md,並在第三次重複出現後將其提升至 domains/code.md。未來的工作階段將自動套用該規則,無需任何提醒。
對於跨越數週的專案,代理程式會將慣例、命名決策與工作流程偏好儲存於 projects/{name}.md 中。每次工作階段在提及該專案時,便會載入此暖層檔案,使代理程式持續與專案規則保持一致。
在生成多檔案功能或長篇文件之後,Self-Improving Agent (With Self-Reflection) 會自我反思間距、結構或語氣是否有改善空間,記錄學習心得,並在下次觸發類似任務時加以應用——使用者無需針對相同問題重複提醒。
使用者表示「我偏好簡潔的回覆,不需要前言。」代理程式將此記錄為全域 HOT 偏好設定,並在每次回應中引用此設定,確保在所有未來的對話中都能維持此風格,無需使用者重複說明偏好。
登入後撰寫評價
尚無評價。來分享你的使用體驗吧!