Führen Sie OpenClaw qa-lab und qa-channel Szenarien, Live-Lanes und Character-Evals aus, überwachen, debuggen und erweitern Sie diese.
npx clawhub@latest install openclaw-qa-testingVoraussetzungen
Openclaw Qa Testing ist ein repo-lokales Skill zum Steuern des gesamten OpenClaw-QA-Lebenszyklus – vom Ausführen von Mock- und Live-Frontier-Test-Suites bis hin zum Debuggen von Fehlern, Beobachten von Live-Ausgaben und Erstellen neuer Szenarien. Es orchestriert qa-lab- und qa-channel-Workflows, unterstützt Matrix-Lane-Sharding, OTEL-Smoke-Validierung, Telegram- und Convex-Credential-Modi sowie Multi-Modell-Character-Evals. Installiere dieses Skill, wenn du einen KI-Agenten benötigst, der die OpenClaw-QA-Toolchain von Anfang bis Ende versteht und sie mit der richtigen Modellrichtlinie, Lane-Auswahl und Artefaktverwaltung betreiben kann.
npx clawhub@latest install openclaw-qa-testingKlicke oben auf der Seite auf Installieren für die Ein-Klick-Einrichtung
qa-lab-Suite im Mock- oder Live-Frontier-Modus ausführen oder erneut ausführen und Pass/Fail-Zählungen, Watch-URLs und Artefaktpfade zurückerhalten.fast, transport, media, e2ee-smoke usw.) ausführen oder geplante vs. manuell ausgelöste Profile aktivieren.qa character-eval) mit bewerteten Judge-Berichten und vollständigen Transkripten.qa/scenarios/ hinzufügen oder erweitern und sie in extensions/qa-lab/src/suite.ts einbinden.OpenClaw, Private) gespeichert sind, kann die Skill diese nicht erraten oder wiederherstellen — wenden Sie sich zunächst an Ihren Maintainer.Wählt automatisch den korrekten Lane aus (mock-openai für die Entwicklung, live-frontier für die echte Validierung) und führt pnpm openclaw qa suite mit den richtigen Modellreferenzen und Ausgabeverzeichnissen aus. Gibt für jeden Durchlauf eine qa-suite-summary.json und einen qa-suite-report.md aus.
Unterstützt den vollständigen Satz an Matrix-Profilen — fast, transport, media, e2ee-smoke, e2ee-deep, e2ee-cli — über pnpm openclaw qa matrix. Verarbeitet fail-fast-Flags und Umgebungsüberschreibungen wie OPENCLAW_QA_MATRIX_NO_REPLY_WINDOW_MS für CI/Release-Ausführungen.
Führt qa character-eval über eine konfigurierbare Auswahl von Kandidatenmodellen (OpenAI, Anthropic, Google, Moonshot, ZAI) mit integrierter Thinking-Level- und Fast-Mode-Syntax aus. Erstellt einen priorisierten Bewertungsbericht mit Laufstatistiken, Laufzeiten und vollständigen Transkripten — ohne rohe Richter-Antworten.
Führt pnpm qa:otel:smoke aus, um einen lokalen OTLP/HTTP-Trace-Empfänger zu starten, das Szenario otel-trace-smoke über den qa-channel auszuführen und exportierte Trace-Namen sowie Datenschutzverträge zu überprüfen – keine externen Collector-Zugangsdaten erforderlich.
Weiß, wo Telegram- und Convex-QA-Geheimnisse in 1Password gespeichert sind (OpenClaw- und Private-Tresore) und welche Umgebungsvariablen jede Lane benötigt. Unterstützt sowohl den direkten Telegram-Umgebungsvariablen-Modus als auch das Convex-Round-Robin-Credential-Leasing für die npm-Telegram-Docker-Lane.
Unterstützt codex-cli/<codex-model>-Modellreferenzen für QA-Suiten und manuelle Tests, wobei CODEX_HOME in Live-Ausführungen beibehalten wird, während HOME und OPENCLAW_HOME in einer Sandbox isoliert werden. Bereinigt CODEX_HOME bei Mock-Ausführungen automatisch.
Löst das fast Matrix-Profil mit --fail-fast aus, um release-kritische Transport-Contracts vor einem Deploy zu validieren. Die Skill Openclaw Qa Testing wählt das richtige Profil, führt die Suite aus und meldet Bestanden/Fehlgeschlagen-Zählungen sowie Artefaktpfade.
Wenn ein Szenario im Live-Frontier-Lane fehlschlägt, liest die Skill die Suite-Ausgabe, ermittelt, ob die Ursache im Produkt oder im Harness liegt, wendet die Korrektur an und führt den gesamten Lane erneut aus – dabei werden die Watch-URL und die aktualisierten Artefakte angezeigt.
Führe qa character-eval über acht Kandidatenmodelle mit hohen/sehr hohen Denkstufen aus, um zu überprüfen, ob Stil, Persona und Atmosphäre bei echten Aufgaben (Chat, Workspace-Bearbeitungen) erhalten bleiben. Der Bewertungsbericht bewertet die Kandidaten, ohne die rohen Antworten des Bewerters preiszugeben.
Die Skill führt durch die Erstellung einer neuen Szenario-Markdown-Datei unter qa/scenarios/, stimmt die Starterwartungen in qa/scenarios/index.md ab und verknüpft ausführbare Abdeckung in extensions/qa-lab/src/suite.ts mit End-to-End-Assertions.
OPENCLAW_LIVE_OPENAI_KEY (zugeordnet von OPENAI_API_KEY). Erforderlich für jeden Live-OpenAI-Modelllauf. Unterstützt: OpenAI (openai/gpt-5.4).OPENCLAW_QA_TELEGRAM_DRIVER_BOT_TOKEN und OPENCLAW_QA_TELEGRAM_SUT_BOT_TOKEN werden aus dem 1Password-Eintrag OpenClaw / Telegram E2E bezogen.OPENCLAW_QA_CONVEX_SITE_URL, OPENCLAW_QA_CONVEX_SECRET_MAINTAINER, OPENCLAW_QA_CONVEX_SECRET_CI — bezogen aus dem 1Password-Vault OpenClaw. Ermöglicht Round-Robin-Credential-Leasing für die Docker-Telegram-Lane.op) — Muss innerhalb von tmux ausgeführt werden, um QA-Secrets abzurufen. Führe op account list aus, um die Authentifizierung zu überprüfen.npx clawhub@latest install openclaw-qa-testingVoraussetzungen
Anmelden, um eine Bewertung zu schreiben
Noch keine Bewertungen. Sei der Erste, der seine Erfahrungen teilt!