Openclaw Qa Testing

Name: Openclaw Qa Testing
Author: openclaw

Führen Sie OpenClaw qa-lab und qa-channel Szenarien, Live-Lanes und Character-Evals aus, überwachen, debuggen und erweitern Sie diese.

von openclawv1.0.0

Verbindung zum Agenten wird hergestellt...

npx clawhub@latest install openclaw-qa-testing

363.2kSterne

6Aktuelle Installationen

5.8kGesamte Installationen

v1.0.0Version

Apr 24, 2026Aktualisiert

Voraussetzungen

LLM API KeyLLM API Key (OpenClaw alias)Telegram Driver Bot TokenTelegram SUT Bot Token

Quellcode ansehen(ClawHub)

Openclaw Qa Testing Skill-Übersicht

Openclaw Qa Testing ist ein repo-lokales Skill zum Steuern des gesamten OpenClaw-QA-Lebenszyklus – vom Ausführen von Mock- und Live-Frontier-Test-Suites bis hin zum Debuggen von Fehlern, Beobachten von Live-Ausgaben und Erstellen neuer Szenarien. Es orchestriert qa-lab- und qa-channel-Workflows, unterstützt Matrix-Lane-Sharding, OTEL-Smoke-Validierung, Telegram- und Convex-Credential-Modi sowie Multi-Modell-Character-Evals. Installiere dieses Skill, wenn du einen KI-Agenten benötigst, der die OpenClaw-QA-Toolchain von Anfang bis Ende versteht und sie mit der richtigen Modellrichtlinie, Lane-Auswahl und Artefaktverwaltung betreiben kann.

So verwenden Sie es

Step 1: Im Terminal ausführen oder auf AgentCellar installieren

npx clawhub@latest install openclaw-qa-testing

oder

Klicke oben auf der Seite auf Installieren für die Ein-Klick-Einrichtung

When to Use Openclaw Qa Testing

Best Fit

Sie müssen eine vollständige qa-lab-Suite im Mock- oder Live-Frontier-Modus ausführen oder erneut ausführen und Pass/Fail-Zählungen, Watch-URLs und Artefaktpfade zurückerhalten.
Sie möchten Matrix-Lane-Sharding (fast, transport, media, e2ee-smoke usw.) ausführen oder geplante vs. manuell ausgelöste Profile aktivieren.
Sie müssen Charakter-/Persona-Evals über mehrere Live-Modelle hinweg ausführen (qa character-eval) mit bewerteten Judge-Berichten und vollständigen Transkripten.
Sie debuggen ein fehlgeschlagenes Szenario und benötigen den Agenten, um die Grundursache zu identifizieren (Harness vs. Produkt), eine Lösung anzuwenden und die Lane erneut auszuführen.
Sie möchten QA-Szenarien unter qa/scenarios/ hinzufügen oder erweitern und sie in extensions/qa-lab/src/suite.ts einbinden.

When Not to Use

Diese Skill ist auf das OpenClaw-Repository beschränkt; es handelt sich nicht um eine universell einsetzbare Testautomatisierungs-Skill für beliebige Codebasen.
Wenn Sie externe Observability-Collector (Opik, Langfuse) anstelle einer lokalen OTLP-Smoke-Validierung benötigen, konfiguriert diese Skill diese Dienste nicht.
Wenn Ihre QA-Zugangsdaten vollständig unbekannt sind und nicht in den erwarteten 1Password-Vaults (OpenClaw, Private) gespeichert sind, kann die Skill diese nicht erraten oder wiederherstellen — wenden Sie sich zunächst an Ihren Maintainer.

Hauptfunktionen

Live-Frontier & Mock Lane Ausführung

Wählt automatisch den korrekten Lane aus (mock-openai für die Entwicklung, live-frontier für die echte Validierung) und führt pnpm openclaw qa suite mit den richtigen Modellreferenzen und Ausgabeverzeichnissen aus. Gibt für jeden Durchlauf eine qa-suite-summary.json und einen qa-suite-report.md aus.

Matrix Profile Sharding

Unterstützt den vollständigen Satz an Matrix-Profilen — fast, transport, media, e2ee-smoke, e2ee-deep, e2ee-cli — über pnpm openclaw qa matrix. Verarbeitet fail-fast-Flags und Umgebungsüberschreibungen wie OPENCLAW_QA_MATRIX_NO_REPLY_WINDOW_MS für CI/Release-Ausführungen.

Mehrstufige Charakter-Evaluierungen mit mehreren Modellen

Führt qa character-eval über eine konfigurierbare Auswahl von Kandidatenmodellen (OpenAI, Anthropic, Google, Moonshot, ZAI) mit integrierter Thinking-Level- und Fast-Mode-Syntax aus. Erstellt einen priorisierten Bewertungsbericht mit Laufstatistiken, Laufzeiten und vollständigen Transkripten — ohne rohe Richter-Antworten.

OTEL Rauchtest-Validierung

Führt pnpm qa:otel:smoke aus, um einen lokalen OTLP/HTTP-Trace-Empfänger zu starten, das Szenario otel-trace-smoke über den qa-channel auszuführen und exportierte Trace-Namen sowie Datenschutzverträge zu überprüfen – keine externen Collector-Zugangsdaten erforderlich.

Zugangsdaten & 1Password-Integration

Weiß, wo Telegram- und Convex-QA-Geheimnisse in 1Password gespeichert sind (OpenClaw- und Private-Tresore) und welche Umgebungsvariablen jede Lane benötigt. Unterstützt sowohl den direkten Telegram-Umgebungsvariablen-Modus als auch das Convex-Round-Robin-Credential-Leasing für die npm-Telegram-Docker-Lane.

Codex CLI Modellspur

Unterstützt codex-cli/<codex-model>-Modellreferenzen für QA-Suiten und manuelle Tests, wobei CODEX_HOME in Live-Ausführungen beibehalten wird, während HOME und OPENCLAW_HOME in einer Sandbox isoliert werden. Bereinigt CODEX_HOME bei Mock-Ausführungen automatisch.

Anwendungsfälle

Release-Gate-CI-Lauf

Löst das fast Matrix-Profil mit --fail-fast aus, um release-kritische Transport-Contracts vor einem Deploy zu validieren. Die Skill Openclaw Qa Testing wählt das richtige Profil, führt die Suite aus und meldet Bestanden/Fehlgeschlagen-Zählungen sowie Artefaktpfade.

Debugging eines fehlgeschlagenen E2E-Szenarios

Wenn ein Szenario im Live-Frontier-Lane fehlschlägt, liest die Skill die Suite-Ausgabe, ermittelt, ob die Ursache im Produkt oder im Harness liegt, wendet die Korrektur an und führt den gesamten Lane erneut aus – dabei werden die Watch-URL und die aktualisierten Artefakte angezeigt.

Qualitäts- und Charakterprüfungen für Personas

Führe qa character-eval über acht Kandidatenmodelle mit hohen/sehr hohen Denkstufen aus, um zu überprüfen, ob Stil, Persona und Atmosphäre bei echten Aufgaben (Chat, Workspace-Bearbeitungen) erhalten bleiben. Der Bewertungsbericht bewertet die Kandidaten, ohne die rohen Antworten des Bewerters preiszugeben.

Hinzufügen eines neuen QA-Szenarios

Die Skill führt durch die Erstellung einer neuen Szenario-Markdown-Datei unter qa/scenarios/, stimmt die Starterwartungen in qa/scenarios/index.md ab und verknüpft ausführbare Abdeckung in extensions/qa-lab/src/suite.ts mit End-to-End-Assertions.

Voraussetzungen

LLM API Key — Ermöglicht die Live-Frontier-Lane über OPENCLAW_LIVE_OPENAI_KEY (zugeordnet von OPENAI_API_KEY). Erforderlich für jeden Live-OpenAI-Modelllauf. Unterstützt: OpenAI (openai/gpt-5.4).
Telegram-Bot-Tokens — Erforderlich für Telegram-E2E-Lanes. OPENCLAW_QA_TELEGRAM_DRIVER_BOT_TOKEN und OPENCLAW_QA_TELEGRAM_SUT_BOT_TOKEN werden aus dem 1Password-Eintrag OpenClaw / Telegram E2E bezogen.
Convex-Secrets (optional, bevorzugt für gemeinsame QA-Infrastruktur) — OPENCLAW_QA_CONVEX_SITE_URL, OPENCLAW_QA_CONVEX_SECRET_MAINTAINER, OPENCLAW_QA_CONVEX_SECRET_CI — bezogen aus dem 1Password-Vault OpenClaw. Ermöglicht Round-Robin-Credential-Leasing für die Docker-Telegram-Lane.
1Password CLI (op) — Muss innerhalb von tmux ausgeführt werden, um QA-Secrets abzurufen. Führe op account list aus, um die Authentifizierung zu überprüfen.

Verbindung zum Agenten wird hergestellt...

npx clawhub@latest install openclaw-qa-testing

363.2kSterne

6Aktuelle Installationen

5.8kGesamte Installationen

v1.0.0Version

Apr 24, 2026Aktualisiert

Voraussetzungen

LLM API KeyLLM API Key (OpenClaw alias)Telegram Driver Bot TokenTelegram SUT Bot Token

Quellcode ansehen(ClawHub)

FAQ

Bewertungen

0 Bewertungen

Anmelden, um eine Bewertung zu schreiben

Noch keine Bewertungen. Sei der Erste, der seine Erfahrungen teilt!