Design & Media🎨

Openclaw Qa Testing

Name: Openclaw Qa Testing
Author: openclaw

Openclaw Qa Testing のシナリオ、ライブレーン、キャラクター評価を実行、監視、デバッグ、および拡張します（qa-lab および qa-channel）。

openclaw作v1.0.0

エージェントに接続中...

npx clawhub@latest install openclaw-qa-testing

363.2kスター数

6現在のインストール数

5.8k累計インストール数

v1.0.0バージョン

Apr 24, 2026更新日

動作要件

LLM API KeyLLM API Key (OpenClaw alias)Telegram Driver Bot TokenTelegram SUT Bot Token

ソースコードを見る(ClawHub)

Openclaw Qa Testing スキル概要

Openclaw Qa Testing は、モックおよびライブフロンティアのテストスイートの実行から、失敗のデバッグ、ライブ出力の監視、新しいシナリオの作成まで、OpenClaw QA ライフサイクル全体を駆動するリポジトリローカルスキルです。qa-lab および qa-channel ワークフローをオーケストレーションし、マトリックスレーンのシャーディング、OTEL スモークバリデーション、Telegram および Convex のクレデンシャルモード、マルチモデルキャラクター評価をサポートします。OpenClaw QA ツールチェーンをエンドツーエンドで理解し、適切なモデルポリシー、レーン選択、アーティファクト処理を用いて操作できる AI エージェントが必要な場合は、このスキルをインストールしてください。

使い方

Step 1: ターミナルで実行するか AgentCellar にインストール

npx clawhub@latest install openclaw-qa-testing

または

このページ上部のインストールボタンをクリックするとワンクリックでセットアップできます

When to Use Openclaw Qa Testing

Best Fit

フルの qa-lab スイートをモックまたはライブフロンティアモードで実行または再実行し、合否カウント、ウォッチURL、アーティファクトパスを取得する必要がある場合。
マトリックスレーンシャーディング（fast、transport、media、e2ee-smoke など）を実行したり、スケジュール実行と手動ディスパッチのプロファイルをトリガーしたりしたい場合。
複数のライブモデルに対してキャラクター／ペルソナ評価（qa character-eval）を実行し、ランク付きジャッジレポートと完全なトランスクリプトを必要とする場合。
失敗しているシナリオをデバッグしていて、エージェントに根本原因（ハーネスか製品か）を特定させ、修正を適用してレーンを再実行させる必要がある場合。
qa/scenarios/ 配下にQAシナリオを追加または拡張し、extensions/qa-lab/src/suite.ts に組み込みたい場合。

When Not to Use

このスキルはOpenClawリポジトリを対象としており、任意のコードベースに対する汎用テスト自動化スキルではありません。
ローカルOTLPスモークバリデーションではなく、外部オブザーバビリティコレクター（Opik、Langfuse）が必要な場合、このスキルはそれらのサービスを設定しません。
QA認証情報が完全に不明であり、想定される1Passwordボールト（OpenClaw、Private）に保存されていない場合、Openclaw Qa Testingはそれらを推測または復元することができません — まずメンテナーにエスカレーションしてください。

主な機能

ライブフロンティア & モックレーン実行

正しいレーン（開発用は mock-openai、実際の検証用は live-frontier）を自動的に選択し、適切なモデル参照と出力ディレクトリを指定して pnpm openclaw qa suite を実行します。実行ごとに qa-suite-summary.json と qa-suite-report.md を出力します。

マトリックスプロファイルシャーディング

pnpm openclaw qa matrix を使用して、マトリックスプロファイルの全セット — fast、transport、media、e2ee-smoke、e2ee-deep、e2ee-cli — をサポートします。CI/リリース実行向けに fail-fast フラグおよび OPENCLAW_QA_MATRIX_NO_REPLY_WINDOW_MS のような環境変数のオーバーライドを処理します。

マルチモデルキャラクター評価

設定可能な候補モデルセット（OpenAI、Anthropic、Google、Moonshot、ZAI）全体に対して、インラインの思考レベルおよびファストモード構文を使用しながら qa character-eval を実行します。生のジャッジ返答を含まず、実行統計、所要時間、完全なトランスクリプトを備えたランク付きジャッジレポートを生成します。

OTELスモーク検証

pnpm qa:otel:smoke を実行して、ローカルの OTLP/HTTP トレースレシーバーを起動し、qa-channel を通じて otel-trace-smoke シナリオを実行し、エクスポートされたトレース名およびプライバシー契約を検証します — 外部コレクターの認証情報は不要です。

認証情報と1Passwordの統合

TelegramおよびConvex QAのシークレットが1Password（OpenClawおよびPrivateボールト）のどこに保存されているか、また各レーンに必要な環境変数を把握しています。npm Telegram Dockerレーンに対して、Telegramの直接環境変数モードとConvexのラウンドロビン認証情報リースの両方をサポートしています。

Codex CLI モデルレーン

QAスイートおよび手動プローブ向けに codex-cli/<codex-model> モデル参照をサポートし、HOME および OPENCLAW_HOME をサンドボックス化しながら、ライブ実行時に CODEX_HOME を保持します。モック実行時には CODEX_HOME を自動的にスクラブします。

ユースケース

リリースゲート CIの実行

デプロイ前にリリースに重要なトランスポートコントラクトを検証するため、--fail-fast オプションを付けて fast マトリクスプロファイルをトリガーします。Openclaw Qa Testing は適切なプロファイルを選択し、スイートを実行して、合否件数とアーティファクトのパスを報告します。

デバッグ：失敗したE2Eシナリオのトラブルシューティング

live-frontierレーンでシナリオが失敗した場合、Openclaw Qa Testingはスイートの出力を読み取り、根本原因がプロダクト側にあるのかハーネス側にあるのかを特定し、修正を適用したうえでレーン全体を再実行します。その後、ウォッチURLと更新されたアーティファクトを表示します。

キャラクターとペルソナの品質チェック

高/超高思考レベルで8つの候補モデルに対してqa character-evalを実行し、実際のタスクターン（チャット、ワークスペース編集）においてスタイル、ペルソナ、雰囲気が維持されることを確認します。ジャッジレポートは、生のジャッジ返答を漏らすことなく候補をランク付けします。

新しいQAシナリオの追加

このスキルは、qa/scenarios/ 配下に新しいシナリオのマークダウンファイルを作成し、qa/scenarios/index.md のキックオフ期待値を整合させ、エンドツーエンドのアサーションを含む実行可能なカバレッジを extensions/qa-lab/src/suite.ts に組み込む手順をガイドします。

動作要件

LLM APIキー — OPENCLAW_LIVE_OPENAI_KEY（OPENAI_API_KEYからマッピング）を介してライブフロンティアレーンを動作させます。ライブOpenAIモデルの実行に必要です。対応モデル：OpenAI（openai/gpt-5.4）。
Telegram Botトークン — Telegram E2Eレーンに必要です。OPENCLAW_QA_TELEGRAM_DRIVER_BOT_TOKENおよびOPENCLAW_QA_TELEGRAM_SUT_BOT_TOKENは、1PasswordのOpenClaw / Telegram E2Eアイテムから取得されます。
Convexシークレット (省略可、共有QAインフラに推奨) — OPENCLAW_QA_CONVEX_SITE_URL、OPENCLAW_QA_CONVEX_SECRET_MAINTAINER、OPENCLAW_QA_CONVEX_SECRET_CI — 1PasswordのOpenClawボルトから取得されます。Docker TelegramレーンのラウンドロビンクレデンシャルリースをE有効にします。
1Password CLI（op） — QAシークレットの参照にはtmux内で実行する必要があります。op account listを実行して認証を確認してください。

エージェントに接続中...

npx clawhub@latest install openclaw-qa-testing

363.2kスター数

6現在のインストール数

5.8k累計インストール数

v1.0.0バージョン

Apr 24, 2026更新日

動作要件

LLM API KeyLLM API Key (OpenClaw alias)Telegram Driver Bot TokenTelegram SUT Bot Token

ソースコードを見る(ClawHub)

よくある質問

レビュー

0件のレビュー

レビューを書くにはログイン

まだレビューはありません。最初の体験をシェアしましょう！