AI エージェントをテストする
早期アクセスAI エージェントをテストするには、次の 2 つの方法があります。
- プレビュー - AI エージェント ビルダー で直接利用できます。エージェントにメッセージを送信し、リアルタイムで応答を確認します。開発中にこれを使用して、変更を加えた後の動作をすばやく確認します。
- Quality center - 定義済みのテストケースを一括で実行するための別のページ。予想されるエージェントの動作を定義するテスト グループとテスト ケースを作成し、それらを実行して一貫性を検証し、回帰をキャッチします。
プレビュー
プレビュー を使用して、エージェントを構成しながらリアルタイムでエージェントと対話します。
プレビューを開始するには:
- AIエージェントビルダーでエージェントを開きます。
- [プレビュー タブを選択します。
- チャット パネルにメッセージを入力し、エージェントに送信します。
チャット パネルには、次のオプションがあります。
- 再起動: 会話をリセットし、新しいセッションを開始します。
- ログ パネルの表示: ツール コールやサブエージェント コールなど、各エージェントの応答の詳細なログを表示するサイド パネルを開きます。
- オプションメニュー:
- テストケースとして保存:会話を保存して、品質センターでテストケースとして再利用します。
- ユーザーの宛先を入力: 特定の宛先から来たユーザーをシミュレートします。
テストケースとして保存
プレビュー会話をテストケースとして保存して、品質センターで再利用できます。
- エージェントと 1 つ以上のメッセージを交換した後、オプション > テスト ケースとして保存 を選択します。
- 会話の名前を入力します。
- テスト ケースとして保存 を選択します。
保存された会話は、送信したメッセージが入力として、エージェントの応答が予期された応答としてテストケースになります。
品質センター
構造化された反復可能なテストの場合は、エージェントを公開する前にQuality centerを使用してテストグループを作成して実行します。
- テストの実行 - テストメッセージを手動で送信するか、自動テストグループを実行してエージェントの動作を検証します。
- テストグループの作成 - テストケースを特定のAIエージェントまたはユースケースのグループに整理します。
- テストケースの作成 - 入力と予想されるエージェントの応答を使用して、個々のテストシナリオを定義します。
- テスト結果の確認 - Analyze 合格と不合格の結果を分析し、エージェントに改善が必要な領域を特定します。