顧客サービスのフルプロセス エージェント ループ
決して縮まないサポートの列。
当社のクライアントである東南アジアの大手 SaaS プラットフォームは、Web チャット、モバイル アプリ、電子メール、ソーシャル メッセージング チャネルを通じて毎月 500,000 件を超えるカスタマー サービスの会話を処理しています。彼らの支援活動は恒久的な追いつき状態に陥った。
第一線のエージェントの多くは、新しく採用され、まだ製品について学習中ですが、オンラインにいる人によっては、同じ質問に対して一貫性のない回答を提供していました。複雑な問題では、複数のエスカレーションハンドオフ (L1 から L2 からエンジニアリングへ) が必要で、ハンドオフごとに時間がかかり、コンテキストが失われます。マニュアル チームが記事を更新するよりも早く製品の新機能がリリースされたため、ナレッジ ベースは手動で維持されており、常に古くなっていました。
「チャットボットをアップグレードしても顧客サービスが改善されない理由」
クライアントは 3 世代にわたるチャットボット ベンダーを渡り歩いてきました。それぞれが同じ運用上の壁にぶつかりました。
- 1.行き止まりの会話の問題: チャットボットは簡単な FAQ に答えることはできますが、何もすることはできません。 「パスワードをリセットするにはどうすればよいですか?」働きました。 「パスワードをリセットして確認を送信してください」は行われませんでした。ボットはアクションを実行できませんでした。ヘルプ記事を指すことしかできませんでした。
- 2.エスカレーションブラックホール: チャットボットが失敗すると、人間のエージェントへのエスカレーションはすべてのコンテキストを失いました。お客様は問題を一から説明し直す必要がありました。人間のエージェントは、ボットがすでに何を試みたかを知ることができませんでした。
- 3.誤分類税: 既存のシステムでは、キーワードの一致によってチケットを分類していたため、誤分類率が 30% 以上発生していました。請求に関する質問はテクニカル サポートに寄せられました。機能リクエストはバグ チームに転送されました。ルートミスが発生するたびに、解決までに何時間も時間がかかりました。
- 4.フラットコスト問題: 単純な「今何時ですか?」など、すべての会話。または複雑な複数ステップのアカウント移行 - 同じコストで同じ AI リソースを消費します。月間 500,000 件の会話では、これは経済的に限界がありました。
チャットボットからクローズドループ解決エンジンまで。
サポートは、回答の生成から閉ループ解決、エスカレーション コンテキスト、および知識の修復に移行します。
I. インテント ルーティング層 (3 層)
L1 分類 (Haiku): 最小限のコストで 200 ミリ秒未満でクエリを最上位のバケットに即座に分類します。 L2 理解 (Sonnet): 完全なインテントを解析し、エンティティを抽出し、解決パスを決定します。 L3 アクション計画 (Opus、必要な場合): 複雑な複数ステップの問題について、段階的な解決計画を生成します。
II.エージェント実行層 (4 つのエージェント)
ナレッジ検索エージェントは、RAG ナレッジ ベースに最新のドキュメントを問い合わせます。ツール呼び出しエージェントは、MCP に接続されたシステムを通じてアクションを実行し、パスワードのリセット、返金の処理、サブスクリプションのアップグレードを行います。チケット管理エージェントは、完全なコンテキストを使用してチケットを作成および更新します。エスカレーション ルーティング エージェントは、トランスクリプト、試行された解決策、システム状態、推奨される次のステップなどの完全なコンテキスト パッケージを使用して、複雑な問題を人間のエージェントに転送します。
Ⅲ.自己修復ナレッジレイヤー
Bad Case Detection は、会話によって否定的なフィードバックやエスカレーションが発生した場合に、失敗パターンを自動的に記録します。知識ギャップの特定は、文書化チームに対して信頼性の低い検索結果にフラグを立てます。 Auto-Update Pipeline は製品の変更ログとリリース ノートを取り込んでナレッジ ベースの記事に変換し、製品リリースごとにシステムを最新の状態に保ちます。
IV. MCP + Token101
すべてのエージェントは、統合された MCP レイヤーを介してクライアントの既存の CRM、発券システム、支払いプロセッサ、製品 API に接続します。既存のシステムを変更する必要はありません。 Token101 階層型ルーティング: Haiku への単純なクエリ、Sonnet への標準サポート、Opus への複雑な決定。結果: API のコストは約 45% 削減されました。
対応から解決まで。
「私たちは顧客とただチャットするだけではなく、意図から解決までのループを閉じます。」
関連する実装概要。
Claude 3 Opus
コグニティブレコメンダーアーキテクチャ
Claude コグニティブ コントローラーは、既存の高スループット レコメンダー スタックを置き換えることなく、プレミアム コンテンツの検出と推奨の説明可能性を向上させました。
マルチモデルカスケード + Edge DLP
フルプロセス医療AI
HIPAA アーキテクチャを備え、6 か月間にわたって重度の幻覚ゼロを実現する、事前相談、診断サポート、薬物相互作用チェック、フォローアップ管理にわたる 7 エージェントのフルライフサイクルの医療 AI システムです。
エッジ SFT 7B モデル
自律型産業用制御エージェント
エッジ導入された自律制御システムは、ハードコーディングされた PLC ロジックをドメイン調整された 7B モデルと生きた SOP に置き換え、クラウドに依存せずにリアルタイムの異常推論を可能にしました。