ElevenLabs、ElevenAgents向けExpressive Modeを発表 - AIと人間の会話境界を曖昧に
ElevenLabsはElevenAgentsプラットフォーム向けにExpressive Modeを導入し、人間らしい感情表現でAIと人間の会話を区別しにくくしました。先進的なTTSと転写技術により、70言語以上でニュアンス豊かな対話を可能にします。
AI音声合成技術のリーダーであるElevenLabsは、会話型音声エージェントプラットフォームElevenAgents向けにExpressive Modeを発表しました。この新機能は、苛立った顧客に共感を示すエージェントやパニック状態の顧客を安心させるエージェントの未編集録音を通じて、AIと人間のやり取りの境界を曖昧にするほどの表現力を発揮します。
Expressive Modeは2つの主要アップグレードで駆動されます。1つ目はEleven v3 Conversationalで、企業史上最も感情知能が高く文脈を理解したテキスト-to-スピーチモデルです。Eleven v3を基盤とし、リアルタイム対話に特化して最適化されています。2つ目は新しいターン取りシステムで、より適切なタイミングの応答と割り込みの減少を実現し、自然で人間らしい会話を実現します。
チームはエージェントのトーンを前所未有の精度で制御でき、緊張した状況の緩和、安心の提供、明確な解決への誘導が可能で、プレッシャー下でも効果を発揮します。この機能は感情のニュアンスを70言語以上にスケールし、ヒンディー語などの方言でこれまで不足していた微妙な表現を大幅に向上させます。
同モードは、業界をリードするScribe v2 Realtime転写モデルからの信号を活用し、話し方の特徴から感情を推測します。例えば、上昇イントネーションや短い感嘆詞を心地よい驚きや安堵の兆候として解釈し、エージェントが動的に適応します。
総じて、Expressive Modeはブランドに合った会話型エージェントを展開し、適切なタイミングで応答し実際の顧客感情に適応させることで、ユーザーが処理されているのではなく真に支援されていると感じさせるものです。ElevenLabsはプラットフォームで機能の試用と詳細情報を提供しています。
重要ポイント
- ElevenAgents向けExpressive Mode
- Eleven v3 Conversational TTSモデルで駆動
- ターン取りシステムの新機能でタイミング向上と割り込み減少
- 70言語以上で感情ニュアンス対応
- Scribe v2 Realtime転写で感情推測
- リアルタイム対話に最適化