Google DeepMind、Lyria 3を公開:写真とテキストからボーカル・歌詞付き楽曲を生成
Google DeepMindは最新の生成音楽モデルLyria 3を公開しました。このモデルは写真とテキストをダイナミックなトラックに変換し、ボーカルと歌詞を備えています。Geminiアプリのベータ版で世界中で利用可能です。
Google DeepMindは、生成音楽モデルの最新版であるLyria 3を発表しました。この新AIシステムは、写真とテキストプロンプトをリアルなボーカルと正確に生成された歌詞を備えた完全なダイナミックトラックに変換します。
このモデルは、クリエイターに出力内容に対するより大きな制御を提供し、テンポ設定、特定のボーカルスタイル、カスタム歌詞の精密調整を可能にします。これにより、アーティストは自分のビジョンに合わせて音楽を効果的にカスタマイズできます。
Lyria 3は音質を大幅に向上させ、高忠実度の48kHzステレオトラックを生成します。ボーカルは自然で表現豊かであり、歌詞は欠落や乱れなく明確です。多様なジャンルと複数言語をサポートし、世界中のクリエイターにアピールします。
本日ベータ版として公開され、Geminiアプリを通じて世界中の誰でも利用可能です。この統合により、カスタムオーディオの生成プロセスが簡素化されます。アプリ経由で生成されるすべての出力には、Google DeepMindのSynthIDによる不可視の透かしが含まれ、AI生成コンテンツを確実に識別します。
Alphabet傘下のAI研究リーダーであるGoogle DeepMindは、クリエイティブAIツールの限界を押し広げ続けています。Lyria 3は、以前のバージョンに基づき、忠実度、制御性、アクセシビリティに焦点を当て、先進的な音楽生成を専門機器や専門知識を必要とせずに幅広いユーザーに提供します。
重要ポイント
- 写真とテキストからボーカル・歌詞付きダイナミックトラックを生成
- テンポ設定、特定のボーカルスタイル、精密な歌詞の制御が可能
- 高忠実度48kHzステレオトラック
- 自然で表現豊かなリアルなボーカル
- 欠落や乱れのない歌詞の明確さ
- 複数ジャンルと言語をサポート
- Geminiアプリのベータ版で世界中で利用可能
- 全生成物にSynthID透かしを含む