ElevenLabs Music v2 — 楽曲中のジャンル切り替えを実現

音声AI企業ElevenLabsが、楽曲内でジャンルを自在に切り替えられる音楽生成モデル「Music v2」を公開しました。1曲の中でオペラからヘビーメタルへ移行するといったことが可能で、指定した区間だけテキストプロンプトで再生成しても残りのトラックへの影響がありません。著作権を処理済みのライセンスデータを学習に使っており、商用利用にも対応しています。音楽生成AIはSunoやUdioが著作権訴訟を抱える中、クリエイター向けツールとしての信頼性を差別化要素として押し出した格好です。

背景と文脈
技術/ビジネス面
これからどうなるか
まとめ
参考リンク

背景と文脈

音楽生成AIは2023年末頃から急速に普及が進み、SunoやUdioがテキストから数十秒の楽曲を一発生成できるツールを一般公開しました。手軽さが評価される一方、使用した学習データをめぐる著作権訴訟が続いており、音楽レーベルからの法的プレッシャーが業界全体の課題になっています。

ElevenLabsは音声合成（text-to-speech）ツールとして知名度を持つ企業です。人間の声を高精度で再現する技術を強みに、音楽分野にも展開してきました。2025年に公開した最初のMusic機能に続き、今回がメジャーアップデートとなります。

競合環境も変化しています。Googleが動画・音声生成モデルを強化し、Stability AIが音楽生成ツールを公開するなど、大手プレイヤーが参入してきました。ElevenLabsはこうした状況で「商用利用可能・著作権クリア」を明確に訴求することで、法的リスクを懸念するプロのクリエイターや企業向けの市場を狙っています。

技術/ビジネス面

grayscale photography of guitar heads — Photo by Diego Catto on Unsplash

Music v2の最大の特徴は「セクション単位の編集」です。従来の音楽生成AIは曲全体を一括で生成するため、イントロだけ変えたい、サビのジャンルを差し替えたいといった部分的な編集が困難でした。Music v2ではイントロ・バース・コーラスといった区間を個別に生成して組み合わせる構成が可能で、指定区間をテキストプロンプトで再生成しても前後の区間との一貫性を保ちます。

ジャンル遷移の例として公式が示しているのは、オペラからヘビーメタルへの切り替え、コヒーレンス（coherence：音楽的な一貫性）を保ちながらの高速ラップ、楽曲への非音楽的効果音の組み込みなどです。多言語の歌詞・ボーカルへの対応精度も前バージョンから向上しているとしています。

ビジネス面での差別化は「ライセンスデータのみで学習」という点にあります。SunoとUdioはレコードレーベルから「著作権保護楽曲を無断学習した」として提訴されており、企業がこれらのツールを商用コンテンツに使うことにはリスクがあります。ElevenLabsは許諾取得済みのデータで学習したことを明示することで、この懸念を取り除く形で差別化しています。