NTT西日本は2025年10月27日、声優や俳優、アーティストなど実演家の「声の権利」を保護し、その価値を高めることを目的とした音声AI事業「VOICENCE(ヴォイセンス)」を開始した。生成AIの普及に伴う「声」の無断利用やフェイク音声の問題に対応し、”公認AI”による音声IP(知的財産)の健全なビジネス活用を促進するプラットフォームを構築する。事業推進のため、社内独立組織「VOICENCEカンパニー」も設立された。
コンテンツ市場成長の影で深刻化する「声」の無断利用
近年、映像、音楽、アニメ、ゲームなどを含む日本のコンテンツ産業は世界的に高く評価され、市場規模は約17兆円、海外売上は過去10年で約3倍に拡大するなど成長を続けている。この巨大市場において「声」は重要な資産であるが、生成AI技術の急速な普及により、実演家の声を無断で利用したAI音声やフェイク音声の拡散が社会問題化している。
こうした中、グローバルに活動領域が広がる実演家やエンターテイメント業界からは、不正利用によるブランド毀損や機会損失を防ぎ、「権利を守りながらAIを活用する仕組み」を求める声が急速に高まっていた。NTT西日本は、この課題を新たな事業機会と捉え、「VOICENCE」の開始に至った。
“公認AI”を「トラスト技術」で管理、高精度な多言語音声合成も
新事業「VOICENCE」は、AI音声合成技術と独自の権利保護技術を組み合わせたプラットフォーム事業である。実演家から正規に提供された音源データ、それを学習させたAI音声モデル、生成されたAI音声コンテンツを「音声IP」として一元的に保管・管理する。

最大の特徴は、NTT西日本が独自開発した「トラスト技術」による権利保護だ。パブリックブロックチェーンとVC(Verifiable Credentials:検証可能な認証情報)を活用し、音声IPに「真正性証明」「トレーサビリティ(追跡可能性)」「用途証明」のデータを付与する。これにより、正規に許諾された”公認AI”であることを証明し、無断生成された音声データと明確に区別。契約に基づく利用許諾や条件も管理できるため、企業やクリエイターは安心して“音声IP”を活用可能となる。

また、AI音声合成にはNTT人間情報研究所の技術を活用。数秒から数分の音声インプットで、本人の声質や話し方の特徴を高精度で再現する。話者の声色を保ったまま印象や口調を変換する「音声印象制御技術」や、本人の声質のまま多言語に変換する「クロスリンガル技術」も搭載。現在は、日本語、英語、中国語、韓国語、フランス語、スペイン語の6ヵ国語に対応している。
映像・アニメの海外展開やファンエンゲージメント強化。5年後100億円規模の「声の経済圏」創出目指す
「VOICENCE」は、クライアント企業のニーズに応じた音声IPのキャスティングから、コンテンツの企画・制作・運営までをワンストップでプロデュースする。
具体的には、複数タッチポイントでブランド人格を「声」で統一し愛着形成を促す「音声ブランディング」、アーティストの声による音声AR観光ガイドや「名前を呼んでくれるボイスメッセージ」といったインタラクティブな体験を提供する「ファンエンゲージメント強化」、そしてクロスリンガル技術によるアニメやドラマなど映像コンテンツの「グローバル展開支援」といった価値提供を掲げる。
事業開始時点で、俳優の別所哲也氏、声優の花江夏樹氏、春日望氏、バーチャルタレントのKizunaAIなどがパートナーとして参画。実演家の世界観やブランド価値を尊重し、透明性やコンプライアンスを重視した運用を行うとしている。
NTT西日本は、本事業を通じて3年目に売上10億円、5年目に100億円規模への成長を目指す。将来的には、”声の真正性が担保されたAI音声コンテンツ”のデファクトスタンダード化を図り、法律家や業界団体とも連携しながらルール整備を推進。AI音声の信頼基盤を社会に実装し、誰もが安全にAI音声ビジネスへ参入できる「声の経済圏」の創出を目指す構えだ。




