HOME/ AINOW編集部 /AIボイスチェンジャーとは?おすすめのアプリや自作方法も解説!
2021.12.13

AIボイスチェンジャーとは?おすすめのアプリや自作方法も解説!

最終更新日:

AIボイスチェンジャー-おすすめアプリや自作方法まで解説!

ディープラーニングなどのAI技術の進歩により、現在のボイスチェンジャーは従来よりも自然な音声へ変換できるようになりました。

AIによるボイスチェンジャーはどのようなメリットがあり、どんなアプリ・サービスがあるのでしょうか。

この記事では、AIボイスチェンジャーのメリットや無料・有料それぞれのおすすめなアプリ・サービスなど自作する方法まで簡単に解説しているので、ぜひ最後までご覧ください。

▼AIについて詳しく知りたい方はこちら

AIボイスチェンジャーとは?

AIボイスチェンジャーとは、どんな人の声でも違和感なく声を変換できるAI機能のことです。従来のボイスチェンジャーでは、男性の声を女性の声に変換したときに変に音が高くなるなど、変換後の声が自然​で​はありませんでした。

一方でAIボイスチェンジャーを用いる場合は、声優さんのように魅力的な声に変換できます。話し方や抑揚はそのままなので、声を変換しているのに自然に聞こえます。

AIボイスチェンジャーを使うメリット

次に、AIボイスチェンジャーを使うメリットについて紹介します。

どんな声でも変換できる

従来のボイスチェンジャーには、人によって音質や声質が変わってしまうというデメリットがありました。しかし、AIの技術によってどんな人の声でもきれいな声に変換できるようになりました。

どのような声色にしたいのかを指定できて、誰が声を出したとしても高い精度で変換可能なのです。

リアルタイムで変換できる

ボイスチェンジャーにつけているAIは、数多くのキャラクターや声優の声を学習させているため、リアルタイムでの音声変換が可能です。

サービスによっては、変換スピードが50ミリセカンドから70ミリセカンドとリアルタイムに近いものもあります。

Vtuberなど、リアルタイムな変換が求めている人におすすめです。

AIボイスチェンジャーの主な使い方

AIボイスチェンジャーはどのように使うのでしょうか。この章では、AIボイスチェンジャーの主な使い方について紹介します。

アプリをインストールして使う

リアルタイムで変換したり、高機能のAIボイスチェンジャーを使うときは、アプリをPCにダウンロードする必要があります。

アプリのインストールに加えて、変換できるボイスデータをオプションとして追加購入できるものもあります。

導入する際は、自分のデバイスが推奨されているスペックに見合うかどうかを確認しましょう。

ブラウザ上で録音・保存する

ブラウザ上にて声を変換するAIボイスチェンジャーであれば、アプリをインストールすることなく利用できます。

これらのサービスは無料で使えるのが大きなメリットですが、その代わりに変換できる音声ファイルの時間に限界があります。長時間の音声データを変換したい人にはあまり向いていません。

無料で使えるAIボイスチェンジャー3選

無料で使えるオススメのAIボイスチェンジャーのサービスは3つあります。

  1. 七声ニーナ
  2. Voicemod
  3. Clown fish VoiceChanger

以下でそれぞれ紹介していきます。

①七声ニーナ

七声ニーナ

https://www.itmedia.co.jp/news/articles/2105/12/news123.html

 

七声ニーナは無料で使えるボイスチェンジャーです。DeNAが取り組んでいる「音声変換AI」のトライアルとしてリリースされました。10秒間の音声しか変換できませんが、ブラウザ上のサービスなので手軽に利用可能です。

七声ニーナは話者に依存しない音声情報を抽出して、指定の音詠へ変換することができるため、とても自然な声に変換されます。

変換したい声をテキストで入力する必要もないため、操作は非常に簡単です。

※2022年3月31日をもちましてサービスは終了いたしました。

②Voicemod

Voicemod

https://fnjpnews.com/News/10957

Voicemodには無料版と有料版があり、無料版では最大8種類のボイスフィルターが24時間ごとにランダムで使用可能になります。サウンドボード機能がついており、最大5つの効果音やBGNを設定することができます。

macOSに対応はしていませんがWidowsに対応しており、有料版では非常に多くの機能が利用できるようになるので、まずは無料で始めてみてはいかかでしょうか。

有料版の機能についても、あとでご紹介しているので参考にしてみてください。

③Clown fish VoiceChanger

Clown fish VoiceChanger

https://vr-sampo.com/clownfish-vc/

Clown fish VoiceChanger(クラウンフィッシュボイスチェンジャー)はWidowsに対応しており、シンプルな操作性で直感的に扱うことができるサービスです。。全15種類のボイスチェンジフィルタがあり、効果音を出せる「SoundPlayer」を使い配信のクオリティがあがります。

また、あらかじめ入力したテキストを音声に変換してくれる「VoiceAssistant」が搭載されており、自分の声を通さず利用できます。文章を保存したり、日本語以外にも多言語対応しているので、外国人とのコミュニケーションにも便利です。

おすすめのAIボイスチェンジャーアプリ3選

おすすめのAIボイスチェンジャーアプリは3つあります。

  1. Voidol2
  2. Voicemod PRO
  3. Seiren Voice

以下でそれぞれ紹介していきます。

①Voidol2

Voidol2

https://crimsontech.jp/apps/voidol/voice_model/

Voidol(ボイドル)はリアルタイムでキャラクターの声に変換して配信で利用できます。日本語はもちろん、中国語モデル「ヨネちゃん」や英語モデルの「ソフィア・ラムフィールド」など20種類以上のモデルが搭載されています。

Voidolはとても高性能で、リアルタイム動作は約0.04秒の超低遅延や上下3オクターブの変化、ノイズの軽減を実現しています。

また、ASMRのような小声で話しているかのようにする「WHISPER」、ロボットのような話し方になる「ROBOT」など追加機能も充実しており、詳細にカスタマイズが可能です。

対応OS Windows10 64bit以上、macOS High Sierra以上
料金 13,200円

②Voicemod PRO

Voicemod PRO

https://fnjpnews.com/News/10957

Voicemodには無料版と有料版があります。

Voicemod PROは80種類以上の豊富なボイスチェンジャー機能やカスタマイズも可能です。ZooMやLINE、Google Meetなどのオンライン会議から、Apex LegendsやPUPG、Among Usなどのゲームまで対応しており、幅広く利用できます。

また、AI技術により低遅延のリアルタイムでボイスチェンジができたり、効果音を再生できるサウンドボード機能もあるので、ゲーム実況配信をする方にもオススメです。

サウンドミキサーが内蔵されておりアプリに直接接続ができるので、外部でサウンドミキサーを必要とせず、初心者も気軽に始められます。

対応OS Windowsのみ対応(iOS版とAndroid版開発中)
料金 月額プラン980円,年間プラン3600円,買い切り1万円

③Seiren Voice

Seiren Voice

https://prtimes.jp/main/html/rd/p/000000019.000096446.html

Seiren Voiceはリアルタイム性よりも質を重視した音声変換サービスで、変換できる音声は100種類以上が用意されています。変換にはやや時間がかかりますが、ディープラーニングを用いた非常に革新的なボイスチェンジャーを提供しています。

Seiren Voiceの音声変換機能は、あらゆる種類の声に対応しています。その理由は、入力された音声を「音素」「音高」「発音タイミング」などを要素的に分解したうえで、ディープラーニングを用いた高い精度の変換をしているからです。

他のサービスはリアルタイム性を重視しているものが多い中、Seiren Voiceは変換した音声の質にこだわっています。またSeiren Voiceは、ブラウザ上で簡単に使うことができるので、興味のある人はぜひ使ってみてください。

対応OS Windows10 / 11
料金 キャラクター1体19,800円(ソフト基本無料)

AIボイスチェンジャーの作り方

AIボイスチェンジャーを自作する方法の一例は大きく分けて以下の3つです。

  1. 声の音声データを取得する
  2. フーリエ変換をする
  3. 音声の波形を加工する

それぞれ解説していきます。

①声の音声データを取得する

まずはボイスチェンジする元の音声が必要になります。スマートフォンやパソコンで録音してみるか、音声データを用意してください。

その際に、音声ファイルをWAV(圧縮せずに高音質に保ったまま保存ができるファイル形式)に直しておきましょう。

②フーリエ変換をする

音声ファイルを準備できたら、そのデータをフーリエ変換をしていきます。

フーリエ変換とは簡単に説明すると、ある複雑な関数を単純な関数に分解した状態を求めて解析などをしやすい状態にするということです。

フーリエ変換後のデータはこのように表されます。

フーリエ変換後の波形

https://zenn.dev/niisan/articles/0caef4a3cf1a9a

③音声の波形を加工する

次に、フーリエ変換をして加工しやすくしたデータを扱っていきます。

さきほどの波形に対して平行移動の処理を実行して、波形を動かしていきます。

加工後の波形

https://zenn.dev/niisan/articles/0caef4a3cf1a9a

平行移動をすることで、実際に話している言葉などに影響がないように音程を変化できます。

加工したあとは、このデータを逆フーリエ変換をしてファイルに保存することで、ボイスチェンジした音声を聞くことができます。

まとめ

この記事では、AIボイスチェンジャーの解説をしてきました。いかがだったでしょうか?人間が話しているのと遜色なく、リアルタイムでの変換が可能など、従来のボイスチェンジャーからかなり高性能になっていました。

気軽にボイスチェンジを楽しんだり、LIVE配信などで音声を変換する必要があるときは、AIボイスチェンジャーを活用してみてはいかがでしょうか。

▼関連記事

・その他AI(人工知能)にできることを知りたい方はこちら>>
・AIの活用事例をもっと知りたい方はこちら>>

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

生成AIで“ウラから”イノベーションを|学生起業家が描く、AIを活用した未来

特許技術×AIでFAQを次のステージへ|Helpfeel

GPUの革新からAI時代の主役へ|NVIDIA

あなたにおすすめの記事

生成AIで“ウラから”イノベーションを|学生起業家が描く、AIを活用した未来

特許技術×AIでFAQを次のステージへ|Helpfeel

GPUの革新からAI時代の主役へ|NVIDIA