HOME/ AINOW編集部 /レアゾン・ホールディングス、高精度で商用利用可能な純国産の日本語音声認識モデル「ReazonSpeech」を無償で公開
2023.01.31

レアゾン・ホールディングス、高精度で商用利用可能な純国産の日本語音声認識モデル「ReazonSpeech」を無償で公開

株式会社レアゾン・ホールディングスは、世界最高レベルの高精度日本語音声認識モデル、および世界最大19,000時間の日本語音声コーパス※1「ReazonSpeech(レアゾンスピーチ)」を公開しました。

※1 音声コーパス:音声データとテキストデータを発話単位で対応付けて集めたものです。音声認識モデルを作成する材料として使用され、その規模と品質が音声認識の精度を大きく左右します。

ReazonSpeechとは

「ReazonSpeech」は、レアゾン・ヒューマンインタラクション研究所が開発した高精度な音声認識モデルを中心とするプロダクト群で、それぞれ以下のような特徴があります。

  • ReazonSpeech音声認識モデル:OpenAI Whisper※2に匹敵する高精度な日本語音声認識モデル。商用利用可能
  • ReazonSpeechコーパス作成ツール:TV録画データなどから音声コーパスを自動抽出するソフトウェアツール。商用利用可能
  • ReazonSpeech音声コーパス:世界最大19,000時間の高品質な日本語音声認識モデル学習用コーパス
    いずれも無償で公開
※2 OpenAI Whisper:ChatGPTなど最先端のAIプロダクトを次々に発表している米国の人工知能研究所OpenAIが2022年9月に公開した高精度な音声認識モデル。

出典:レアゾンホールディングス ReazonSpeech音声認識モデルの実行例

RezonSpeechの開発の背景

近年、深層学習を用いた音声認識技術は飛躍的に精度が向上し、スマートフォンなどを通して多くの人が音声認識技術を利用できるようになりました。今後さらに技術が普及して、あらゆる端末や社会の様々な場面で音声認識技術を使えるようになれば、業務上で必要不可欠なコミュニケーションの質を高めたり、業務効率や生産性の改善に貢献することが期待できます。

また、深層学習を用いた音声認識では、高精度な音声認識モデルを得るために、音声コーパスが大量に揃っていることが必要不可欠です。誰もが自由に使える形で大規模な音声コーパスが公開されれば、音声認識技術の向上に大きな影響を与えることができます。

英語では音声コーパスが多数公開されていますが、日本語では商用利用を含めても利用可能なコーパスの量が少なく、日本語における音声認識技術の発展と普及を妨げる大きな要因となっています。

ReazonSpeechの方式

「ReezonSpeech」では、ワンセグ放送の録画データから音声コーパスを自動抽出しています。録画データから音声コーパスを構築するためには、発話単位で音声と字幕テキストを対応付ける処理(以下、アラインメント処理)が必要になり、大規模なデータに対して手動でアラインメント処理を行うと膨大なコストがかかってしまいます。また、既存の音声認識モデルを利用すれば、アラインメント処理を自動化することができますが、その結果として得られた音声コーパスは、元の音声認識モデルやその学習に用いた音声コーパスの精度の影響を受けてしまいます。

そこで「ReazonSpeech」では、最初に小規模ではあるものの自由なライセンスで利用可能な「Mozilla Common Voice」という音声コーパスから構築した音声認識モデルでアラインメント処理を行い、そこで得られた音声コーパスを元にして再度アラインメント処理を実行する、という過程を何回も重ねることによって少しずつ音声コーパスのサイズを増やしました。現在の音声コーパスサイズは19,000時間ですが、今後さらに規模を拡大する予定です。

出典:レアゾン・ホールディングス CER音声認識精度の比較(CER Character Error Rate 小さいほど良い)

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

生成AI導入の10大リスクと対策!推進担当者のための実践ガイド

生成AI導入の社内マニュアルの作り方!必須の10項目を解説

生成AI導入の推進責任者とは?役割・スキル・任命基準と失敗例を解説

生成AI社内導入の問題点7選!情報漏洩・定着失敗など失敗事例と対策も

生成AIの保守運用費用は?内訳と予算超過を防ぐ7つの削減策も

生成AI活用のモチベーションが続かない原因と維持するための7つの施策!企業事例も解説

生成AIを予算内で導入する5つの鉄則!相場・配分・補助金で投資額を最大化

生成AI導入で法務が押さえるべき7つの論点と対応手順!必見のチェックリストも

生成AI社内浸透を成功させる7つの施策!利用率を倍増させた企業事例も

【5ステップ】生成AI導入スケジュールの立て方!期間目安と遅延を防ぐコツ

あなたにおすすめの記事

生成AI導入の10大リスクと対策!推進担当者のための実践ガイド

生成AI導入の社内マニュアルの作り方!必須の10項目を解説

生成AI導入の推進責任者とは?役割・スキル・任命基準と失敗例を解説

生成AI社内導入の問題点7選!情報漏洩・定着失敗など失敗事例と対策も

生成AIの保守運用費用は?内訳と予算超過を防ぐ7つの削減策も

生成AI活用のモチベーションが続かない原因と維持するための7つの施策!企業事例も解説

生成AIを予算内で導入する5つの鉄則!相場・配分・補助金で投資額を最大化

生成AI導入で法務が押さえるべき7つの論点と対応手順!必見のチェックリストも

生成AI社内浸透を成功させる7つの施策!利用率を倍増させた企業事例も

【5ステップ】生成AI導入スケジュールの立て方!期間目安と遅延を防ぐコツ