HOME/ AINOW編集部 /rinna、13億パラメータをもつGPT言語モデルを公開、高度な日本語文章が生成可能
2022.01.26

rinna、13億パラメータをもつGPT言語モデルを公開、高度な日本語文章が生成可能

rinna株式会社は、日本語に特化した13億パラメータのGPT言語モデルを開発し、公開しました。

rinna社は2021年4月、日本語に特化した中規模サイズのGPT-2(GPT3-medium)の日本語モデルを公開しました。そして同年8月25日、GPT-2(GPT2-small、GPT2-xsmall)の2つのモデルと、BERTを改良したRoBERTを公開しました。これらのモデルはGitHubやHuggingFaceなどに公開されています。

そして今回、これまでに公開してきたモデルより大規模な13億パラメータを持つ日本語に特化したGPT言語モデルを開発し、日本語のNLPコミュニティに貢献するために、この言語モデルをNLPモデルライブラリ Hugging Face に商用利用可能なMITライセンスで公開しました。

今回、rinna社が公開した日本語GPTは、一般的な日本語テキストの特徴を持つ高度な日本語文章を自動生成できます。例えばGPTに入力するテキスト(テキストプロンプト)を工夫することで以下のような文章生成、分類、翻訳などの出力を得ることができます(出力は確率に基づき毎回異なるテキストが生成されます)。

GPTの入力:宮本武蔵は、

GPTの出力:生涯人生を修行に費やし心を鍛え精進した人でした。そして宮本武蔵の弟子たちの記録も数多く残されています。

GPTの入力:最悪だよはネガティヴ。いいねはポジティブ。素晴らしいはポジティブ。良くはないは

GPTの出力:ネガティブ。

 GPTの入力:Helloは、こんにちはという意味です。Good morningは、おはようという意味です。Thank youは、

GPTの出力:ありがとうという意味です。感謝の気持ちを表す簡単なフレーズになります。

rinna社の日本語GPTモデルの特徴
  • 学習データとして、日本語のC4CC-100 、Wikipediaのオープンソースデータを使用
  • モデルは十分に学習されており、その性能は約14 perplexityを達成(14 perplexityとは、GPTが次の単語を予測するときに、単語候補の数を14に絞れる性能)
  • 利用者が簡単にアクセスできるように、開発したモデルを Hugging Face に商用利用可能なMITライセンスで公開
  • 利用者の目的に沿った多様なタスク(ドメインに特化した文章生成、分類、翻訳など)を、テキストプロンプトやファインチューニングにより実現可能

rinna社は今後、AIに関する研究を続け、高性能な製品を開発していくとしています。また、研究・開発コミュニティに貢献するために、研究成果を公開していく予定でさらに、他社との協業も進める予定です。

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

生成AI導入の推進責任者とは?役割・スキル・任命基準と失敗例を解説

生成AI社内導入の問題点7選!情報漏洩・定着失敗など失敗事例と対策も

生成AIの保守運用費用は?内訳と予算超過を防ぐ7つの削減策も

生成AI活用のモチベーションが続かない原因と維持するための7つの施策!企業事例も解説

生成AIを予算内で導入する5つの鉄則!相場・配分・補助金で投資額を最大化

生成AI導入で法務が押さえるべき7つの論点と対応手順!必見のチェックリストも

生成AI社内浸透を成功させる7つの施策!利用率を倍増させた企業事例も

【5ステップ】生成AI導入スケジュールの立て方!期間目安と遅延を防ぐコツ

生成AI導入が社員に浸透しない原因!理解を深めて定着させるコツを解説

生成AI導入は外注すべき?判断軸5つと費用・期間の目安を解説

あなたにおすすめの記事

生成AI導入の推進責任者とは?役割・スキル・任命基準と失敗例を解説

生成AI社内導入の問題点7選!情報漏洩・定着失敗など失敗事例と対策も

生成AIの保守運用費用は?内訳と予算超過を防ぐ7つの削減策も

生成AI活用のモチベーションが続かない原因と維持するための7つの施策!企業事例も解説

生成AIを予算内で導入する5つの鉄則!相場・配分・補助金で投資額を最大化

生成AI導入で法務が押さえるべき7つの論点と対応手順!必見のチェックリストも

生成AI社内浸透を成功させる7つの施策!利用率を倍増させた企業事例も

【5ステップ】生成AI導入スケジュールの立て方!期間目安と遅延を防ぐコツ

生成AI導入が社員に浸透しない原因!理解を深めて定着させるコツを解説

生成AI導入は外注すべき?判断軸5つと費用・期間の目安を解説