#タグから探す

HOME/ AINOW編集部 /rinna、13億パラメータをもつGPT言語モデルを公開、高度な日本語文章が生成可能

2022.01.26

rinna、13億パラメータをもつGPT言語モデルを公開、高度な日本語文章が生成可能

rinna株式会社は、日本語に特化した13億パラメータのGPT言語モデルを開発し、公開しました。

rinna社は2021年4月、日本語に特化した中規模サイズのGPT-2（GPT3-medium）の日本語モデルを公開しました。そして同年8月25日、GPT-2（GPT2-small、GPT2-xsmall）の2つのモデルと、BERTを改良したRoBERTを公開しました。これらのモデルはGitHubやHuggingFaceなどに公開されています。

そして今回、これまでに公開してきたモデルより大規模な13億パラメータを持つ日本語に特化したGPT言語モデルを開発し、日本語のNLPコミュニティに貢献するために、この言語モデルをNLPモデルライブラリ Hugging Face に商用利用可能なMITライセンスで公開しました。

今回、rinna社が公開した日本語GPTは、一般的な日本語テキストの特徴を持つ高度な日本語文章を自動生成できます。例えばGPTに入力するテキスト（テキストプロンプト）を工夫することで以下のような文章生成、分類、翻訳などの出力を得ることができます（出力は確率に基づき毎回異なるテキストが生成されます）。

GPTの入力：宮本武蔵は、

GPTの出力：生涯人生を修行に費やし心を鍛え精進した人でした。そして宮本武蔵の弟子たちの記録も数多く残されています。

GPTの入力：最悪だよはネガティヴ。いいねはポジティブ。素晴らしいはポジティブ。良くはないは

GPTの出力：ネガティブ。

GPTの入力：Helloは、こんにちはという意味です。Good morningは、おはようという意味です。Thank youは、

GPTの出力：ありがとうという意味です。感謝の気持ちを表す簡単なフレーズになります。

rinna社の日本語GPTモデルの特徴

学習データとして、日本語のC4、CC-100 、Wikipediaのオープンソースデータを使用
モデルは十分に学習されており、その性能は約14 perplexityを達成（14 perplexityとは、GPTが次の単語を予測するときに、単語候補の数を14に絞れる性能）
利用者が簡単にアクセスできるように、開発したモデルを Hugging Face に商用利用可能なMITライセンスで公開
利用者の目的に沿った多様なタスク（ドメインに特化した文章生成、分類、翻訳など）を、テキストプロンプトやファインチューニングにより実現可能

rinna社は今後、AIに関する研究を続け、高性能な製品を開発していくとしています。また、研究・開発コミュニティに貢献するために、研究成果を公開していく予定でさらに、他社との協業も進める予定です。

■AI専門メディア AINOW編集長 ■カメラマン ■Twitterでも発信しています。@ozaken_AI ■AINOWのTwitterもぜひ！ @ainow_AI ┃

AIが人間と共存していく社会を作りたい。活用の視点でAIの情報を発信します。

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

お名前

メールアドレス

職業任意

職種任意

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

AIエージェントのセキュリティリスクとは？事例から学ぶ実践的な対策まで解説

#生成AI 2026.07.27

AIエージェントの失敗事例4つ！セキュリティ事故と運用トラブルを解説

#生成AI 2026.07.26

AIエージェントは法務でどこまで使える？活用法と注意点を解説

#生成AI 2026.07.24

経理AIエージェントの導入判断はRPAとの違いで見極める！メリットも解説

#生成AI 2026.07.24

AIエージェントと生成AIの違いとは？仕組み・使い分けを解説

#生成AI 2026.07.22

生成AI開発会社の選び方とおすすめ13社！目的別に徹底比較

#生成AI 2026.07.21

AIエージェント導入の企業判断はROIで見極める！経営リスクも解説

#生成AI 2026.07.21

生成AI研修を法人で成功させる選び方！おすすめ10選も紹介

#生成AI 2026.07.21

生成AI導入で中小企業が失敗しないための5ステップ！費用相場も解説

#生成AI 2026.07.17

プロンプトエンジニアリング研修おすすめ8選！失敗しない選び方も

#生成AI 2026.07.13

あなたにおすすめの記事

AIエージェントのセキュリティリスクとは？事例から学ぶ実践的な対策まで解説

#生成AI 2026.07.27

AIエージェントの失敗事例4つ！セキュリティ事故と運用トラブルを解説

#生成AI 2026.07.26

AIエージェントは法務でどこまで使える？活用法と注意点を解説

#生成AI 2026.07.24

経理AIエージェントの導入判断はRPAとの違いで見極める！メリットも解説

#生成AI 2026.07.24

AIエージェントと生成AIの違いとは？仕組み・使い分けを解説

#生成AI 2026.07.22

生成AI開発会社の選び方とおすすめ13社！目的別に徹底比較

#生成AI 2026.07.21

AIエージェント導入の企業判断はROIで見極める！経営リスクも解説

#生成AI 2026.07.21

生成AI研修を法人で成功させる選び方！おすすめ10選も紹介

#生成AI 2026.07.21

生成AI導入で中小企業が失敗しないための5ステップ！費用相場も解説

#生成AI 2026.07.17

プロンプトエンジニアリング研修おすすめ8選！失敗しない選び方も

#生成AI 2026.07.13