最終更新日:
rinna株式会社は、日本語に特化した13億パラメータのGPT言語モデルを開発し、公開しました。
rinna社は2021年4月、日本語に特化した中規模サイズのGPT-2(GPT3-medium)の日本語モデルを公開しました。そして同年8月25日、GPT-2(GPT2-small、GPT2-xsmall)の2つのモデルと、BERTを改良したRoBERTを公開しました。これらのモデルはGitHubやHuggingFaceなどに公開されています。
そして今回、これまでに公開してきたモデルより大規模な13億パラメータを持つ日本語に特化したGPT言語モデルを開発し、日本語のNLPコミュニティに貢献するために、この言語モデルをNLPモデルライブラリ Hugging Face に商用利用可能なMITライセンスで公開しました。
今回、rinna社が公開した日本語GPTは、一般的な日本語テキストの特徴を持つ高度な日本語文章を自動生成できます。例えばGPTに入力するテキスト(テキストプロンプト)を工夫することで以下のような文章生成、分類、翻訳などの出力を得ることができます(出力は確率に基づき毎回異なるテキストが生成されます)。
GPTの入力:宮本武蔵は、
GPTの出力:生涯人生を修行に費やし心を鍛え精進した人でした。そして宮本武蔵の弟子たちの記録も数多く残されています。 |
GPTの入力:最悪だよはネガティヴ。いいねはポジティブ。素晴らしいはポジティブ。良くはないは
GPTの出力:ネガティブ。 |
GPTの入力:Helloは、こんにちはという意味です。Good morningは、おはようという意味です。Thank youは、
GPTの出力:ありがとうという意味です。感謝の気持ちを表す簡単なフレーズになります。 |
rinna社は今後、AIに関する研究を続け、高性能な製品を開発していくとしています。また、研究・開発コミュニティに貢献するために、研究成果を公開していく予定でさらに、他社との協業も進める予定です。
■AI専門メディア AINOW編集長 ■カメラマン ■Twitterでも発信しています。@ozaken_AI ■AINOWのTwitterもぜひ! @ainow_AI ┃
AIが人間と共存していく社会を作りたい。活用の視点でAIの情報を発信します。