HOME/ AINOW編集部 /サイバーエージェント、日本最大規模の日本語LLM(大規模言語モデル)を一般公開
2023.05.19

サイバーエージェント、日本最大規模の日本語LLM(大規模言語モデル)を一般公開

最終更新日:

最大68億パラメータの日本語LLMを一般公開-オープンなデータで学習した商用利用可能なモデルを提供-

出典:https://www.cyberagent.co.jp/news/detail/id=28817

 

サイバーエージェント株式会社は、最大68億パラメータを持つ日本語LLM(Large Language Model、大規模言語モデル)を一般公開したことを発表しました。サイバーエージェントは、OpenAI社の「ChatGPT」などの生成AI・LLMが急速に発展に進化していることを受け、日本語LLMの開発に取り組んでいます。

現在、LLMは世界中の様々な業界やビジネスで活用されており、特にOpenAI社のChatGPTは注目を集めています。しかし、既存のLLMの多くは英語を中心に学習されており、日本語や日本文化に特化したモデルは限られていました。

この背景を踏まえ、サイバーエージェントはHugging Face Hubにて一部の日本語LLMモデルを公開しました。

Hugging Face Hub

出典:https://huggingface.co/cyberagent

これらのモデルはオープンな日本語モデルであるWikipedia、およびCommon Crawlを使用して学習され、商用利用可能なCC BY-SA 4.0ライセンスで提供されます。現時点での公開モデルとしては、日本最大規模な日本語LLMモデルとなります。(2023年5月17日時点)

このモデルを元にして各サービスに応用することで、対話型AIなどの開発が可能になり、多くの人々が日本語の自然言語処理に関する最先端の研究や開発に取り組むことができるでしょう。

また、サイバーエージェントでは、これまでの知見を活かして、チャットボットやRPAなどの業界特化型のLLMの構築や、企業との連携によるLLMを活用したビジネス開発を推進する予定です。それに際し、LLMを活用したビジネス開発に関わるエンジニアの新規採用も行い、体制の強化に努めていく予定です。

今後もサイバーエージェントは、モデルの公開や産学連携などの取り組みを通じて、国内の自然言語処理技術の発展に貢献していくことを目指しており、実際に2023年5月11日に自治体・企業向けにChatGPTの利活用方法やAIとの付き合い方についてを学ぶ研修を提供していくことを発表しました。

日本全体での技術の普及と活用を図っていくことで、産業や社会の発展に寄与していくことが期待されます。

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

生成AI時代の人材育成|海城中学高等学校物理部「AI班」を作った卒業生の次なる挑戦

「生成AI基盤の最新トレンド ~AIをすべてのデータに~」が7月30日より開催

Generative AI Japan|産官学連携で世界に通用する競争力の獲得を目指す

生成AI時代の人材育成|海城中学高等学校物理部がAI班を作ったワケ

GPT-4oはクレイジーだ―思わず言葉を失うような(信じられない)6つの使用例を紹介

社内の生成AIにおける「回答精度の低さ」をどう克服する?|株式会社クレディセゾンCTOに訊く

博報堂DYグループの挑戦|Human-Centered AI Institute が問うAIと人間の新しい関係性

“現実と仮想の境界線を越えたエンターテイメントとは?” |川田のロンドン体験レポート

あなたにおすすめの記事

生成AI時代の人材育成|海城中学高等学校物理部「AI班」を作った卒業生の次なる挑戦

「生成AI基盤の最新トレンド ~AIをすべてのデータに~」が7月30日より開催

Generative AI Japan|産官学連携で世界に通用する競争力の獲得を目指す

生成AI時代の人材育成|海城中学高等学校物理部がAI班を作ったワケ

GPT-4oはクレイジーだ―思わず言葉を失うような(信じられない)6つの使用例を紹介

社内の生成AIにおける「回答精度の低さ」をどう克服する?|株式会社クレディセゾンCTOに訊く

博報堂DYグループの挑戦|Human-Centered AI Institute が問うAIと人間の新しい関係性

“現実と仮想の境界線を越えたエンターテイメントとは?” |川田のロンドン体験レポート