HOME/ AINOW編集部 /サイバーエージェント、日本最大規模の日本語LLM(大規模言語モデル)を一般公開
2023.05.19

サイバーエージェント、日本最大規模の日本語LLM(大規模言語モデル)を一般公開

最終更新日:

最大68億パラメータの日本語LLMを一般公開-オープンなデータで学習した商用利用可能なモデルを提供-

出典:https://www.cyberagent.co.jp/news/detail/id=28817

 

サイバーエージェント株式会社は、最大68億パラメータを持つ日本語LLM(Large Language Model、大規模言語モデル)を一般公開したことを発表しました。サイバーエージェントは、OpenAI社の「ChatGPT」などの生成AI・LLMが急速に発展に進化していることを受け、日本語LLMの開発に取り組んでいます。

現在、LLMは世界中の様々な業界やビジネスで活用されており、特にOpenAI社のChatGPTは注目を集めています。しかし、既存のLLMの多くは英語を中心に学習されており、日本語や日本文化に特化したモデルは限られていました。

この背景を踏まえ、サイバーエージェントはHugging Face Hubにて一部の日本語LLMモデルを公開しました。

Hugging Face Hub

出典:https://huggingface.co/cyberagent

これらのモデルはオープンな日本語モデルであるWikipedia、およびCommon Crawlを使用して学習され、商用利用可能なCC BY-SA 4.0ライセンスで提供されます。現時点での公開モデルとしては、日本最大規模な日本語LLMモデルとなります。(2023年5月17日時点)

このモデルを元にして各サービスに応用することで、対話型AIなどの開発が可能になり、多くの人々が日本語の自然言語処理に関する最先端の研究や開発に取り組むことができるでしょう。

また、サイバーエージェントでは、これまでの知見を活かして、チャットボットやRPAなどの業界特化型のLLMの構築や、企業との連携によるLLMを活用したビジネス開発を推進する予定です。それに際し、LLMを活用したビジネス開発に関わるエンジニアの新規採用も行い、体制の強化に努めていく予定です。

今後もサイバーエージェントは、モデルの公開や産学連携などの取り組みを通じて、国内の自然言語処理技術の発展に貢献していくことを目指しており、実際に2023年5月11日に自治体・企業向けにChatGPTの利活用方法やAIとの付き合い方についてを学ぶ研修を提供していくことを発表しました。

日本全体での技術の普及と活用を図っていくことで、産業や社会の発展に寄与していくことが期待されます。

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

動画生成AI『Sora』とは|映像業界にとどまらないインパクトを解説

基調講演だけではない。OpenAI、Microsoft、Metaもビジョンを語ったGTC2024セッションまとめ

ChatGPTもGeminiも忘れて、これらの(信じられない)次世代AIツールをチェックしてみよう!

あなたにおすすめの記事

動画生成AI『Sora』とは|映像業界にとどまらないインパクトを解説

基調講演だけではない。OpenAI、Microsoft、Metaもビジョンを語ったGTC2024セッションまとめ

ChatGPTもGeminiも忘れて、これらの(信じられない)次世代AIツールをチェックしてみよう!