最終更新日:
サイバーエージェント株式会社は、最大68億パラメータを持つ日本語LLM(Large Language Model、大規模言語モデル)を一般公開したことを発表しました。サイバーエージェントは、OpenAI社の「ChatGPT」などの生成AI・LLMが急速に発展に進化していることを受け、日本語LLMの開発に取り組んでいます。
現在、LLMは世界中の様々な業界やビジネスで活用されており、特にOpenAI社のChatGPTは注目を集めています。しかし、既存のLLMの多くは英語を中心に学習されており、日本語や日本文化に特化したモデルは限られていました。
この背景を踏まえ、サイバーエージェントはHugging Face Hubにて一部の日本語LLMモデルを公開しました。
これらのモデルはオープンな日本語モデルであるWikipedia、およびCommon Crawlを使用して学習され、商用利用可能なCC BY-SA 4.0ライセンスで提供されます。現時点での公開モデルとしては、日本最大規模な日本語LLMモデルとなります。(2023年5月17日時点)
このモデルを元にして各サービスに応用することで、対話型AIなどの開発が可能になり、多くの人々が日本語の自然言語処理に関する最先端の研究や開発に取り組むことができるでしょう。
また、サイバーエージェントでは、これまでの知見を活かして、チャットボットやRPAなどの業界特化型のLLMの構築や、企業との連携によるLLMを活用したビジネス開発を推進する予定です。それに際し、LLMを活用したビジネス開発に関わるエンジニアの新規採用も行い、体制の強化に努めていく予定です。
今後もサイバーエージェントは、モデルの公開や産学連携などの取り組みを通じて、国内の自然言語処理技術の発展に貢献していくことを目指しており、実際に2023年5月11日に自治体・企業向けにChatGPTの利活用方法やAIとの付き合い方についてを学ぶ研修を提供していくことを発表しました。
日本全体での技術の普及と活用を図っていくことで、産業や社会の発展に寄与していくことが期待されます。
AINOW編集部
CS専攻大学2年生・42Tokyo所属
情報発信を通して自分自身の知見も深めていきたいと思います