HOME/ AINOW編集部 /LINEが日本語特化の超巨大言語モデルの開発を発表、100億ページ以上の日本語データを学習
2020.11.25

LINEが日本語特化の超巨大言語モデルの開発を発表、100億ページ以上の日本語データを学習

最終更新日:

LINE株式会社は2020年11月25日、同社の親会社のNAVERと共同で、世界初となる日本語に特化した超巨大言語モデルの開発と、その処理に必要なインフラ構築を行うと発表しました。

超巨大言語モデルとは、膨大なデータを学習させた汎用的な言語モデルです。AIによるより自然な文章の認識や表現を可能にするもので、日本語に特化した超巨大言語モデル開発は世界でも初めての試みです。

從來の言語モデルでは、それぞれの目的にあわせて、個別に膨大な文章を学習させる必要がありました。言語モデルは、特にチャットボットとして活用が進み、Q&Aや対話などにその技術が応用されています。

一方で、言語モデルの研究開発では、複雑な文章の認識や文脈の認識など、依然として技術的な課題を抱えていました。

そこで注目されているのが汎用的な言語モデルです。Googleが発表したBERTや、アメリカの非営利団体 OpenAIが発表したGPTなどが大きく話題になりました。

これらの汎用言語モデルは、新聞記事や百科事典、小説、コーディングなどの膨大な言語データを学習させ、その上で少量のデータを用いて、再学習することで、高い精度の言語処理を実現可能です。

これにより、さまざまな言語処理(対話、翻訳、入力補完、文書生成、プログラミングコードなど)を行うことが可能となり、個々のユースケースに簡単に対応できると期待されています。

LINEが開発する汎用言語モデルは、1750億以上のパラメータと、100億ページ以上の日本語データを学習データとして利用予定です。この超巨大言語モデルの実現により、新しい対話AIの開発や検索サービスの品質向上など、LINEのサービスの活用のほか、第三者との共同開発やAPIの外部提供についても検討しています。

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

シナモン創業者の堀田氏がDX戦略の勝ちパターンを解説|戦略デザインのポイントとは

機械学習におけるモデルとは?|モデルの種類や「よいモデル」とは何かについて

AI・データ分析プロジェクトを成功に導く“ビジネス力”とは|組織が陥る落とし穴はここだ!

先週のAI関連人気ツイートTOP20!【2021/04/12更新】

Word2vecとは|モデルの種類やその仕組み、活用事例まで紹介!

テレワーク 生産性下がる

【生産性が下がる!?】テレワーク導入による問題と解決方法を徹底解説!

テレワーク導入事例/アイキャッチ

【成功の秘訣】業種別・課題別で見るテレワーク導入事例

テレワーク中の電話対応_転送はどうする_おすすめのサービスを紹介!のアイキャッチ画像

テレワーク中の電話対応はどうする?おすすめのアプリを紹介!

テレワークにおけるの課題とは? 【人事担当者必見!】のLP

テレワークにおける人事評価制度の課題とは?【人事担当者必見!】

【テレワーク導入事例集】 成功_失敗事例や勤怠管理導入事例を紹介!のアイキャッチ画像

【テレワーク導入事例集】成功/失敗事例や勤怠管理導入事例を紹介!

あなたにおすすめの記事

シナモン創業者の堀田氏がDX戦略の勝ちパターンを解説|戦略デザインのポイントとは

機械学習におけるモデルとは?|モデルの種類や「よいモデル」とは何かについて

AI・データ分析プロジェクトを成功に導く“ビジネス力”とは|組織が陥る落とし穴はここだ!

先週のAI関連人気ツイートTOP20!【2021/04/12更新】

Word2vecとは|モデルの種類やその仕組み、活用事例まで紹介!

テレワーク 生産性下がる

【生産性が下がる!?】テレワーク導入による問題と解決方法を徹底解説!

テレワーク導入事例/アイキャッチ

【成功の秘訣】業種別・課題別で見るテレワーク導入事例

テレワーク中の電話対応_転送はどうする_おすすめのサービスを紹介!のアイキャッチ画像

テレワーク中の電話対応はどうする?おすすめのアプリを紹介!

テレワークにおけるの課題とは? 【人事担当者必見!】のLP

テレワークにおける人事評価制度の課題とは?【人事担当者必見!】

【テレワーク導入事例集】 成功_失敗事例や勤怠管理導入事例を紹介!のアイキャッチ画像

【テレワーク導入事例集】成功/失敗事例や勤怠管理導入事例を紹介!