ELYZAが高精度の要約AI「ELYZA DIGEST」をデモサイトで公開｜対話テキストでも3行に要約可能

東大松尾研発であるAIスタートアップ、株式会社ELYZAは、日本語における生成型要約モデルの開発に成功しました。

また2021年8月26日より、同モデルを用いた要約AI “ELYZA DIGEST”（イライザ　ダイジェスト）をデモサイトとして一般公開しました。

テキストを3行に要約する「生成型」の要約AI
日本語での超巨大言語モデルの実用化を進める
煩雑で難易度が高い「対話テキストの要約」に挑戦

テキストを3行に要約する「生成型」の要約AI

ELYZA DIGESTは、「生成型」の要約モデルで、入力したテキストデータをもとに1から要約文を生成し、3行に要約するAIです。書籍や、小説のように整えられた文章はもちろん、議事録や対話テキストなどのような乱文でも要約できます。

要約するためには、該当テキストを入力する他、URLを入力することでそのページの全テキストをもとに要約文を生成します。

ELYZA DIGESTは、自然言語処理（以下、NLP）の最先端技術を活用し開発され、2021年7月1日より東証一部上場企業であるSOMPOホールディングス株式会社と開始した実証実験でも利用されています。

日本語での超巨大言語モデルの実用化を進める

音声認識や画像認識の技術の発達により、音声データや紙に書かれテキストを認識して、テキストデータに変換できるようになりました。しかし、認識されたテキストを理解して活用するNLPの精度は、未だ人間の介入が必要なレベルでした。

そのような中、2018年にGoogleが発表した大規模言語モデル「BERT」の出現により、その精度は格段に向上し、英語圏ではNLPを活用したサービスが誕生するようになりました。しかし、日本語圏では言語特性に依存する技術的な難易度の高さや公開されているデータの少なさにより、BERTの実用化が進んでいませんでした。

ELYZは、ここに問題意識を持ち、2020年に大規模言語モデルと同社独自の大規模データセットを活用した日本語特化AIエンジン「ELYZA Brain」を開発しました。その後、「ELYZA Brain」を改良し、日常・ビジネスの場でよく発生する「要約」に特化したELYZA DIGESTの公開に至りました。

煩雑で難易度が高い「対話テキストの要約」に挑戦

ELYZA DIGESTは、「対話テキストの要約」の実用化に向けて改良を続けています。対話テキストを要約する上での大きな障害として次の4点が挙げられます。

口語のため、文の構造が大きく崩れていることが多い
音声認識の失敗による誤字脱字の存在
話者が複数存在
対話トピックが多様

AIを用いた要約は、文中から一部を抜き出す「抽出型」や「圧縮型」、用意したテンプレートに置き換える「テンプレート型」、1から生成する「生成型」に分類されます。ELYZA DIGESTは、生成型であり柔軟に要約文を生成できるため、上記の4つの障害を克服できる可能性があります。

同社が実際にELYZA DIGESTを用いて対話テキストを要約したところ、口語特有の「あのー」、「えーと」などの間投詞や、音声認識のミスがあっても、下の図のような妥当な要約文を生成できました。

出典：https://prtimes.jp/main/html/rd/p/000000011.000047565.html

ELYZA DIGESTによる要約の精度評価を行うために、2つの評価軸で人間が作成した要約文との比較検証を行いました。

正確性
- 原文に対して不正確な記述がないか
流暢性
- 文法やスペル、構造のミスがないか
- 主語の省略を正しく補完できているか
- 過剰な繰り返し表現がないか

検証結果、正確性では、全体の90%の記事に対して人間とほぼ変わらない精度で出力できますが、原文にないことや事実と異なる文章を生成する可能性があることが分かりました。流暢性については、ミスがある出力が多い割合となりました。これは、文法ミスや主語の省略が原因により、読みづらい文章が生成されてしまいました。