最終更新日:

世界トップクラスのトレーニングデータでAI開発をリードするAppen(アッペン)の日本法人であるアッペンジャパン(Appen Japan)株式会社は、生成AIアプリケーションの構築を可能にする「人間のフィードバックによる強化学習」、「ドキュメント・インテリジェンス」、そして「自然言語処理(NLP)モデルの系列ラベリング」の3つの製品・サービスを発表しました。
アッペンジャパンは、高品質なトレーニングデータを高速かつ大規模に生成することができるアッペンAIデータアノテーションプラットフォームを提供しています。大規模なデータを扱う上で、直面する課題は「使えないデータの存在」、「複雑なデータ準備の必要性」、「不完全なデータの存在」、そして「洗練されたデータパイプラインの欠如」があげられます。
今回アッペンジャパンが発表した3つの製品・サービスは、これらの課題を解決し、顧客企業が「AIを活用した体験」をエンドユーザーに提供できるようにすることを目的に開発しました。
3つの新製品・サービスの概要
人間のフィードバックによる強化学習
人的資源を活用することで、大規模な言語モデルにおける偏りや幻覚のリスクに対処します。
人間と機械の対話方法に革命をもたらしているChatGPTや大規模言語モデルの登場により、入力されたデータをもとに、新しいデータを生成するAI技術である「生成AI」の可能性に注目が集まっています。
しかし、生成AIには正確で倫理的に整合性のある結果を出すことが難しいという課題があります。この課題を踏まえ、アッペンジャパンは「人間のフィードバックによる強化学習」の提供を開始しました。
この製品は、アッペンジャパンの長年の経験を有する熟練したAIトレーニングスペシャリストにより設計されています。AIによるチャットボットの回答に対して、AIトレーニングスペシャリストのグループが人的にランク付けを行うことにより、正確で偏りがない回答を顧客が生成できます。

ドキュメント・インテリジェンス
構造化されていないドキュメントから、重要なインサイトを抽出することができます。
アッペンジャパンの顧客はスキャンや撮影した文書など、構造定義できていない非構造化データを保有していますが、これらのデータから十分な情報を得られないことが課題になっています。「ドキュメント・インテリジェンス」は、多様な文章に対して99%という高い精度で、あらゆる文書をAI開発データのソースとして活用できるようにすることができます。
高品質なデータを活用することで、企業は顧客のニーズ、好み、行動をよりよく理解し活用することで、顧客のニーズを予測することができます。

自然言語処理(NLP)モデルの自動系列ラベリング
「自然言語処理(NLP)モデルの自動系列ラベリング」は、ゼロショットまたは少ないショット数の学習法と大規模な言語モデルを活用することで、高速、かつ品質を担保した上で、自動的に効率的にデータにアノテーション付けすることができます。
アノテーションされたデータセットは、アッペンジャパンのAIトレーニングスペシャリストによりレビューされることで品質と精度が保証されます。
最高製品責任者 スジャータ・サギラジュ氏 コメント

「生成AIは、私たちがこれまで思いも付かなかったような方法で、人間の体験を変えていくことが予想されます。当社は顧客のために、こうした体験をさらにパワーアップさせることができることに期待しています。ブランドの完全性を確保し、有害であったり、偏りがあったりすることを防ぐために、生成AIアプリケーションを構築しながら、人間によるフィードバックを得ることは不可欠と考えています。」
アッペンジャパン 代表 吉崎 哲郎 コメント

「生成AI分野は急速に発展しています。ChatGPTに代表される大規模言語モデルは人間の手によるフィードバックで倫理的かつ理解しやすい出力を行うためのスコアリングが重要なデータ整備の工程です。またAI-OCRなどの活用でさまざまなフォーマットからのドキュメントを認識するニーズも高まっています。このニーズに対応したドキュメント・インテリジェンスをリリースしました。同様に自然言語の活用も進んでいます。この分野に向けた自動ラベリングツールも含めた新製品・サービスをご紹介します。」