HOME/ AINOW編集部 /PKSHA Technology、自然言語処理ライブラリ「Camphr」をオープンソースで公開
2020.03.13

PKSHA Technology、自然言語処理ライブラリ「Camphr」をオープンソースで公開

最終更新日:

自然言語処理ライブラリ「Camphr」(カンファー)をオープンソースとして公開

株式会社PKSHA Technologyは、自然言語処理ライブラリ「Camphr」(カンファー)をオープンソースとして公開したと発表しました。 Camphrは最先端のディープラーニングの手法から従来の手法まで、 幅広い自然言語処理手法を簡単に組み合わせられるライブラリです。

私たちが日常的に使用している自然言語をコンピュータで扱う自然言語処理技術は、 文書検索や機械翻訳など、 私たちの身の回りのさまざまなサービスで広く利用されています。

▼自然言語処理について詳しくはこちら

近年では、ディープラーニング技術の発展に伴ってディープラーニング技術を活用した自然言語処理手法が数多く生み出されており、 高性能な検索、 機械翻訳、 自動応答などの技術が実用化されてきています。

▼ディープラーニング技術を活用した自然言語処理手法について詳しくはこちら

通常、 産業用途の自然言語処理を利用したサービス開発においては、 最先端の手法を1つ使えば全ての問題を解決できるというようなことはほとんどありません。従来手法も含めた多種多様な処理の組み合わせを検討し、 試行錯誤を繰り返す必要があります。

ところが、 自然言語処理システムを構成する各手法は、 通常、 ライブラリや参照実装の形で個別に公開・提供されているため、 それらを組み合わせて実験やサービス開発をおこなうには、 その都度煩雑なプログラミングが必要となり、 開発者にとって大きな負担となっていました。

以上の背景から、PKSHA Technologyは、 研究者やエンジニアによる自然言語処理システムの研究・サービス開発の効率化・高度化と、 それによる自然言語処理技術の社会実装の加速を目的として、「Camphr」を開発し公開に至りました。

Camphrは、 さまざまな手法を統一的に扱い、 パイプライン化できるフレームワーク「spaCy」のプラグインとして実装されています。 Camphrを利用すると、 開発者はspaCyの枠組みの上で、 最先端の深層学習手法から従来のパターン・辞書等を用いたアルゴリズムまでを簡単に組み合わせて使用できます。

Camphrの概要
Camphrは、 最先端のディープラーニングの手法から従来のパターン・辞書等を用いたアルゴリズムまでを自由に組み合わせられる、 自然言語処理のためのオープンソース・ソフトウェア。 自然言語処理のフレームワークであるspaCyのプラグインとして実装されており、 一連の処理をパイプラインとして組み立てて扱うことを容易にする。

Camphrの機能は主に以下です。

  • BERT、 XLNetなどのディープラーニングモデルを用いた言語解析・学習機能
  • 多言語対応(75言語に対応したBERTベースの解析を提供するUdify)
  • キーワード抽出、 ELMoなどの埋め込みベクトル演算機能など
  • KNPを利用した構文解析機能

GitHubリポジトリはこちら

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

【AINOWロゴがリニューアル】生成数は2000以上! AIでロゴ生成した裏側を全公開

野球もデータドリブンの時代に ー野球特化の姿勢推定AI「Deep Nine」がリリース 【プロ球団で試験導入】

先週のAI関連人気ツイートTOP20!【2020/06/01更新】

2020年6月のAI関連イベントまとめ

AI-OCRとBPOを組み合わせ一括した文書の電子化をサポートする「Documentation One」がリリース

中外製薬とFRONTEOがライセンス契約、創薬プロセスにAIを活用

ニュースは新型コロナウイルスに過剰反応しているのか?

東大・松尾氏とABEJA・岡田氏がDXをテーマに対談【6/5に無料開催】

スターバックスはコーヒー事業者ではない ― データテック企業なのだ

フォトラクションが5.7億の資金調達、AIを活用した建設特化BPOサービスの開発に着手