最終更新日:
海外のAI系コンテンツに触れたい方におすすめ。
AINOWは翻訳記事だけではなく、海外記事の要約をまとめたコンテンツも配信していきます。
目次
海外記事要約まとめ
5歳児でもわかる畳み込みニューラルネットワークの完全ガイド
著者 Sumit Saha
著者のSumit Saha氏は、インドにあるべロール工科大学のコンピュータ・サイエンス学科の在校生。同氏がMediumに投稿した記事では、畳み込みニューラルネットワーク(CNN)の計算原理が分かりやすく図解されている。
画像認識AIに応用されているディープラーニングモデルであるCNNは、畳み込み層、プーリング層、そして全結合層という役割の異なるレイヤーが積み重なった構造となっている。それぞれのレイヤーの役割は、以下の通り。
-
- 畳み込み層は、入力となる画像の画素情報が持っている特徴を抽出する。具体的にはフィルターと呼ばれる特徴を抽出するために用意された2次元の数列と、入力画像の情報を積和計算(掛け算と足し算を組みわせて繰り返す)して、その計算結果を2次元情報として集計する。こうした積和計算を繰り返すと、入力画像の特徴を数字の分布として抽出することができる。
- プーリング層は、畳み込み層から受け取った情報を圧縮する。圧縮方法には、着目する範囲の数列から最大値を抽出するマックスプーリングと、平均値を抽出するアベレージ・プーリングのふたつがある。プーリング層の処理が加わることで、畳み込み層がもつ特徴が増幅される。
- 畳み込み層とプーリング層の処理を繰り返した後に、その処理結果は全結合層に渡される。全結合層では、処理結果から画像が何であるのか(例えばイヌなのかネコなのか)を分類する。分類にはソフトマックス関数という関数が使われる。
以上に説明したようなCNNの処理過程をGIFアニメを用いて直観的に理解できるように解説している。数式もほとんど使われておらず、足し算と掛け算ができてGIFアニメの意味がわかればCNNの仕組みが理解できる記事となっている。
エル・パイスはいかにしてAIを使ってコメント欄の毒性を弱めたか?
著者 US版Google公式ブログ
US版Google公式ブログ記事のひとつ。この記事では、スペインの新聞のコメント欄をAIによって改善した事例が紹介されている。
スペインの大衆紙エル・パイスの電子版には、多くの電子版新聞と同様にコメント欄が設けられていた。しかし、近年、スパムや人種差別等の有害なコメントに悩まされていた。有害コメント対策として、コメント欄の制限やコメント欄そのものの一部廃止を行っていた。
有害コメント対策で転機が訪れたのは、Googleが開発しているPerspective APIを知った時だった。同APIは、機械学習によってコメントを学習することによって、有害コメントを抽出することができるものである。同APIの存在を知り、同新聞社はGoogleと協力して30万件のスペイン語のコメントを同APIに学習させた。
学習済みの同APIを導入したことによって、有害なコメントを予防できるようになった。明らかに有害なコメントを書き込んだ場合、有害な表現を書き換えるように促し、さらには有害なコメントを連投する読者の特定も可能となった。こうした取り組みのおかげで、コメントの有害性が7%減少した一方で、コメント数は19%増加したのだった。
OpenAI GPT-2の言語生成を可視化して理解する
著者 Jesse Vig
著者のJesse Vig氏は、オープンイノベーション・プロジェクトを実行するために優秀な人材を企業に派遣するPARCで自然言語処理を専門とするリサーチ・サイエンティストとして働いている。同氏がMediumに投稿した記事では、Open AIが発表した最新の自然言語処理GPT-2の動作が図解されている。
近年の自然言語処理研究に大きな影響を与えた技法として知られるのが、Googleが発表したtransformerである。この技法は、従来は文字列を含む時系列データの予測に使われていたRNNを廃し、新しくattentionという処理を提案したことで注目された。attentionにおいては出力となる単語を予測する時に予測する単語の前にある単語にもとづいて処理する、という特徴があった。だが、BERTの登場によりtransformerは過去の技法という扱いを受けるようになった。というのも、BERTは前の単語にもとづくのではなく、前後にある周囲の単語にもとづく双方向的な処理を採用して、過去の技法を大きく上回る性能を実現したからだ。
しかし、Open AIが発表したGPT-2では再びtransformerが採用されて、特に文章作成能力で大きな成果が得られた。そこで同氏は、同言語AIがどの単語にもとづいて出力文字を予測しているのか調べるために、どの単語に注意を当てるかを可視化するツールを自作した。
以上の処理可視化ツールを使って調べた結果、同言語AIは動詞の後の単語を予測する時は主語となる単語に注意を向けている、あるいは(色を列挙するような)等置表現では等置された単語に注意を向けるといったことがわかった。
同言語AIは、文章生成においてヒトに近いレベルに達しつつある。最近では画像生成や動画生成においても、本物と見分けることが難しいフェイクコンテンツが作れるようになってきている。こうしたフェイクコンテンツこそが、今後5年以内の最大の脅威となるだろう、と同氏は指摘して筆を擱く。
食料廃棄を廃棄する:Winnowは業務用食料廃棄をスリムにする
著者 US版NVIDIAブログ
US版NVIDIA公式ブログの記事のひとつ。この記事では、厨房からの食糧廃棄の削減にAIが活用されている事例が紹介されている。
世界で生産されている食料の約3分の1、重量にして13億トンが毎年廃棄されている。こうした状況を解決すべくイギリスのAIスタートアップWinnowは、食糧廃棄を削減するAIシステムWinnow Visionを開発した。
同システムは厨房のゴミ箱の重量を測る秤とゴミ箱の中を認識するAIカメラから構成されている。AIカメラは、事前に食料を識別できるように学習している。この学習には食料ごとに1,000枚の画像が活用されている。このAIカメラが識別した食料はゴミ箱の重さの変化と紐づけられており、どんな食料を何個廃棄したか自動的に集計されるようになっている。集計結果は導入した厨房スタッフに共有され、この結果にもとづいて食料廃棄を削減する施策を立案する。
同システムはすでにIKEAや中東の大手不動産開発グループEmaarに導入されている。同システムを導入すると、年間3,000万ドル、2,300万食分の食料の廃棄を削減できると見込まれている。Winnowは、2025年までに10億ドル相当の食料廃棄を削減することを目指している。
ディープラーニングのパフォーマンス向上のためのカンペ
著者 Chris Dossman
著者のChris Dossman氏は、中国のソフトウェア開発会社Wonder Technologyのチーフ・データサイエンティストを務めている。同氏がMediumに投稿した記事では、ディープラーニングの予測精度を上げるノウハウがまとめられている。
ディープラーニングを活用したシステムを構築するうえで重要なのは、ディープラーニングのモデル設計もさることながら、設計したモデルを効率的に訓練することである。というのも、ディープラーニングモデルにおいては、学習がうまく進まず予測精度が思うように上がらないことが、多々起こるからだ。
同氏は、学習がうまく進まない時の対策として、以下のような4つのアプローチを提案している。
- データ最適化:学習データの偏りを除去したり、学習データの量を増やす。
- アルゴリズム調整:先行研究を参考にして、アルゴリズムを試行錯誤する。
- ハイパーパラメータ最適化:AI開発者が指定するべき学習回数(専門用語でエポックという)や一度に学習する量(専門用語でバッチサイズという)を変えてみる。
- アンサンブル:学習データを変えることによって複数生成したモデルを組み合わせてみる。
以上のアプローチでも予測精度が上がらない場合は、そもそもディープラーニングを活用すべきかどうか、といった問題を根本的に捉え直すことをすすめている。
Special Thanks (翻訳協力):吉本幸記(フリーライター、JDLA Deep Learning for GENERAL 2019 #1取得)