最終更新日:
海外のAI系コンテンツに触れたい方におすすめ。
AINOWは翻訳記事だけではなく、海外記事の要約をまとめたコンテンツも配信していきます。
目次
海外記事要約まとめ
あなたが起業した法人向けディープラーニングツール企業は失敗するだろう。
著者 Clemens Mewald
著者のClemens Mewald氏は、Googleの機械学習とTensorFlowのプロダクトリーダー。同氏が英語長文記事メディアMediumに投稿した記事では、ディープラーニングに関するツールを提供するスタートアップが事業に失敗する原因が解説されている。
アメリカでは、法人向けにディープラーニングに関連した開発ツールを提供することを基幹業務としたスタートアップが多数起業され、その多くが事業化に失敗した。こうした状況をふまえて、同氏はその失敗の原因と対策を解説する。法人向けディープラーニングツールを提供するスタートアップが失敗する原因として、以下のような3項目が挙げられる。
- 企業が抱えている問題を解決するソリューションは、必ずしもディープラーニングである必要がない。ほかの機械学習で解決する事例の方が多い。
- 現時点ではディープラーニングに関する共通仕様やプラットフォームが存在しないため、特定のディープラーニングによるソリューションを実現するツールを提供する事業を行うと、極めて狭い市場を商圏とせざるを得ない。
- 成功する収益モデルが確立されていない。
以上のような失敗原因を考察したうえで、失敗を回避するための指針として、以下のような5つの事項が提示される。
- ツールではなくソリューションを提供すべき
- ハードウェアからエンドユーザが直接操作するソフトウェアにいたるまでシステム全体を提供すべき
- 使用環境における互換性を確保すべき(使える環境を増やすべき)
- 特定のハードウェアに依存しないシステム作り
- ディープラーニング以外の技法にも精通する
最後に、AIスタートアップが目指すべきゴールとして大企業に買収されることも考えられ、魅力的なゴールでもあると述べている。
なぜ機械学習プロジェクトは管理が難しいのか?
著者 Lukas Biewald
著者のLukas Biewald氏は、機械学習プロジェクトを支援するスタートアップWeights&Biasesの共同設立者。同氏がMediumに投稿した記事では、機械学習システムを開発する難しさの原因とその難しさへの対処法が解説されている。同氏は、機械学習を採用している製品やシステムの開発が失敗したり停滞する原因として、以下のような3つの要因を挙げている。
- 機械学習にとって何が難しいか、ヒトは事前に判断することができない。例えば、チェスで世界チャンピオンに勝利できるAIは開発できるのに、未だにモノをうまくつかむロボットが開発できないでいる。ヒトの直観に従えば、チェスの方が難しいと判断してしまう。
- 機械学習の訓練の成果は、時間に比例しない。機械学習の訓練においては、訓練時間を2倍にしたからといって2倍の精度が得られるわけではない。訓練の早い段階で実現できる精度の上限値に達することもある。
- そもそも訓練データを集めるのが困難である。医療系のデータの場合には、プライバシーを保護するために求めているデータを集められないこともある。
以上のような困難をふまえたうえで、同氏は機械学習プロジェクトを円滑に進めるための指針を3つ提案している。
- 機械学習AIが誤った分類や判断を行った場合には、まずは訓練データを検証すべきである。AIの誤りの原因は、訓練データの不備にあることが多い。
- 簡単に実装できる機能から実現していく。はじめから複雑であったり多機能なAIシステムの構築を目標にせず、簡単な機能から完成させ顧客のフィードバックを得る。
- AIが誤った時の対処法をシステムに組み込む。AIが信頼性に欠ける判断を下した場合に備えて、同氏はヒューマン・インザ・ループシステムを推奨している。このシステムは、AIが信頼性に欠ける判断を下した場合、ヒトの専門家がAIに代わって判断するシステムである。
なお、同氏が設立したスタートアップWeights&Biasesは、AI開発プロジェクトを支援する様々なツールを提供している。
ニューラルネットワークの埋め込みによって説明されること
著者 Will Koehrsen
著者のWill Koehrsen氏は、データ分析会社Cortex Building Intelligenceに勤めるデータサイエンティスト。同氏がMediumに投稿した記事では、自然言語処理のひとつである離散的データの埋め込み情報化と教師あり学習を組みわせた技法が解説されている。
Word2Vecのような単語をベクトル化して座標空間でプロットできるようにする技法は、埋め込みと呼ばれる。この技法の利点は、単語のような離散的な情報を空間的に表現できるところにある。簡単に言えば、単語をグラフ化できるのだ。
埋め込みを実行するうえで重要となるのは、どのようなベクトルに変換するか、ということである。ベクトルの次元数は、単語の特徴を表す観点=特徴量を意味する。こうした単語のベクトル化に際しては、任意の特徴の有無を判定する教師あり学習を用いることによって、単語に特徴を示すラベルを付与することができる。
記事では以上のような教師あり学習と埋め込みを組み合わせて、英語版wikipediaの書籍をジャンルごとに分類してグラフ化する、という事例が解説されている。こうして作成されたグラフを参照すると、「SF的な歴史小説」といったジャンル分けが一義的にできない書籍の価値を座標軸における位置で図示できるようになるのだ。
MITによるディープラーニングの基本:TensorFlowを使った導入と概要
著者 Lex Fridman
著者のLex Fridman氏は、MITのAI学科の研究者。同氏がMediumに投稿した記事では、同氏のMIT(マサチューセッツ工科大学)におけるディープラーニングの基礎についての講義内容が収録されている。
記事では以下の7つのディープラーニングの手法について、数式やソースコードを一切使わずに簡潔に解説している。それぞれの手法には、TensorFlowで作成したサンプルコードへのリンクが用意されている。
- フィード・フォワード(順伝播型)・ニューラルネットワーク
- CNN(畳み込みニューラルネットワーク)
- RNN(リカレント・ニューラルネットワーク)
- エンコーダ・デコーダ・アーキテクチャ
- オートエンコーダ
- GAN(敵対的生成ネットワーク)
- 深層強化学習
以上の手法を、手法相互の関係を明確にしながら解説している。専門用語が頻出するが、専門用語の定義を確認しながら解説されるので、ディープラーニングに関する専門知識がなくても読み進められる。
この記事はG検定公式テキストのディープラーニングに関する解説をひとつのブログ記事に圧縮したようなもの、として読むことができる。なお、「ディープラーニングの最先端」「深層強化学習の導入」という発展動画教材も用意されている。
AlphaStar:リアルタイムストラテジーゲームのStarCraftⅡをマスターする
著者 DeepMind AlphaStarチーム
DeepMindの公式ブログ記事。この記事では、リアルタイムストラテジーゲームで有名なStarCraftⅡをプレイするAI「AlphaStar」が解説されている。
同社はすでにチェスや囲碁のような対戦相手が交互に行動するターンベースのゲームに関しては、ヒトのトッププロに勝利するAIを開発している。こうした成果を受けて、新しい課題として取り組んだのがリアルタイムストラテジーゲームでヒトのトッププロに勝利することである。
リアルタイムストラテジーとは、対戦相手どうしが同時に行動する対戦ゲームのことである。このジャンルにおいて世界的に有名なStarCraftⅡには対戦相手の情報が完全には分からないので索敵をしなければならない、という「不完全情報ゲーム」としての特徴もある(チェスや囲碁は「完全情報ゲーム」)。
同社の開発チームは、StarCraftⅡを攻略するAI「AlphaStar」を開発するために、教師あり学習と強化学習の両方を用いた。最初にヒトのプレイヤーのプレイデータから基本戦略を学習し、次いで戦略が異なるAIどうしで対戦させて対戦能力を強化したのだ。こうしたAIどうしのリーグ戦によって、AlphaStarはヒトが200年プレイしたの同等のプレイ経験を積んだ。そして、同ゲームのトッププロに勝利することに成功した。
開発チームの話によると、同AIの本質とは長期間におよぶデータをもとにして未来の行動を選択することにある、とのこと。それゆえ、同AIのアーキテクチャは天気予報、気候モデル、言語理解等に応用可能と考えられる。
Special Thanks (翻訳協力):吉本幸記(フリーライター、JDLA Deep Learning for GENERAL 2019 #1取得)