最終更新日:
海外のAI系コンテンツに触れたい方におすすめ。
AINOWは翻訳記事だけではなく、海外記事の要約をまとめたコンテンツも配信していきます。
目次
海外記事要約まとめ
機械学習を用いたリアルタイムのARセルフィ―表現
著者 Google AI
Google開発者ブログのAI記事。この記事では、ARCoreやYouTubeストーリーに実装されているセルフィーにAR効果を付加する機能に機械学習が応用されていることが解説されている。
iPhone Xシリーズで可能な顔認識は、被写体の光学的情報を3次元的に処理できる深度カメラを実装することによって可能となっている。対してGoogleは、機械学習を画像処理に応用することによって、深度カメラを実装していないスマホでも顔認識をできるようにした。 Googleが開発した顔認識は、顔の位置を検出するニューラルネットワークと、顔の3Dモデルを生成するニューラルネットワークから構成されている。機械学習が応用されているのは、顔の3Dモデルを生成するそれである。このニューラルネットワークは、動き続ける顔の位置を予測できるように訓練されている。 以上のような顔認識を活用すると、セルフィ―にAR効果をリアルタイムに付加できるようになる。こうした「ARセルフィ―」技術を活用すると、以下のようなグラフィック処理が可能となる。
- リアルな光の反射をそなえたARメガネ(画像処理としてメガネを付加する)
- リアルなツヤ感を表現するARリップグロス
- 輝度が高い素材を用いたARフェイスペイント
こうした機械学習とARが複合した技術は、googleが提供するAR開発環境ARCore SDKをダウンロードすれば利用できる。
ディープラーニングは、地震早期警戒システムを使って地質学を揺り動かす
著者 US版NVIDIA公式ブログ
NVIDIA公式ブログ記事のひとつ。この記事では、ディープラーニングを応用した地震早期警戒システムが解説されている。
既存の地震早期警戒システムにおいては、専門家が地震の振れを検出したデータを受け取って、警戒警報を送信するまでに1分を要する。この時間を減らすためには検出するデータを増やし、そのデータを分析する必要がある。こうした課題をふまえて、アメリカのカルテック地震研究所は、25万以上の南カリフォルニアにおける地震データを活用して、地震の予兆を検出するディープラーニングモデルを開発した。
開発したモデルには、ふたつのニューラルネットワークが使われている。ひとつめは、通常は画像認識に活用されるCNNである。このCNNは、大量の地震センサーを分析して、地震の発生時間を特定する。もうひとつは、音声認識等の時系列データの認識に活用されるRNNである。このRNNは、地震波を分析して地震警報の誤発信を予防する機能を担っている。
以上のような地震早期警戒システムは、特定の地域で精度の高い性能を実現できれば、ほかの地域でも運用可能であるという。実際、カリフォルニアの地震データを活用して高い精度を実現した同システムは、日本の地震活動に応用しても高い精度を発揮した、と報告されている。
ニューラルMMO:大規模な多数のエージェントが参加するゲーム環境
著者 OpenAI
汎用的AIとその善用を目指す非営利団体OpenAIの公式ブログのひとつ。この記事では、強化学習AIの学習環境としてMMORPGに似たものを構築したことが報告されている。
強化学習AI研究の学習環境としてチェスのような既存のゲームを採用することは、よく知られたことである。しかし、従来の学習環境では複雑ではあるが規模が小さいか、規模が大きいが単純であるかのどちらかであった。こうした従来の限界を克服するために、大規模かつ複雑な学習環境としてMMORPGのゲーム世界に似た「Neural MMO」を構築した。
同環境は、平地や岩場、そして水場といった複数の地形を構成要素として生成され、最大で128個のエージェントがプレイに参加できる。エージェントは1ターン生存するごとに報酬が与えられる。生存するためには、水場にある食物を摂取しなければならない。参加エージェントが多かったり、水場が少ないと食物をめぐってエージェントどうしが戦うことになる。戦闘戦術は近接格闘、遠距離攻撃、そして魔法が選択できる。また、ニューラルネットワークの基本構造が同一な「種族」という概念も導入された。以上のゲーム環境で多数のエージェントを学習させた結果、以下のようなことがわかった。
- エージェントの数が増えると、各エージェントはマップ全体に散らばるようになる。おそらくは戦闘を回避するため。
- 同じ種族は、まとまって棲息する地域(生物学で言うところの「ニッチ」)を形成する。
- エージェントは、近くにいるエージェントの行動を模倣する傾向にある。
- 戦闘を回避するために、マップ中央付近にはエージェントは棲息しなくなる。
ちなみに、同環境は将来的にはオープンソース化することも予定されている。
機械学習は風力エネルギーの価値をブーストできる
著者 DeepMind
DeepMind公式ブログ記事のひとつ。この記事では、機械学習によって風力発電のパフォーマンスを向上させたことが解説されている。
風力発電は温室効果ガスを排出しないクリーンな発電方法として注目されているが、その一方で風力という予測困難な自然現象に頼っているので、火力発電などと比べてパフォーマンスが安定しないという欠点がある。
以上の欠点を克服すために、DeepMindとGoogleはアメリカ中部にある風力発電施設に機械学習のアルゴリズムを適用した。この機械学習は、過去の天気予報と風力発電に使われているタービンの駆動データを学習データとして、36時間後の風力発電の発電量を予測する。この予測は1時間ごとに更新されて、送電業者に最適な電力量を通知する。風力発電における発電量が事前に分かると、発電された電力の価値が上がる。そのため、上記の機械学習を導入した結果、予測なしの運用に比べて電力の価値が20%向上した。
発電事業に機械学習を導入するというアイデアは、今後はエネルギー業界の研究者や事業者と協力して風力だけではなく太陽光発電にも応用するする予定である。
報酬のモデリングを介したエージェント間の連携の拡張
著者 DeepMind Safety Research
DeepMind社においてAIの安全性と品質について研究している部署であるDeepMind Safety ResearchがMediumに投稿した記事。この記事では、強化学習AIを現実世界に実装する際に採用すべき基礎的なフレームが提案されている。
現在、強化学習の研究ではゲームを題材とすることが主流となっている。題材としてゲームが好まれるのは、学習の複雑さと報酬を明確に定義できるからである。しかし、現実世界に見られる問題はゲームよりも複雑であり、さらには報酬を明確に定義できないものが多い。
強化学習AIを現実世界に実装するためには、学習時の報酬を明確にしなければならない。こうした問題に対しては、AIの報酬をAIユーザの意図に設定することが望ましい。つまり、AIを使うユーザの意図に沿うように動作した場合に、AIが報酬を得られるように設計すべきなのだ。
さらに複雑な現実世界の問題を解決するために、複数の強化学習AIが連携してひとつの問題に取り組む「再帰的報酬モデル」が提案される。このモデルの具体例としては、コンピュータチップを設計するAIグループが想定できる。チップの設計はチップの演算能力、放熱、セキュリティ等の複数の観点から評価されなければならない。こうした複数の観点においてユーザの意図(目標値)に沿うように個々の性能評価を担当するAIが学習すれば、最終的にユーザが求めているチップが実現するはずである。
以上の再帰的報酬モデルを通して、DeepMind社は最終的にはAIの安全性を証明する制度の確立を目標に掲げている。
Special Thanks (翻訳協力):吉本幸記(フリーライター、JDLA Deep Learning for GENERAL 2019 #1取得)