海外のAI系コンテンツに触れたい方におすすめ。
AINOWは翻訳記事だけではなく、海外記事の要約をまとめたコンテンツも配信していきます。
目次
海外記事要約まとめ
6ヶ月以内でのGoogle AI原則のアップデート
著者 Kent Walker
著者のKent Walker氏は、Googleグローバル事務部門のシニア・ヴァイス・プレジデントを務めている。同氏がUS版Google公式ブログに投稿した記事では、Google AI原則に関する追加の施策について解説されている。
昨年6月、同社はAIの軍事利用の禁止等を定めたAI開発・利用に関する社内規定「AI利用における基本方針」を発表した。同原則を発表してから約半年が経過して、同原則を円滑に運用する必要性から追加の規定を定めることになった。追加された規定は以下の通り。
- 「技術の実践における倫理」と題した技術倫理に関する教育資料の作成と、この資料を用いた社員トレーニングの義務化。
- 自然言語処理におけるバイアスの除去と刑事事件においてAIを活用することを検討するセッションの実施。
- 同社が提供する無料の機械学習コース「Machine Learning Crash Course」に「公平性に関するテクニカルモジュール」を追加。このモジュールは現在は英語版しかないが、今後は11ヶ国語に対応予定。
同社はこれからも新製品・新サービスを開発するたびに、AI原則に照らして妥当なものなのかどうかレビューし続けるとしている。
コールドスタート問題:いかにして機械学習に関するポートフォリオを作るか?
著者 Edouard Harris
著者のEdouard Harris氏はAINOW翻訳記事「なぜデータサイエンスのゼネラリストになるべきではないのか」を執筆したJeremie Harris氏と同じ企業で働くAI就業メンター。Harris氏がMediumに投稿した記事では、同氏がメンターとして関わったAIエンジニア志望者の逸話が解説されている。
同氏がメンターとなったエンジニア志望者のなかには、AIに関するキャリアがなくソフトウェア開発経験もないにも関わらず、AI企業に就職できたヒトビトがいる。そうしたヒトビトは、例えばスーパーの陳列棚の写真を大量に撮影して在庫があるかどうか判定するAIを開発したり、YouTubeにある失神したパイロットの動画を集めてパイロットが失神したかどうかを判定するAIを開発したりして、企業の目にとまりAI企業に就職できた。こうしたヒトビトから得られる教訓は、以下のようなものである。
- AIの学習モデルが作れるかどうかは、大して重要ではない。
- 自分だけが注目したデータを集めたヒトは、結果的にデータの整形に精通するようになる。
- (画像判定AIのような)視覚的な仕事を実行するAIを開発すると、面接時にアピールしやすい。
- 突拍子もないことを実現できるヒトは、突拍子もないことを思い付くヒトに限られる。
なお、この記事の原題の「コールドスタート」とはIT用語で電源が切れた状態からデバイスを起動することを意味している。こうした原義をふまえたうえで、AIに関するキャリアや知識がない状態からAI企業に就職したことを「コールドスタート」と比喩的に表現している。
AIによって生成されたフェイク画像を見分ける方法
著者 Kyle McDonald
著者のKyle McDonald氏は、プログラミングを活用したアート作品を制作するアーティスト。同氏がMediumに投稿した記事では、GANによって生成された画像を見抜く方法が解説されている。
敵対的生成ネットワーク(GAN)の精度が向上したことによって、現在では一見すると本物のヒトを撮影した画像なのか、あるいはAIが生成した実在しないヒトの画像なのかを識別することが難しくなっている。しかし、同氏によれば、GANが生成した画像には本物の画像にはない特徴がある。そうした特徴には、以下のようなものがある。
- ストレートヘアは、油絵で描かれたような質感がある。
- 画像に写りこんだテキストは、判読できない。
- 背景が非現実的
- イヤリングや瞳の色が時として非対称
- 歯並びが不自然
- ヘアスタイルが不自然にボサボサ
- 現実にはありえないジェンダーファッションの組み合わせ(女性の顔に髭など)
ちなみに、記事にはAIが生成したフェイク画像を見抜くゲーム『React App』も紹介されている。このゲームを始めると、ウェブブラウザに短時間だけ顔写真が表示される。この写真が消えた後に、その写真に写っている顔がリアルかフェイクか答えていく、という趣向になっている。
(その翻訳は)まさにその通り!:AIが言語オタクのために新しい章を記す。
著者 Scott Martin
著者のScott Martin氏はUS版NVIDIA公式ブログのシニア・ライターであり、AINOW海外記事要約において度々登場する「NVIDIAライターの常連」である。同氏が今回US版NVIDIAブログに投稿した記事では、AIを活用した翻訳アプリを開発したスタートアップLiltが紹介されている。
NVIDIAのアクセレータープログラムNVIDIA InceptionのメンバーであるスタートアップのLiltは、ディープラーニングを活用した翻訳アプリを開発した。このアプリに翻訳したい文章を入力すると、翻訳文の候補が表示される。ユーザは、この翻訳候補文に対して承認、変更、あるいは拒否を選ぶことを繰り返して翻訳をすすめる。こうしたユーザと翻訳アプリとの相互作用から、翻訳アプリは学習する。
翻訳アプリに活用されているアルゴリズムは、多くの翻訳アプリで採用されているRNNではなくTransformerネットワークである。RNNは文章の最後の単語により重みを与えるのに対して、Transformerネットワークにおいては、翻訳したい文章の全ての単語の重みを相互に比較して翻訳を行う。
以上のようなLiltの翻訳アプリの最大の特徴は、ユーザに応じて学習するところである。こうした翻訳のカスタマイズは、例えばGoogle翻訳では出来ないことである。
TensorFlowのオブジェクト検知を使ってFPSゲームをコントロールする
著者 Chintan Trivedi
著者は以前にAINOW翻訳記事「ディープラーニング(CycleGAN)を使ってフォートナイトをPUBGに変える」を執筆しているChintan Trivedi氏。同氏が今回Mediumに投稿した記事では、TensorFlowのオブジェクト検知機能を使ってFPSのプレイを実現したことが解説されている。
同氏は、Googleが提供する機械学習ライブラリTensorFlowを使って、プレイヤーの動作を検出してゲームキャラクターを操作する格闘ゲームを開発した技術者のブログを見て、この技術をFPSに応用することを思いついた。この技術は、ウェブカメラからプレイヤーの動作を撮影して、その撮影した動画のなかからパンチやキックといった特定の動作をAIが検知したら、ゲームの任意のコマンドが実行される、という仕組みであった。
以上の技術をFPSに応用するにあたり、同氏は右手に握ったテニスボールの動きをマウスによる視線移動、左手の人差し指の動きを位置移動、そして口の動きを射撃アクションに対応するように動作検知AIを開発した。その結果、カラダのジェスチャでFPSがプレイできるようになった。こうした制御機構の開発には、Single Shot MultiBox Detectorと組み合わされたMobileNetが使われた。
なお、同氏が開発したFPSをプレイする様子は、YouTubeの動画として公開されている。
Special Thanks (翻訳協力):吉本幸記