大卒生のような業界経験のない人が機械学習エンジニアやデータサイエンティストを志望する場合、経歴書に自主的に取り組んだAIプロジェクトを記載すると採用担当者の目にとまりやすくなります。Yadav氏によれば、以下のような種類のAIプロジェクトを記載すれば、より注目されるようになります。
- SNSのセンチメント分析にもとづいたうつ病の検出
- スポーツの試合動画のテキスト要約
- 手書きの方程式の画像認識
- ビジネスミーティングの要約
- 顔の表情識別にもとづいた楽曲選曲
- 居住可能な太陽系外惑星の検出
- 画像/動画の着色と復元
- 音楽生成
以下の記事本文では、上記のAIプロジェクトに関する具体的事例を論じた英文記事のリンクも記載されています。プロジェクト事例に興味がある場合は、リンク先の記事を読むとよいでしょう(AIに関する基礎知識があれば、英文記事をGoogle翻訳またはDeepL翻訳で翻訳すれば、大意を理解できるでしょう)。
なお、以下の記事本文はKajal Yadav氏に直接コンタクトをとり、翻訳許可を頂いたうえで翻訳したものです。また、翻訳記事の内容は同氏の見解であり、特定の国や地域ならび組織や団体を代表するものではなく、翻訳者およびAINOW編集部の主義主張を表明したものでもありません。
目次
ソースコードと参照記事を含む興味深いプロジェクトのアイデアの紹介、またいくつかの研究論文も添付
1.ソーシャルメディアの投稿をもとにしたうつ病のセンチメント分析
このトピックは現代において敏感に考えられるべきものであり、何かをすることが緊急に必要とされている。うつ病に苦しんでいる人は世界で2億6,400万人以上いる。うつ病は世界的な障がいの主な原因であり、疾病によって生じる全世界的な負担は重大であり、毎年80万人近くの個人がコンスタントに自殺によって命を落としている。自殺は、15-29歳の死亡原因の第2位なのだ。うつ病の治療は、しばしば遅れたり、不正確だったり、完全に見過ごされたりしている。
現代のインターネットベースの生活は、とりわけ成長著しい若年層に対して、初期の憂鬱を緩和するサービスを変える大きなチャンスを与えてくれる。大体1秒間に6,000ツイートがコンスタントにTwitterでつぶやかれており、1分毎に350,000ツイート以上送信され、毎日5億ツイート、年間約2,000億ツイートにのぼる計算になる。
ピュー研究所(※訳註1)が示したように、国民の72%が何らかのインターネットを利用した生活をしている。ソーシャルネットワークからリリースされるデータセットは、人間科学や脳の研究など、多くの分野にとって重要なものだ。しかし、専門的な視点からのサポートは十分とは言えず、SNSを分析する明示的な方法論の考案などまったく望めない状況である。
ソーシャルメディアの投稿に含まれる言語的マーカーを分析することで、従来のアプローチよりもはるかに早い段階で、個人のメンタルヘルスについての洞察を得ることができるディープラーニングモデルを作成することができるのだ。
以下にSNSを活用したメンタルヘルスを分析する事例を列挙する。
『あなたとは、あなたのツイートのことである』
『うつ病の早期検出:ソーシャルネットワーク分析とランダムフォレスト技法』
『機械学習技法を用いたソーシャルネットワークデータ分析によるうつ病の検出』
ピュー研究所が2019年6月に発表したレポート『インターネット/ブロードバンドのファクトシート』によると、2019年におけるアメリア成人のインターネット利用率は90%であった。利用率を世代別にまとめると、18~29歳では100%、65歳以上でも73%であった。
また、日本企業の海外進出をサポートする情報を発信するメディア『Digima~出島~』が2019年9月に公開した記事『【2019年版】世界のインターネット普及率&回線速度ランキング』では、世界におけるインターネット利用状況に関する統計情報をまとめたレポート『DIGITAL 2019』を紹介している。そのレポートによると、世界のインターネットユーザは約44億人で世界人口に対する利用率は57%、モバイルユーザは約51億人で利用率は67%である(下の画像も参照)。
画像出典:Digima~出島~「【2019年版】世界のインターネット普及率&回線速度ランキング」より
2.ニューラルネットワークを用いてスポーツの試合動画をテキストに要約
この節で取り上げるプロジェクトのアイデアは、基本的にはスポーツの試合動画から正確な要約を得ることに基づいている。試合のハイライトを伝えるスポーツサイトは多数ある。動画から抽出したテキストを要約する様々なモデルが提案されているが、ニューラルネットワークが最も優れた仕事をする。原則として、要約とは事実に関する重要性を保ちながら、事実や情報を伝える部分に集中しつつ、簡潔な構造でそれらを紹介することを指す。
試合動画のアウトラインを自動的に作成しようとすると、ゲームの魅力的な数分、またはハイライトを見分けるという課題が生じる。
そんなわけで試合動画を要約するテキストを生成するには、3D-CNN(3次元畳み込みネットワーク)、RNN(リカレントニューラルネットワーク)、LSTM(長期短期記憶ネットワーク)のようなディープラーニング技術を使い、また試合動画を様々なセクションに分割して、SVM(サポートベクターマシン)、NN(ニューラルネットワーク)、k-meansアルゴリズムを適用する機械学習アルゴリズムも使う。
動画のテキスト要約をより深く理解するために、添付の記事を参考のこと。
『転移学習を用いたスポーツ動画を要約するためのシーンの分類』
3.CNNを用いた手書き方程式の解答
手書き数式認識は、コンピュータビジョン研究の領域における混迷した課題のひとつである。手書きされた数字と数学記号から構成された手書きの方程式の解答を、画像処理技術のひとつである畳み込みニューラルネットワーク(CNN)に学習させることができる。こうしたシステムを開発するにはデータを使って機械を訓練することが求められ、訓練によってのみシステムは性能を高め、必要な予測能力を得るのだ。
下記の記事を参考にすれば、より理解が深まる。
『畳み込みニューラルネットワークを用いた手書きの方程式の解答』
『Vipul79321/手書きされた方程式の解答』
『コンピュータビジョン ― 手書きの数学の答案シートの自動採点』
『手書きの方程式をLaTeXにする』
4.自然言語処理を利用した商談サマリー生成
完全なレポートではなく、要約を見たいとみんなが思っている状況で立ち往生したことはないだろうか?当然ながら、私も中高生や大学生の時、レポート全体を書く準備のために多くの時間を費やしていた一方で、そのレポートを読む教師は要約を読む時間しかないという状況に直面していた。
データの過大な負荷に関する問題に取り組むために、要約化は避けて通れないほど有用な方法として台頭してきている。会話から情報を抽出することは、商業的にも教育的にも非常に価値がある。要約は統計的、言語的、感情的な側面からとらえた特徴を会話の対話構造と一緒にキャプチャすることによって行うことができる。
手作業でレポートをまとめた形に変更するには、時間がかかりすぎるのではないだろうか。だが、要約を実現するために自然言語処理(NLP)の技術に頼ることができるのだ。
ディープラーニングを利用したテキスト要約は、テキスト全体の文脈を理解することができる。文書の要約をすぐに思いつく必要がある人にとっては夢のような話ではないだろうか!!
下記の記事を参考にすれば、より理解が深まる。
『Pythonによるディープラーニングを用いたテキスト要約の完全ガイド』
『テキスト要約の理解とpythonによるあなた自身のサマライザーの作成』
5.顔認識で気分を識別し、それに応じて楽曲を提案
人間の顔は個人の身体において重要な部分であり、特に人の心の状態を知る上で重要な役割を果たす。こうした顔の特徴を活用すれば、手動で楽曲を分離したり様々なプレイリストにグルーピングしたりする退屈でつまらないタスクをなくして、個人の感情の状態に合わせて適切なプレイリストを生成することが可能となる。
人はその日の気分や興味に合わせて音楽を聴く傾向がある。顔の表情を撮影することで、その人の気分に合わせて楽曲を提案するアプリを作ることができるのだ。
コンピュータビジョンは、デジタル画像や動画の高度な理解をコンピュータに伝えるのに役立つ学際的な分野である。コンピュータビジョンのコンポーネントは、顔の表情からユーザの感情を判断するために使用することができる。
私はコンピュータビジョンのAPIに取り組んでいないが、この分野には興味深くて便利だと感じられるAPIがある。そんなAPIを以下に示す。願わくは、これらのAPIがあなたの役に立ってほしいものだ。
『印象的で気になる20あまりの感情識別API | Nordic APIs |』
6.ケプラーのような宇宙船が撮影した画像から居住可能な外惑星を見つける
最近の10年間で100万個以上の星を監視して、星の前を惑星が通過するのを識別した。そうして見つかった太陽系外惑星の候補を手動で解釈するのは手間がかかり、人為的なミスの可能性もあり、解釈された結果を評価するのも困難である。畳み込みニューラルネットワークは、ノイズの多い時系列データのなかから最小二乗法よりも優れた精度で地球のような太陽系外惑星を識別するのに適している。
『機械学習を使って太陽系外惑星をハントする』
『太陽系外惑星を発見するために人工知能がNASAのデータを使う』
7.古くて破損したリール画像の復元
古くて損傷を受けた写真をかつてのような形に戻すのは、どれだけ時間がかかり、苦痛なことか、私にはわかる。こうしたなか、ディープラーニングを使えば、(亀裂、擦り傷、穴といった)画像の欠陥を見つけ出すことができる。さらにインペインティングアルゴリズム(※訳註2)を使うことで、周囲のピクセル値に基づいて欠陥を簡単に発見し、古い写真を復元して色をつけることができるのだ。
『ディープラーニングを用いた古い画像の着色と復元』
『画像のインペインティングガイド:ディープラーニングを使って画像の傷を編集して修正する』
『完全に無料なデータセットを使って画像の復元を実行する方法』
デジタル画像と動画を対象としたインペインティング技術は、以下のような3つに分類される。
- 構造的アルゴリズム:修復作品のなかに境界線がはっきり残っている時に使われるアルゴリズム
- テクスチャ―的アルゴリズム:テクスチャー(質感)を修復する時に使われるアルゴリズム
- 複合的アプローチ:構造的アルゴリズムとテクスチャー的アルゴリズムを組み合わせた修復技術
8.ディープラーニングを用いた音楽生成
音楽とは、様々な周波数をもった音色の集合体である。それゆえ、自動音楽生成とは、人間の介在を最小限にして短い音楽を作曲するプロセスとなる。最近ではディープラーニング工学が、プログラムされた音楽生成のための最先端となっている。
『ディープラーニングを使った音楽生成』
『KerasにおけるLSTMニューラルネットワークを使った音楽生成の方法』
私は、読者諸氏がこの記事を読んで有益かつ有用と感じてくれることを願っています。以上に解説したプロジェクトに関するあなたの考えをコメント欄でシェアしてください。また、もしあなたが他の何かしらに関してクールなアイデアを持っているならば、ぜひ知らせてください✌️
・・・
読者諸氏は以下の方法で私に連絡することができます。
私のYouTubeチャンネルを登録する。近日中に動画が配信されます。
Mediumで私をフォローする。
LinkedInで私とつながって連絡する。
原文
『8 ML/AI Projects To Make Your Portfolio Stand Out』
著者
Kajal Yadav
翻訳
吉本幸記(フリーライター、JDLA Deep Learning for GENERAL 2019 #1取得)
編集
おざけん