あなたのポートフォリオを目立たせる8つの機械学習/AIプロジェクト

著者のKajal Yadav氏は、インドのラージャスターン中央大学の修士課程でビッグデータ分析や機械学習を学びながら、ライターやYouTuberとしての活動を通してAIに関する情報を発信しています（同氏の詳しい経歴はこちら）。同氏がMediumに投稿した記事『あなたのポートフォリオを目立たせる8つの機械学習/AIプロジェクト』では、経歴書に記載すれば評価されるような8種類のAIプロジェクトが紹介されています。
大卒生のような業界経験のない人が機械学習エンジニアやデータサイエンティストを志望する場合、経歴書に自主的に取り組んだAIプロジェクトを記載すると採用担当者の目にとまりやすくなります。Yadav氏によれば、以下のような種類のAIプロジェクトを記載すれば、より注目されるようになります。

SNSのセンチメント分析にもとづいたうつ病の検出
スポーツの試合動画のテキスト要約
手書きの方程式の画像認識
ビジネスミーティングの要約
顔の表情識別にもとづいた楽曲選曲
居住可能な太陽系外惑星の検出
画像/動画の着色と復元
音楽生成

以下の記事本文では、上記のAIプロジェクトに関する具体的事例を論じた英文記事のリンクも記載されています。プロジェクト事例に興味がある場合は、リンク先の記事を読むとよいでしょう（AIに関する基礎知識があれば、英文記事をGoogle翻訳またはDeepL翻訳で翻訳すれば、大意を理解できるでしょう）。

なお、以下の記事本文はKajal Yadav氏に直接コンタクトをとり、翻訳許可を頂いたうえで翻訳したものです。また、翻訳記事の内容は同氏の見解であり、特定の国や地域ならび組織や団体を代表するものではなく、翻訳者およびAINOW編集部の主義主張を表明したものでもありません。

ソースコードと参照記事を含む興味深いプロジェクトのアイデアの紹介、またいくつかの研究論文も添付
1．ソーシャルメディアの投稿をもとにしたうつ病のセンチメント分析
2．ニューラルネットワークを用いてスポーツの試合動画をテキストに要約
3．CNNを用いた手書き方程式の解答
4．自然言語処理を利用した商談サマリー生成
5．顔認識で気分を識別し、それに応じて楽曲を提案
6．ケプラーのような宇宙船が撮影した画像から居住可能な外惑星を見つける
7．古くて破損したリール画像の復元
8．ディープラーニングを用いた音楽生成

ソースコードと参照記事を含む興味深いプロジェクトのアイデアの紹介、またいくつかの研究論文も添付

画像出典：Unsplash、著者による編集

1．ソーシャルメディアの投稿をもとにしたうつ病のセンチメント分析

画像出典：Unsplashのdole777

このトピックは現代において敏感に考えられるべきものであり、何かをすることが緊急に必要とされている。うつ病に苦しんでいる人は世界で2億6,400万人以上いる。うつ病は世界的な障がいの主な原因であり、疾病によって生じる全世界的な負担は重大であり、毎年80万人近くの個人がコンスタントに自殺によって命を落としている。自殺は、15-29歳の死亡原因の第2位なのだ。うつ病の治療は、しばしば遅れたり、不正確だったり、完全に見過ごされたりしている。

現代のインターネットベースの生活は、とりわけ成長著しい若年層に対して、初期の憂鬱を緩和するサービスを変える大きなチャンスを与えてくれる。大体1秒間に6,000ツイートがコンスタントにTwitterでつぶやかれており、1分毎に350,000ツイート以上送信され、毎日5億ツイート、年間約2,000億ツイートにのぼる計算になる。

ピュー研究所（※訳註1）が示したように、国民の72％が何らかのインターネットを利用した生活をしている。ソーシャルネットワークからリリースされるデータセットは、人間科学や脳の研究など、多くの分野にとって重要なものだ。しかし、専門的な視点からのサポートは十分とは言えず、SNSを分析する明示的な方法論の考案などまったく望めない状況である。

ソーシャルメディアの投稿に含まれる言語的マーカーを分析することで、従来のアプローチよりもはるかに早い段階で、個人のメンタルヘルスについての洞察を得ることができるディープラーニングモデルを作成することができるのだ。

以下にSNSを活用したメンタルヘルスを分析する事例を列挙する。

『あなたとは、あなたのツイートのことである』

Medium

You Are What You Tweet

https://towardsdatascience.com/you-are-what-you-tweet-7e23fb84f4ed

Detecting Depression in Social Media via Twitter Usage

『うつ病の早期検出：ソーシャルネットワーク分析とランダムフォレスト技法』

Journal of Medical Internet Research

Early Detection of Depression: Social Network Analysis and Random Forest Tech...

https://www.jmir.org/2019/6/e12554/

Background: Major depressive disorder (MDD) or depression is among the most prevalent psychiatric disorders, affecting more than 300 million people globally. Early detection is critical for...

『機械学習技法を用いたソーシャルネットワークデータ分析によるうつ病の検出』

PubMed Central (PMC)

Depression detection from social network data using machine learning techniques

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6111060/

Social networks have been developed as a great point for its users to communicate with their interested friends and share their opinions, photos, and videos reflecting their moods, feelings and sentiments. This creates an opportunity to analyze so...

（※訳註1）ピュー研究所とはアメリカのシンクタンクで、アメリカおよび世界における問題意識、意見等を調査報告している。
ピュー研究所が2019年6月に発表したレポート『インターネット/ブロードバンドのファクトシート』によると、2019年におけるアメリア成人のインターネット利用率は90%であった。利用率を世代別にまとめると、18～29歳では100%、65歳以上でも73%であった。

また、日本企業の海外進出をサポートする情報を発信するメディア『Digima～出島～』が2019年9月に公開した記事『【2019年版】世界のインターネット普及率＆回線速度ランキング』では、世界におけるインターネット利用状況に関する統計情報をまとめたレポート『DIGITAL 2019』を紹介している。そのレポートによると、世界のインターネットユーザは約44億人で世界人口に対する利用率は57%、モバイルユーザは約51億人で利用率は67%である（下の画像も参照）。

画像出典：Digima～出島～「【2019年版】世界のインターネット普及率＆回線速度ランキング」より

2．ニューラルネットワークを用いてスポーツの試合動画をテキストに要約

画像出典：UnsplashのAksh yadav

この節で取り上げるプロジェクトのアイデアは、基本的にはスポーツの試合動画から正確な要約を得ることに基づいている。試合のハイライトを伝えるスポーツサイトは多数ある。動画から抽出したテキストを要約する様々なモデルが提案されているが、ニューラルネットワークが最も優れた仕事をする。原則として、要約とは事実に関する重要性を保ちながら、事実や情報を伝える部分に集中しつつ、簡潔な構造でそれらを紹介することを指す。

試合動画のアウトラインを自動的に作成しようとすると、ゲームの魅力的な数分、またはハイライトを見分けるという課題が生じる。

そんなわけで試合動画を要約するテキストを生成するには、3D-CNN（3次元畳み込みネットワーク）、RNN（リカレントニューラルネットワーク）、LSTM（長期短期記憶ネットワーク）のようなディープラーニング技術を使い、また試合動画を様々なセクションに分割して、SVM（サポートベクターマシン）、NN（ニューラルネットワーク）、k-meansアルゴリズムを適用する機械学習アルゴリズムも使う。

動画のテキスト要約をより深く理解するために、添付の記事を参考のこと。

『転移学習を用いたスポーツ動画を要約するためのシーンの分類』

MDPI

Scene Classification for Sports Video Summarization Using Transfer Learning

https://www.mdpi.com/1424-8220/20/6/1702/htm

This paper proposes a novel method for sports video scene classification with the particular intention of video summarization. Creating and publishing a shorter version of the video is more interesting than a full version due to instant entertainm...

3．CNNを用いた手書き方程式の解答

画像出典：UnsplashのAntoine Dautry

手書き数式認識は、コンピュータビジョン研究の領域における混迷した課題のひとつである。手書きされた数字と数学記号から構成された手書きの方程式の解答を、画像処理技術のひとつである畳み込みニューラルネットワーク（CNN）に学習させることができる。こうしたシステムを開発するにはデータを使って機械を訓練することが求められ、訓練によってのみシステムは性能を高め、必要な予測能力を得るのだ。

下記の記事を参考にすれば、より理解が深まる。

『畳み込みニューラルネットワークを用いた手書きの方程式の解答』

Medium

Handwritten Equation Solver using Convolutional Neural Network

https://medium.com/@vipul.gupta73921/handwritten-equation-solver-using-convolutional-neural-network-a44acc0bd9f8

Introduction

『Vipul79321/手書きされた方程式の解答』

GitHub

vipul79321/Handwritten-Equation-Solver

https://github.com/vipul79321/Handwritten-Equation-Solver

An Handwritten equation solver using CNN. Contribute to vipul79321/Handwritten-Equation-Solver development by creating an account on GitHub.

『コンピュータビジョン ― 手書きの数学の答案シートの自動採点』

Medium

Computer Vision — Auto grading Handwritten Mathematical Answersheets

https://towardsdatascience.com/computer-vision-auto-grading-handwritten-mathematical-answersheets-8974744f72dd

Digitizing the steps of solving a mathematical equation written by freehand on a paper, validating the steps and final answer.

『手書きの方程式をLaTeXにする』

opensourc.es

Handwritten equations to LaTeX

https://opensourc.es/blog/he2latex/

Using CNN and Seq2Seq Learning to generate LaTeX code from handwritten equations

4．自然言語処理を利用した商談サマリー生成

画像出典：UnsplashのSebastian Herrmann

完全なレポートではなく、要約を見たいとみんなが思っている状況で立ち往生したことはないだろうか？当然ながら、私も中高生や大学生の時、レポート全体を書く準備のために多くの時間を費やしていた一方で、そのレポートを読む教師は要約を読む時間しかないという状況に直面していた。

データの過大な負荷に関する問題に取り組むために、要約化は避けて通れないほど有用な方法として台頭してきている。会話から情報を抽出することは、商業的にも教育的にも非常に価値がある。要約は統計的、言語的、感情的な側面からとらえた特徴を会話の対話構造と一緒にキャプチャすることによって行うことができる。

手作業でレポートをまとめた形に変更するには、時間がかかりすぎるのではないだろうか。だが、要約を実現するために自然言語処理（NLP）の技術に頼ることができるのだ。

ディープラーニングを利用したテキスト要約は、テキスト全体の文脈を理解することができる。文書の要約をすぐに思いつく必要がある人にとっては夢のような話ではないだろうか！！

下記の記事を参考にすれば、より理解が深まる。

『Pythonによるディープラーニングを用いたテキスト要約の完全ガイド』

Analytics Vidhya

Comprehensive Guide to Text Summarization using Deep Learning in Python

https://www.analyticsvidhya.com/blog/2019/06/comprehensive-guide-text-summarization-using-deep-learning-python/

Introduction

『テキスト要約の理解とpythonによるあなた自身のサマライザーの作成』

Medium

Understand Text Summarization and create your own summarizer in python

https://towardsdatascience.com/understand-text-summarization-and-create-your-own-summarizer-in-python-b26a9f09fc70

Summarization can be defined as a task of producing a concise and fluent summary while preserving key information and overall meaning.

5．顔認識で気分を識別し、それに応じて楽曲を提案

画像出典：UnsplashのAlireza Attari

人間の顔は個人の身体において重要な部分であり、特に人の心の状態を知る上で重要な役割を果たす。こうした顔の特徴を活用すれば、手動で楽曲を分離したり様々なプレイリストにグルーピングしたりする退屈でつまらないタスクをなくして、個人の感情の状態に合わせて適切なプレイリストを生成することが可能となる。

人はその日の気分や興味に合わせて音楽を聴く傾向がある。顔の表情を撮影することで、その人の気分に合わせて楽曲を提案するアプリを作ることができるのだ。

コンピュータビジョンは、デジタル画像や動画の高度な理解をコンピュータに伝えるのに役立つ学際的な分野である。コンピュータビジョンのコンポーネントは、顔の表情からユーザの感情を判断するために使用することができる。

私はコンピュータビジョンのAPIに取り組んでいないが、この分野には興味深くて便利だと感じられるAPIがある。そんなAPIを以下に示す。願わくは、これらのAPIがあなたの役に立ってほしいものだ。

『印象的で気になる20あまりの感情識別API | Nordic APIs |』

Nordic APIs

20+ Emotion Recognition APIs That Will Leave You Impressed, and Concerned | N...

https://nordicapis.com/20-emotion-recognition-apis-that-will-leave-you-impressed-and-concerned/

We explore facial detection APIs and sentiment analysis APIs that can be integrated into apps to detect emotion from users.

6．ケプラーのような宇宙船が撮影した画像から居住可能な外惑星を見つける

画像出典：UnsplashのNick Owuor (astro.nic.visuals)

最近の10年間で100万個以上の星を監視して、星の前を惑星が通過するのを識別した。そうして見つかった太陽系外惑星の候補を手動で解釈するのは手間がかかり、人為的なミスの可能性もあり、解釈された結果を評価するのも困難である。畳み込みニューラルネットワークは、ノイズの多い時系列データのなかから最小二乗法よりも優れた精度で地球のような太陽系外惑星を識別するのに適している。

『機械学習を使って太陽系外惑星をハントする』

Medium

Exoplanet hunting using Machine Learning

https://towardsdatascience.com/exoplanet-hunting-using-machine-learning-d615958e1787

Hunting worlds beyond our solar system.

『太陽系外惑星を発見するために人工知能がNASAのデータを使う』

NASA

Artificial Intelligence, NASA Data Used to Discover Exoplanet

https://www.nasa.gov/press-release/artificial-intelligence-nasa-data-used-to-discover-eighth-planet-circling-distant-star

Our solar system now is tied for most number of planets around a single star, with the recent discovery of an eighth planet circling Kepler-90, a Sun-like star 2,545 light years from Earth. The planet was discovered in data from NASA’s Kepler Spac...

7．古くて破損したリール画像の復元

画像出典：Pikist

古くて損傷を受けた写真をかつてのような形に戻すのは、どれだけ時間がかかり、苦痛なことか、私にはわかる。こうしたなか、ディープラーニングを使えば、（亀裂、擦り傷、穴といった）画像の欠陥を見つけ出すことができる。さらにインペインティングアルゴリズム（※訳註2）を使うことで、周囲のピクセル値に基づいて欠陥を簡単に発見し、古い写真を復元して色をつけることができるのだ。

『ディープラーニングを用いた古い画像の着色と復元』

FloydHub Blog

Colorizing and Restoring Old Images with Deep Learning

https://blog.floydhub.com/colorizing-and-restoring-old-images-with-deep-learning/

Jason Antic's DeOldify deep learning project not only colorizes images but also restores them with stunning results. Learn more in this FloydHub #humansofml interview.

『画像のインペインティングガイド：ディープラーニングを使って画像の傷を編集して修正する』

Medium

Guide to Image Inpainting: Using machine learning to edit and correct defects...

https://heartbeat.fritz.ai/guide-to-image-inpainting-using-machine-learning-to-edit-and-correct-defects-in-photos-3c1b0e13bbd0

The Fault in our Snaps

『完全に無料なデータセットを使って画像の復元を実行する方法』

Medium

How To Perform Image Restoration Absolutely DataSet Free

https://towardsdatascience.com/how-to-perform-image-restoration-absolutely-dataset-free-d08da1a1e96d

Deep learning requires a large amount of data. This phrase has become popular among people who consider applying deep learning methods to…

（※訳註2）インペインティング（Inpainting）とは、日本語に訳すと「修復する」という意味になるのが示す通り、絵画や写真の破損を修復する技術全般を指す。インペインティングは絵画の修復のような物理的なアート作品を対象とした技術であったが、デジタルコンテンツの誕生以降は、デジタル作品を修正する技術も含まれるようになった。
デジタル画像と動画を対象としたインペインティング技術は、以下のような3つに分類される。