「データサイエンティストになる近道は自主的にデータサイエンスプロジェクトを構築すること」とよく言われますが、このアドバイスに対して「データサイエンスプロジェクトのテーマとなるアイデアをどうしたら思いつけるのか」という疑問が直ちに生じます。こうした疑問に答えるべく、同氏は以下のような6つのデータサイエンスプロジェクトのアイデアの発想方法を紹介しています。
- イベント等に参加して、人々と交流してアイデアの種を得る。
- 趣味や興味をデータサイエンスのテーマにすることを検討する。
- 現在の仕事における課題をデータサイエンスプロジェクトで解決する。
- 機械学習やデータサイエンスの基本的知識に精通しておく。こうした知識があれば、何がデータサイエンスプロジェクトのテーマとなり得るかについて見当がつく。
- (求職活動といった)自分自身の問題をデータサイエンスプロジェクトのテーマにする。
- 日常生活をデータサイエンティストの見地から見直す。
以上のようなアイデア発想法を練習すれば、最初はなかなかアイデアが浮かばないだろうが、いずれアイデアが有り余る人材になる、と同氏は力説しています。
なお、以下の記事本文はChris I.氏に直接コンタクトをとり、翻訳許可を頂いたうえで翻訳したものです。また、翻訳記事の内容は同氏の見解であり、特定の国や地域ならび組織や団体を代表するものではなく、翻訳者およびAINOW編集部の主義主張を表明したものでもありません。
目次
独学、ポートフォリオ、ビジネスに関するアイデアの発想法。アイデアが有り余っている人からのアドバイス
データサイエンスの学習や業界への参入(※訳註1)について書く時、私はいつもプロジェクトを構築することをアドバイスしている。
プロジェクトの構築は学習だけではなく、自分のスキルをアピールするのにも最適だ。
しかし、私の記事の読者から「具体的にどうやってプロジェクトのアイデアを出せばいいのか」という質問をよく受ける。
経験豊富な起業家やエンジニアであれば誰でも、アイデアが有り余っていると言うだろう。しかし、何事も始めたばかりの時には、必ずしも簡単には行かないものである。
というわけで、私が個人的に思いついたプロジェクトのアイデアを発想する方法をいくつか紹介しようと思う。
- データサイエンスプロジェクトに取り組む。
- AIに精通したメンターを探して、導いてもらう。
- 機械学習に関われるインターンになる。この方法は若いデータサイエンティスト志望者が特に向いている。
- 現在の仕事における問題をデータサイエンスプロジェクトで解決する。
- データサイエンスに関するブートキャンプに通学する。
- まずはソフトウェアエンジニアになる。
- AI関連の修士号、あるいは技術関連の博士号を取得する。
オンライン講座に関しては、何らかの専門知識やスキルを深めるには役に立つが、データサイエンティストになる助けにはならない、と同氏は指摘している。
なお、ソフトウェアエンジニアとデータサイエンティストの関係に関しては、AINOW翻訳記事『機械学習エンジニアが職を失いつつある。しかし、とにかく機械学習を学ぼう』において、「優れたソフトウェアエンジニアが優れたデータサイエンティストになるのは簡単だが、その逆は困難」、と同氏は述べている。
・・・
ネットワーキングのイベントに参加し、人々と話す
ほとんどの人は意外と喜んで自分の考えを共有してくれる。あなたのするべきことは、ただアイデアを尋ねることだ。
ネットワーキングイベントにおいて私がするお決まりの質問は、「何に取り組んでいるのか、あるいは何を解決しようとしているのか」である。
先週のバーチャルイベントで、私が話したエンジニアではない人たちは皆、自分たちが作りたいと思っている機械学習のユースケースを共有していた。
とは言うのも、誰かのアイデアを盗むのはやめよう。しかし、もしあなたがすでにデータサイエンスを学ぶために時間を捧げているのであれば、無料で誰かを助けることを検討してみよう。そうした人助けからは履歴書に載せるための経験や、キャリアに役立つ可能性のある人脈を得ることができるだろう。
成功している人は、アイデアを共有することに喜びを感じるものだ。彼らは、世界には解決すべき問題が無限にあり、共有することはゼロサムゲームではないことをわかっているのだ。
・・・
趣味や興味のあることを利用してアイデアを生み出す
多くの素晴らしいアイデアは、異なる分野の専門知識を融合させることで生まれて来た。
例えば、ニューラルネットワーク(の一種であるディープラーニング)の発明者であるジェフリー・ヒントンは、心理学のバックグラウンドを持ち、そこから人工知能に関する多くの初期のアイデアを導き出した。
それでは、機械学習をどうやって自分の興味に応用するのか。
私個人は、犬とバドミントンと料理が大好きだ。機械学習がカバーしている範囲に関する一般的なトピックについても知識がある。それゆえ、それぞれの趣味に何らかの機械学習を適合させてアイデアを出してみよう。
- 私の犬 – 私の犬のさまざまな吠え声、鳴き声、うなり声に関する音声記録を機械学習で分類する。
- バドミントン -バドミントンラケットを振っている人の動画に対して、機械学習を使用して、適切なフォームになっているかを検出する。
- 料理 – 料理の画像を国別に分類する。
以上のアイデアは、あなたがそれらを深く掘り下げれば、非常に興味深いプロジェクトになる得るだろう。
そんなわけで、自分が何に興味を持っているのかを自問自答してみよう。データサイエンスを使えば、もっとうまくできるようになるかも知れないし、興味深い刺激を抽出できるのではないだろうか。
・・・
本業の問題を解決する
あなたの現在の仕事はデータサイエンスではないかも知れない。しかし、だからと言って、解決すべきデータサイエンスの問題がないわけではない。
どこの会社にも、自動化が望まれる手動業務があるものだ。もしあなた自身がそうした業務を持っていなくても、マーケティングやカスタマーサービスの同僚は持っているかも知れない。ならば、あなたは彼らをデータサイエンスプロジェクトで助けられるのではないだろうか。
自動化、意思決定ツリー、またはデータの可視化が、あなたの組織の誰かを助けることができるかどうかを検討してみよう。
仕事へのデータサイエンスプロジェクトの応用が通常業務の範囲外であれば、自分の時間を使って取り組まなければならないかも知れない。しかし、そんな取り組みがあなたに付加価値を加え、経験を与えてくれるのであれば、自主的な取り組みは支払うべき小さな代償である。
私がeコマーズの会社でビジネスインテリジェンスを管理していた頃、ソフトウェアエンジニアリングの世界に入りたいと思っていた。そこで私は週末にコードを書き始め、似たような商品を販売している競合他社のウェブサイトをスクレイプし、高値の商品に関するレポートを自動生成するようにした。そして、そのレポートを購買部門に送ったことで、競合他社より製品の価格を下げることができるようになった。このプロジェクトは、私が次の仕事を得る時に助けとなった。
現在取り組んでいる仕事を深く掘り下げれば、データサイエンスが応用できるプロジェクトをほぼ確実に見つけることができるはずだ。
・・・
データサイエンスツールキットに慣れ親しむ
すべてのモデルがどのように動作するかを知らなくても、機械学習とデータサイエンスがカバーしている一般的なトピックを知っておくのは価値あることだ。
一般的なトピックについて知っていることで、機械学習やデータサイエンスに関するモデルをあなたの周りの世界にフィットさせることができるのだ。
例えば、自然言語処理には「テキスト分類」「情報検索」「質問応答システム」などが含まれていることを、私は知っている。
こうした自然言語処理に関する一般的な知識があるので、データセット(例:Redditのスレッド)を頭に思い浮かべた時、可能なアプリケーションを考えたり、思い浮かべたデータセットに関するプロジェクトについての予備的なアイデアを出したりするのは簡単だ。
ハイレベルなツールキットを入手できれば、総じてアイデアを出すのが簡単になる。
・・・
自分自身についてのデータサイエンスの問題を解決する
データサイエンスの仕事を探すうえで、あなたはどのような問題を抱えているだろうか。機械学習はデータサイエンスの仕事を探すのを助けてくれるだろうか。
もしかしたら、求人板をスクレイピングして、仕事がデータサイエンス関連かどうかを分類して、仕事の要件を分析することができるかも知れない。
そんなデータサイエンスプロジェクトは、素晴らしものになるだろう!
また、求人の分類に加えて企業間の採用の違いを示す競合分析をすることで、自分が働きたい企業を見つけ出すこともできるだろう。
エンジニアを雇う立場のひとりである私としては、このようなプロジェクトの成果を誰かのポートフォリオで見ることを熱望している。
・・・
データサイエンティストのメガネで世界を見る
日々の生活の中で歩きながら、分析、テスト、自動化できるものは何かを自問自答してみよう。
観葉植物の水やり:植物の成長を最適化するために土壌中の水分を分析することができるだろうか。
ショッピング:デパートは機械学習で盗難を検知できるだろうか。
料理:あなたの冷蔵庫の中の写真を使って、補充する必要がある食材を検出することができるだろうか。
以上のようにアイデアを出したら、プロジェクトを構成する最小のコンポーネントを取り出して、実際に構築してみよう。
構築途中でつまずいてしまうアイデアは無限にある。そうしたつまずきそうなアイデアを見分けるための正しいマインドセットこそが必要なのだ。
・・・
結論
駆け出しの時にアイデアを出すのは難しいものだ。私も昔そこにいたから知っている。
しかし、次のことを理解しよう – すべての偉大なアイデアは、実際の経験から生まれる。真空の中にアイデアは存在しない。
だからこそ、ノートパソコンを置いて、外に出て、人と話すことが大切なのだ。
経験豊富な起業家は、すでに多くのプロジェクトに取り組んでおり、異なるドメイン間でアイデアを交換しているため、アイデアが有り余っているのだ。
最終的には、あなたもまた、アイデアが有り余っているポイントに到達するだろう。そこにたどり着いたら、いくつかのアイデアはシェアしよう!
原文
『A Guide To Getting Data Science Project Ideas』
著者
Chris I.
翻訳
吉本幸記(フリーライター、JDLA Deep Learning for GENERAL 2019 #1取得)
編集
おざけん