最終更新日:
独学でデータサイエンティストになり、現在ではデータサイエンティスト志望者の面接も行っているVickery氏の経験にもとづけば、データサイエンティストになるのにデータサイエンスの修士号が必要不可欠ではない理由は以下のような3項目に要約できます。
- 高額なうえに通学中の生活費を工面する必要があるデータサイエンスの修士課程で学べることは、無料あるいは低価格なオンライン講座でも学べる。
- GitHubの使い方やアジャイル開発などの開発現場で求められる実践的な知識と技術は、データサイエンスの修士課程で教えてくれるわけではない。
- 多数の専門分野の複合体であるデータサイエンスを修士課程だけで網羅的に学ぶのは不可能。
以上のように述べたうえで、データサイエンティストになるためにはオンライン講座などを活用して自分のペースで独学するとともに、インターンシップなどで実践的な経験を積むことをVickery氏はすすめています。そして、データサイエンス修士課程に進学できるのであれば、コンピュータサイエンスや統計学のような特定の専門分野をひとつ修めると、データサイエンスの基礎を習得できるとも述べています。
なお、以下の記事本文はRebecca Vickery氏に直接コンタクトをとり、翻訳許可を頂いたうえで翻訳したものです。また、翻訳記事の内容は同氏の見解であり、特定の国や地域ならび組織や団体を代表するものではなく、翻訳者およびAINOW編集部の主義主張を表明したものでもありません。
この記事で述べられているように、修士号の取得はデータサイエンティストになりたいすべての人に向いているわけではありません。さらに言えば、データサイエンス分野に入る道は、1つに限られるわけではありません。そして、他の人がデータサイエンス分野に入る経緯に過度に影響を受けてしまえば、自分らしいデータサイエンスのスキル取得は難しくなってしまいます。
もし、データサイエンスを独学で学んだとしても、博士号を取得する価値を完全に無視してはいけません。また、逆に一流大学で博士号を取得したとしても、独学でスキルを習得してきた人を軽んじてはいけません。
しかし、「大学院に行かなくてもデータサイエンティストにはなれる」のは、世界的に事実となりつつあります。さまざまな人がデータサイエンティストへの道に挑戦できる環境が今、整備されつつあります。
今後も、AINOWではデータサイエンスに関連した発信をさらに強化してまいります。
…そして、その代わりに何をすべきか
ここ数年、「21世紀で最もセクシーな仕事」としてデータサイエンティストの人気が高まっていることもあり、データサイエンスを専門とする修士課程が台頭してきた。これらの講座の費用は3万ドルから10万ドルの範囲で、この費用には勉強に時間を割くあいだの生活費は含まれていない。
私がデータサイエンスを始めたきっかけには、正式な教育は含まれていない。必要なスキルは、オンラインで広く公開されている無料または非常に低価格の教材を使って独学で学んだ。有料の教材に費やした金額は、全部で300ドル以下だったと見積もっている。
最近、データサイエンティスト職の求職者の履歴書に目を通し、面接を行った結果、データサイエンスの修士号は、この分野に入るための最良のルートではないという確固たる結論に達した。修士号は必要なスキルを身につけるには非常に高価な方法であり、本当に必要なことをすべて教えてくれるわけではない。
この記事ではデータサイエンスの修士号を取得することは、この分野に入るための良いルートではないと私が感じている主な理由と、ほとんどの場合、独学で学ぶルートの方が良い選択肢である理由を説明する。また、データサイエンティストとして就職するために、修士課程に進学する代わりに何をすべきかについても簡単に説明する。
・・・
修士課程は高価
前述したように、修士号は非常に高額だ。また、一定の期間勉強する必要があるため、勉強と並行して仕事をしながら生計を立てるという選択肢を必ず選べるわけでもないので、さらに高額になる可能性がある。
学位取得のための資金と生活費を同時に確保できる余裕があれば問題ないが、現実には多くの人にはそのような余裕はない。それゆえ、修士課程の学費を賄うために多額の借金をしなければならないか、あるいは単純に修士課程に進学しないかのどちらかになる。
良いニュースは、修士課程はデータサイエンティストになるために絶対に必要なものではなく、修士課程に行かなくてもデータサイエンティストになるために必要なすべてのことを学べ、最も重要なことは、データサイエンスを学ぶ過程で大金を費やさなくてもデータサイエンティストになれることだ。
・・・
修士課程は必要なことをすべて教えてくれるわけではない
データサイエンティストとして働くには、統計学、数学、プログラミング、機械学習理論の知識が必要なだけではない。実際に現実世界のデータサイエンスチームで優れたパフォーマンスを発揮するには、大半の修士課程では教えられていない多くのスキルが必要なのだ。
修士課程ではGithubの使い方や、Githubが他のデータサイエンティストだけでなく、データエンジニアやソフトウェアエンジニアとチーム内で共同作業を行ううえで非常に重要である理由を教えていない。また、多くのデータサイエンスチームが採用しているアジャイルについても教えていない。データサイエンスのキャリアに極めて重要な、コミュニケーション、創造性、ビジネス感覚などの重要なソフトスキルも教えてくれない(※訳註1)。
私はデータサイエンスの修士号を持つ多くの求職者を面接してきたが、多くの企業で高く評価されているこれらのスキルをほとんど持っていなかった。これらのスキルは、独学でデータサイエンスを学べば、ほぼ確実に身につけられる。
・・・
データサイエンスには様々な分野がある
データサイエンティストとして成功するには、数学、統計学、コンピュータサイエンスなど、複数の分野のスキルが必要だ。私の考えでは、データサイエンスの修士号では、これらの分野すべてのスキルを十分に深く教えることは難しいと見ている。1~2年の修士課程の受講では、データサイエンティストとして就職するのに十分な準備はできないだろう。
データサイエンスはさまざまな分野の集合体であるため、習得には何年も要する。独学で学んだり、(後述する)関連分野の仕事に就いたりすることで、数学や統計学とは異なる分野に関する本当に必要な深い知識を身につけられる。
私は修士号を取得することを一切合切否定しているわけではないし、実際、専門分野でより深い知識を得るためには最適な方法だと思っている。個人的には、データサイエンスの分野では例えばコンピュータサイエンスや統計学など、いずれか1つの分野の修士号を取ることをおすすめする。そうすることで、この分野における貴重な知識を深められるのだ。また、データサイエンスの残りの分野を学ぶための素晴らしい基礎となるだろう。
・・・
代わりに何をすべきか?
前述のように私の個人的な見解では、データサイエンスを学ぶために必要なすべてのことを、オンラインで無料または非常に低価格で学べる。修士課程以外で学ぶことによって、自分の状況に合ったペースで学べるというメリットも加わる。もしあなたがフルタイムの仕事をしていたり、勉学以外で責任を負っていたりする場合は、そうした状況に合わせて学習を進め、スキルを身につけるのに必要な期間を費やせる。
さらに、独学すれば自分に合った方法で勉強できる。私個人は実践的な学習が最も得意なので、初日からプロジェクトベースのアプローチで学習を進めた。このアプローチは、修士課程に進学していたら、きっとできなかっただろう。
独学だけでなく、実際の現場でデータやソフトウェアを使った実践的な経験を積むことを強くおすすめする。このアプローチは、インターンシップ、ボランティア、ハッカソン、オープンソースプロジェクトへの貢献、ビジネスインサイトやアナリティクスなどの密接に関連する仕事に就くことなどによって可能となる(※訳註2)。このようにして、データや技術を扱う現実に触れ、実証的な経験を積むことで、最終的にデータサイエンティスト職を得られるのだ。
・・・
この記事は、私自身がデータサイエンスを学んだ経験と、データサイエンス職の求職者を個人的に面接した経験にもとづいている。これらの経験から、この分野で実際に仕事を得るためには、証明書や資格よりも、プロジェクトのポートフォリオや関連する仕事の経験など、実証可能なスキルの方がはるかに重要であることを学んだ(※訳註3)。
だからこそ私は、データサイエンスを独学で学び、実際に体験することをおすすめする。この方法が特に優れているのは、誰でもこの分野に入門でき、経済的な問題がデータサイエンスへの参入障壁にならないことだ。
もし、オンラインかつ無料でデータサイエンスを学ぶ方法や教材を見つける方法についてもっと知りたいのであれば、私は以前に包括的なガイドを書いたので、以下の記事を参照して欲しい。
読んで頂き、ありがとうございます。
毎月ニュースレターを配信していますので、ご希望の方はこちらのリンクからご登録ください。皆様の学習の一端を担うことを楽しみにしています。
原文
『Why You Shouldn’t Take a Data Science Masters Degree』
著者
Rebecca Vickery
翻訳
吉本幸記(フリーライター、JDLA Deep Learning for GENERAL 2019 #1取得)
編集
おざけん