HOME/ AINOW編集部 /僭越ながら、オンライン講座はあなたをデータサイエンティストにしないだろう
2020.07.31

僭越ながら、オンライン講座はあなたをデータサイエンティストにしないだろう

最終更新日:

著者のRamshankar Yadhunath氏は、インドの名門私立大学アムリタ大学でコンピュータサイエンスを学び、現在は動物愛護団体People for Animalsでデータサイエンスに関するインターンをしています(同氏の詳細についてはこちらを参照)。同氏がMediumに投稿した記事『僭越ながら、オンライン講座はあなたをデータサイエンティストにしないだろう』では、オンライン講座の限界を指摘したうえで、プロジェクトを立ち上げることが自身の経験にもとづいて勧められています。
「クールなデータサイエンティストになる」という大志を抱く同氏は、少しでもキャリアに箔をつけるために数多くのAI技術に関するオンライン講座を受講していました。そんななか、インターンを募集するフェスに参加した時、「オンライン講座を受けていても、プロジェクトに取り組んでいなければ相手にできない」とある企業担当者に言われて、ひどく落胆しました。その後、一念発起して、自力でプロジェクトを立ち上げることにしました。
プロジェクトを立ち上げて、同氏は失敗からの学びを通して実践力を養いました。しかし、プロジェクトに取り組んだことで得たいちばんの学びは、自分で目標を立てて達成度を測る「自己評価」の難しさと大切さでした。こうした自己評価は、カリキュラムに沿って学習していた同氏には初めての経験だったのです。
さらに同氏は、プロジェクトに取り組むうえでの以下のような注意事項も学びました。
  • プロジェクトの内容上の優劣は気にしないで、何が学べるかに集中すること。
  • プロジェクトに関して他人と議論して、フィードバックを得ること。
  • プロジェクトの進捗に関して、自己管理を怠らないこと。
  • 少しの成果で自分を褒めること。そうすれば、モチベーションを保てる。

同氏が気づいた「自己評価することの難しさと大切さ」は、学生だけではなく社会人にとっても重要なことです。こうした自己評価力は、データサイエンティストにとって真に必要な「自ら問題を発見して適切なソリューションを提案する」能力の基礎となるものでしょう。

なお、以下の記事本文はRamshankar Yadhunath氏に直接コンタクトをとり、翻訳許可を頂いたうえで翻訳したものです。

すでに知っていることを応用せずに、より多くの講座を申し込むのは本当に止めるべき理由

画像出典:UnsplashLewis Keegan @ SkillScouterより

週末のことだった。私はデータサイエンスの別のオンライン講座を終えたところだった。私は達成感を感じていた。5つの異なるコースを「正常に完了」し、それぞれの「証明書」を受け取った後、誰もが今、自分は本物のデータサイエンティストであることを確信する傾向にあるものだ。私もそうだった。

たしかにオンライン講座は面白いものであり得る。それらのほとんどはきらびやかな説明と、講座がカバーしているであろうトピックの巨大なリストを持っていて、受講者が1つ以上のスキルで熟達することを約束している。受講者は運がよければ、ほかの受講者の講座についての数多くの証言に接することができる。そんな証言はたいてい、講座を受けたおかげで未来永劫続いたかも知れない貧困を抜け出し、データサイエンス業界で絶対的チャンピオンとなったことを伝えている。しかし、本当に私たちのほとんどが探し求めているのは、講座を受講して後に受け取る最終的な証明書なのだ。名前が記載されたオンラインのカラフルな書類は、受講者の多くに大きな違いをもたらす。しかし、ある日、受講者が面接室で潜在的な雇用主と向かい合って座ると、雇用主のほとんどは受講者が期待したよりも証明書に感銘を受けていない様子を目のあたりにする。証明書を取得するのに費やした時間を認めようとしない雇用主もいるほどだ。彼らは「この証明書は、あなたがプロジェクトに取り組んでいなければ役立たずだ」と遠慮なく指摘する。そう言われると、ただ辛いだけだ。この指摘は受けた面接での成功を切望していて、採用されるかどうかは受講したオンライン講座の内容に依るところが大きい場合にはなお一層こたえる。講座にはお金と時間、そして努力を投資したと言うのに。採用コンテストの前に主要な武器が使いものにならなくなってしまっては、誰もが自信を失くしてしまうだろう。

私の言うことを信じてほしい。学部2年生の私は、大学のインターンシップ・フェスで、1日で7つの部屋に2部のミニマムな履歴書なコピーと5種類の証明書、そして巨大な希望の束を持って様々な会社を訪問したことがあるのだ。最初の6社では「こんな講座の証明書を持っています」と同じ謳い文句を話したものだ。6社目では次のようなことを口頭で言われてノックアウトパンチを浴びたのだった。「聞いてください。あなたがこれらの講座を修了したのは素晴らしいことです。しかし、あなたは何も取り組んでいません。Githubアカウントを持っていません。私たちはあなたの能力がわかりません。だから、これ以上は申し訳ありません。

これは痛い!心の奥底のどこかが痛かった。はっきりと会話ができなくなり、呼吸器の流れに詰まりを感じた。この感覚は、感情に打ちひしがれた時の私の特徴である。しかし、その苦痛は明らかに私に苦言を呈した会社担当者のせいではなかった。その苦言は、私がいつも避けていた現実を直視させたのだ。

その瞬間は誰もが人生で一度は出くわすものだ。誰かが鏡を拾い上げて、顔の前に置いてくれる瞬間を。あの苦言が私の人生の中でその時だった。

自らを直視できる時に目を閉じるか、あるいは開いたままにするかはその人の選対次第である。私は目を開けておくことにしたのだが、それがすべての違いを生み出したのかも知れない。自分を直視したことによって、私はこの記事が書けたのだ。

なぜプロジェクトに取り組むのか?

データサイエンティストを目指す私たちの皆がコースを修了することに熱心である理由は、オンライン講座は学位をポジティブに下支えするものであり、雇用者から好意的に見られるものであると考える傾向があるからだ。いくつかの組織では就労のためには大学の学位が必須であると考慮されているうえに、オンライン講座は学位と同じように評価され、受講すれば「超過な学習」と見なされるだろうという思うのが大勢を占めている。こうした状況は多少疑わしくもあるが、そんなものだろうと考えられている。

そうは言っても、インターネットでの露出の多さを考えると、オンライン講座は誰でも受講することができる。そのため、コースを修了したとしても、同じことをした他人と比べて特に優位性があるわけではない。そして、企業が候補者を比較するのは、そうした比較が自分たちのニーズに合うと思う候補者を簡単に選ぶ唯一の方法だからだ。競争は私たちの為すことすべてについての本質である。それゆえ、他人と差をつけるには、プロジェクトに取り組む以外にはない。

プロジェクトに取り組むもう一つの理由は、学習だ。オンライン講座は間違いなく私たちに多くのことを教えてくれるのが、教師が教室で学生に自分の専門知識のすべてを与えることを妨げる力によって制限されている。その力とはシラバスだ。オンライン講座は計画されていなければならず、計画されなければならないものは、議論すべきトピックの可能なすべての側面に対処することができないというトレードオフを持つことになる。

一方、プロジェクトに取り組めば、そのプロジェクトを進める一歩一歩が新しい概念の学びとなる。犯してしまう間違いは、オンライン講座を受講している時に犯す間違いよりはるかに多いだろう。しかし、これらの失敗から学ぼうとするならば、そんな失敗から吸収した知識は、むしろ豊富で有益なものになるだろう。

プロジェクト型学習への移行

苦言を呈された面接で意気消沈した後、私は覚悟を決めた人間となって帰宅した。証明書だけに頼るのではなく、プロジェクトに取り組み始めようと決意したのだ。しかし、自然の成り行きで身につけたことを新しい実践に移すことが、一番大変なことかも知れない。

私はデータサイエンスを応用してプロジェクトに取り組む方法についての記事をいくつか読んだ。そして、その後の数日間、仲間と軽く会話をしました。いくつかの会話は、率直に言って非常に落胆させられました。落胆したのは、彼らが会話下手だったからではない。むしろ私よりも頭が良さそうな人がいたからだ。彼らはとても印象的なことをしているように見えた。なかにはドローンを作っている人もいたのだが、私はテレビでしかドローンを見たことがなかった。不思議なことに、彼らがドローンを作っていると聞いた瞬間、一緒に仕事をしたいと思った。しかし、頼みたくなかった。そんなクールなプロジェクトに携われるほどの力量が、私にあるとは感じられなかったのだ。私はため息をついた。プロジェクトに取り組んではみたものも、誰にでも失敗はあるものですね…。

しかし、プロジェクトに取り組んで最も戸惑ったのは、毎週の課題によって自分の進歩が決定されるコースにしか慣れていなかったことだった。成績評価システムは形式化されており、誰かが私を評定していた。しかし、プロジェクトの場合は違う。私は自己評価をしなければならない。そして、そんな自己評価こそが私が出来なかったことだった。自分が何かを十分にできたかどうかを判断することが出来なかったのだ。私は、自分の評価者になることができなかった。

時々、私たちはあまりにも簡単に他人の手に私たちの人生の支配権を引き渡すことを余儀なくされる。そして、自らの支配権を渡さざるを得ない原因は、しばしば自分の強みや弱みを理解できない自分自身の無力さであるのだ。

私は、自分が自己に対する最高の評価者になるための準備が必要だと気づいた。こうした準備こそが、私が実行したことだ。私は座ってプロジェクトのアイデアを起草し、達成すべき目標を設定した。正直なところ、私は自分で決めたすべての締め切りをオーバーしてしまったのだが、少なくとも自分でやると決めたことの80%は完成させたことを確認した。

私の部屋に掛けられたホワイトボードは、日々の計画、ズル休み、学んだ概念、再定義しようとした概念、そしていつも気持ちよく描いていたブロック図の目撃者であった。私の最初のプロジェクトは、チョコレートバーの評価を分析することだった。純粋なEDA(Exploratory Data Analysis:探索的データ分析)プロジェクト(※訳註1)で、自分で決めたプロジェクトに取り組むという初めての経験をさせてくれた。世界中のチョコレートの格付けについてもっと知りたいと思っていたので、このプロジェクトに取り組んだのだった。

何らかの形で自分と繋がっていると感じられると、プロジェクトに取り組むことは難しくなくなる。だからこそ、「チョコレートの格付けを知りたい」というパーソナルな感覚を持ち続け、使う道具よりも動機付けに心躍らすことのほうが、プロジェクトを最後までやり遂げるためには大切なのだと考えていた。

動機付けで興奮しているという発言が少しわかりにくいようであれば、こちらの記事で、私が動機付けによって明らかに興奮したことを解説しています(※訳註2)!

(※訳註1)探索的データ分析とは、データの特徴を理解するための分析を意味する。しばしば統計学的手法が使われ、分析結果は図表などで視覚化されるのが一般的である。
Yadhunath氏が実行したプロジェクトでは、Kaggleで出題されたチョコレートバーの評価分析が取り組まれた。具体的には、アメリカで販売されている1,795のチョコレートバーの評価を生産国別に分類したうえで算出した平均値を視覚化した(下のインフォグラフィック参照)。

画像出典:GitHub:ry05/Chocolate-Bar-Analysis

なお、チョコレートバー評価の元データは、Manhattan Chocolate Societyの創設メンバーであるBrady Brelinski氏が作成したもとが使われている。そのデータには、チョコレートバーの味の評価のほかに、生産企業名、生産企業の国籍、カカオ豆の原産国等のデータが収集されている。このデータとYadhunath氏が作成したインフォグラフィックを見れば、例えば「チョコレートバーの評価に最も影響を与える特徴量は何か」「チョコレートバーの評価を予測するAIモデルを作る」等のアイデアが思いつくだろう。

(※訳註2)上に引用されたYadhunath氏がMediumに投稿した記事『社会的善のためにデータを活用する ― その実践的事例』では、同氏が経験したフィールドワークとデータサイエンスプロジェクトを兼ねたカリキュラム「Live in Labsプログラム」が報告されている。同氏が所属しているアムリタ大学は、実際に特定の場所を調査して問題を掘り起こし、その問題に対してデータサイエンスを使ってソリューションを提案するという授業を行っている。同氏はインドの農村を調査して、問題を発見してソリューションを提案する体験をした。
同氏が調査した村New Thariyalの住人の多くは、水不足に直面していた。そこで同氏は、水資源に関する村民全員(300人強)を対象とした調査を実施して、水不足の実態を把握した。その結果、村民の2/3が国連の定める1日当たりに必要な水資源量に満たないことが確認できた(下のグラフ参照)。

画像出典:Medium” Leveraging Data for Social Good — A Practical Example

同氏はさらに調査を進めて、水資源が不足している世帯とそうでない世帯の違いは、水をくみ上げるモーターの有無によることが大きいことを突きとめた。しかし、この調査で判明したもっとも驚くべき事実は、調査した農村がある地域では、水をくみ上げるモーターの使用が違法とされていることだった。つまり、法を犯さないと水資源を確保できない状況が明るみになったのだ。
以上のカリキュラムを経験して、同氏はデータサイエンスの知識を活用できたこと以上に、データサイエンスの知識を使って社会に貢献できたことを喜んだ。「データサイエンスによる社会貢献」こそが、プロジェクトを遂行する原動力であると同時に成果だったのだ。

しかし、なぜプロジェクト型学習は簡単ではないのか?

大学の講義の合間に気分を切り替えて紙を手に取り、思いついたアイデアを猛烈に書き込んだことがよくあった。これらのアイデアの多くは、実際に実行に移されることはなかった。なぜならば、そんなアイデアは取り組むに値するほど印象的ではなかったからだ。そんなものでは、クールなデータサイエンティストになるのに役立たないだろうと感じたのだ。クールなデータサイエンティストになりたいと思いはあまりにも野心的過ぎたので、そんな思いに対して自分が程遠い場所にいることに悲嘆に暮れていたものだった(今も程遠い)。しかし、クールなプロジェクトに取り組みたいというヒステリーのせいで、私は不合理な極みに鎖でつながれたままだった。無意識のうちにわたしのドローン・プロジェクトを探していた。

チョコレート分析のプロジェクトも、最初はクールでないという理由で棚上げになっていた。今では考え直してチョコレート分析を実行した自分に感謝している。ほとんどの人がプロジェクトを棚上げにしてしまうのは、他の人が取り組んだものと比べて、それが良くないと感じるからだ。率直に言って、そんな考え方は自傷行為である。全く同じバックグラウンドを共有している人間など二人といない、ということを私たちは見逃しがちである。あらゆる時間点において人間どうしを比較できる共通の指標などないのだから、誰かと同じだとか、誰かより優れているのかと考えるのは無駄だ。私たちにできることは、とにかくやってみることだ。本当のところ、答えは何かを為していない人たちの手中にはない。複雑なプロジェクトに取り組んでいる人たちは、おそらくそのプロジェクトに関わっていない私たちよりもはるかに多くのことを知っているのだ。

浮力の性質を知らずに船を作ることはできない。そんなことをしようとするのは、ただの愚行だ。

では、私たちは愚者になりたいのだろうか?そうではないだろう。

最後のポイント

学術的なプロジェクトに取り組むための完璧な方法など存在しない。完璧な方法がないのは、概してすべての学生がプロジェクトに取り組むための異なるアプローチを持っているからだ。ある人は成績のために、ある人は学習のために、ある人はその両方のためにプロジェクトに取り組んでいる。居心地の良い場所で働くための手段としてプロジェクトに取り組む人もいれば、より新しい概念を学ぶための方法として捉える人もいる。学術的なプロジェクトに取り組む際の組み合わせやアプローチは様々だ。しかし、私がコンピュータサイエンスの学士号を取得している間に気づいたいくつかの重要なポイントを以下で示す。

  • プロジェクトに取り組むとは、アイデアを比較して優劣をつけることを意味していない。すべてのプロジェクトには学習点があるので、そのプロジェクトにないものを見るのではなく、そのプロジェクトにあるものを見れば、プロジェクトの神髄を常に手中に収められるのだ。
  • アイデアやトピックについてオープンに議論することは、私たちの成長にとって常に健全なことだ。そして、良いフィードバックを受け入れることも同様に重要である。
  • 現実世界では私たちを監視してくれる人などいないので、プロジェクトの進捗状況を自己監視する必要がある。
  • 最後に、少しの進歩でも自分にご褒美を与えると、モチベーションが下がらない。

この記事の終えるにあたって言いたいのは、私はオンライン講座を軽視しているわけではない、ということだ。いくつかの証明書は、雇用者にとって本当に重要だ。また、講座は特定のスキルを学ぶための素晴らしい場所である。講座のなかには、高い評価を得ている実務家が受講したものもあり、そんな講座は私たちに十分なスキルを習得させてくれる。実際、素晴らしいDatacampの講座によって、私はデータサイエンスの第一歩を学んだ。しかし、設備だけでは良いデータサイエンティストには決してなれない。

Sanyam Bhutaniのこの素晴らしい記事は、あらゆるオンライン講座を正しく受講する方法、あるいは彼が望んでいるように、絶対にしてはいけない間違った受講方法に関する素晴らしい洞察を提供している(※訳註3)。

私の記事を読み終えたのならば、もう何かを待っていることはないのでは?プロジェクトを選んで、それに取り組み始め、自分自身のために学んだことを応用すると生まれる魔法に気づきましょう。

(※訳註3)以上に引用したMedium記事『fast.ai(あるいはあらゆる機械学習オンライン講座で)で何をしてはいけないのか』では、機械学習を習得するために闇雲に多数のオンライン講座を受講することが非推奨とされている。そして、初級クラスのオンライン講座を修了したら、トイ・プロジェクトに取り組んでコーディング経験を増やすことが推奨されている。こうした理論重視のオンライン講座の受講は必要最小限にとどめて、実践力を磨く学習法は、以下のような過去のAINOW翻訳記事でも紹介してきた。

機械学習の独学について考えてみる?覚えておくべき6つのこと

機械学習自体を学ぶな



原文
『Sorry, Online Courses Won’t Make you a Data Scientist』

著者
Ramshankar Yadhunath

翻訳
吉本幸記(フリーライター、JDLA Deep Learning for GENERAL 2019 #1取得)

編集
おざけん

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

株式会社ABEJAはwithコロナの時代に即してオフィスを移転−社員のライフスタイルに合わせた勤務が可能に

伝説的ピアニストグレン・グールドの音楽表現を学んだAIがピアノ演奏を披露−世界最大規模のメディアアートの祭典でも会場を満員に

【G検定奮闘記】非エンジニア大学院生が、ゼロから一ヶ月でG検定に合格するまで

2020年8月のAI関連イベントまとめ【オンライン含】

AIセキュリティ超入門-イントロダクション~AIをとりまく環境とセキュリティ~

先週のAI関連人気ツイートTOP20!【2020/08/03更新】

世界初のAI恋愛ナビゲーションアプリが関東を中心に事前登録を開始−3つのナビゲーションで恋愛をアシスト

LINEがAIブランドを「LINE CLOVA」に統一 -議事録生成ツールの構想も発表【LINE AI DAY】

まだ間に合う!「Deep Learning Digital Conference」 が明日開催!Google BrainのShane Gu氏も登壇

あらゆる機械の自動化に挑むDeepXが総額16 億円の資金調達 ー少数データ学習や説明可能性、現場での頑健性をさらに追求