最終更新日:
人気のある職種であるデータサイエンティストになるには、何かしらのプロジェクト経験やポートフォリオが必須となります。しかし、経験やポートフォリオは、データサイエンティストにならなければ容易に手に入りません。こうしたデータサイエンティスト志望者が陥りがちな苦境を打破する方法が、ギグワーク(企業に就職せずに請け負う単発の仕事)によってデータサイエンスの業務を経験することです。
Metwalli氏によれば、海外のギグワーク紹介サイトでよく見られるデータサイエンスのギグワークの種類と予想報酬は以下のようにまとめられます。
海外で見られる7つのデータサイエンスに関するギグワーク
ギグワークタイプ名 |
概要 |
予想報酬 |
データビジュアライゼーション | データのビジュアライゼーション | 時給58ドル~ |
教育と個人指導 | データサイエンスに関する教育あるいは個人指導 | 時給15ドル~、60~80ドルのことも |
データクリーニング | データクリーニングを請け負う | 50~90ドル |
データモデルの構築 | モデルの設計、構築、開発を請け負う | 数千ドルの案件あり |
リサーチ | 顧客調査やソリューションの提案 | 50~200ドル |
コンサルティング | データサイエにもとづいたコンサルティング。ハイスキルなデータサイエンティスト限定の業務 | 顧客との交渉で決まる |
コンテンツライター | データサイエンスに関するウェブ記事を執筆 | 75~500ドル |
以上のギグワークで経験を積むメリットは、自分の希望やスキルに合わせて仕事内容と報酬を選べることにある、とMetwalli氏と述べています。
日本は海外に比べてギグワーク市場自体が発展途上にありますが、今後はデータサイエンスに関するギグワークが増えるかも知れません。
以下の記事本文では、英単語の「gig」の訳語として「ギグワーク」をあてました。このように翻訳するのは、日本では単発の仕事の名称として「ギグ」より「ギグワーク」が浸透しているからです。
なお、以下の記事本文はSara Ayman Metwalli氏に直接コンタクトをとり、翻訳許可を頂いたうえで翻訳したものです。また、翻訳記事の内容は同氏の見解であり、特定の国や地域ならびに組織や団体を代表するものではなく、翻訳者およびAINOW編集部の主義主張を表明したものでもありません。
目次
より良いポートフォリオを構築し、専門性を高め、そしてお金を手に入れよう
正直に言えば、2021年にデータサイエンティストになるのは簡単ではない。データサイエンティストの需要は依然として高く、供給も同様に多いのだが、データサイエンスの仕事を見つけるのは非常に困難で、時にはフラストレーションがたまることもある。もしあなたがデータサイエンスの初心者で、基礎を学び、いくつかのプロジェクトを立ち上げ、求人に応募しようとしているのであれば、仕事を得ることがそれほど簡単ではないことを知っていることだろう。
データサイエンスの仕事に就くには、ある程度の経験が必要だ。(ある程度の経験が必要)と言っても必要な経験について具体性に欠いておりあまり意味がないのだが、この論点にはこれ以上触れない。しかし、仕事を得るために必要な経験を得るためには、仕事を持つか、印象的なプロジェクトポートフォリオを持つ必要がある。では、実際に業界や学界でデータサイエンスの職務に就くことなく、どのようにして経験を積めるのだろうか。
今日のデータサイエンティストにとって、新人でもベテランでも、素晴らしい選択肢の1つがフリーランスだ。データサイエンティストのフリーランスになると、プロジェクトを選び、時間と賃金をコントロールする自由度が高くなる。また、実際のプロジェクトを構築できるので、より実践的な経験を積みたいと考えている初心者にも最適な選択肢となる。
また、自分の上司になりたい人や、海外でリモートワークをしたい人にもフリーランスは最適な選択肢だ。フリーランスのデータサイエンティストになれば、自分の好みや知識ベースに応じて応募・入札できるさまざまなタイプのギグワーク(フリーランスの仕事あるいはプロジェクト)に出会える。
フリーランスのデータサイエンスの仕事を探しているのであれば、UpWork、Topal、Angelist、Coding Ninjasなどのウェブサイトで大量の求人広告を見つけられるし、LinkedInのJobs finderをジョブタイプを「contract」にして使うだけでも十分に見つかる。この記事では、これらのウェブサイトで見つけられる選択肢のいくつかを調べていく。
№1:データビジュアライゼーションプロジェクト
まずはギグワークで見つけられる最も一般的な仕事であり、なおかつ創造性が必要とされるビジュアライゼーションプロジェクトから始めよう。多くのスタートアップや人々がデータサイエンティストに求めているのは、データをより簡単に、より良く伝えるための効率的なビジュアライゼーションの作成なのだ。
データビジュアライゼーションプロジェクトのギグワークに関しては、TableauやPower bi、あるいはほかのツールのような特定の技術を使って、インタラクティブなグラフやダッシュボードを作成するという依頼が見つかるだろう。この仕事は、経験レベル、品質、作業スピードに応じて、1時間あたり58ドル以上が平均的な報酬である。
- 適切なグラフタイプを選ぶ:比較する場合は棒グラフ、推移に注目する時は折れ線グラフ、のように目的に沿ったグラフタイプを選択する。
- シンプルに表現する:簡単なものほどわかりやすく伝わる。
- 挿入テキストに注意を払う:グラフ等に対して過不足のないテキスト情報を添える。
- 色を効果的に使う:適切な配色は、ビジュアライゼーションをよりわかりやすくする。
- 動的な設計を目指す:ビジュアライゼーションする対象データを変えられる動的な設計が望ましい場合がある。
- 聴衆を意識する:さまざまなバックグラウンドを持った聴衆に伝わるようにする。
- 達人に学ぶ:データビジュアライゼーションのデザイナーの作品から学ぶ。
№2:教育と個人指導
次のギグワークは、私が個人的に気に入っていて、他のすべての選択肢よりも多く行ったことの1つである、データサイエンスのトピックを教えたり、個人指導したりすることだ。データサイエンスの基本を知っていたり、深いトピックに慣れていたりする場合は、これらのトピックを他の人に教えることを提供できるだろう。
この選択肢には、プロジェクトの指導や監督も含まれている。教えることは、自分自身を向上させながら、他の人がデータサイエンスやプログラミングのトピックをより理解できるようにするための最良の方法だと私は思っている。セッションの時給を指定でき、多くの場合、1時間あたり15ドルから始まり、60ドルや80ドルにまで上がる。セッションの期間は、顧客のニーズに応じて決まる。
№3:データクリーニング
データサイエンスプロジェクトでは、最初の不可欠なステップとしてデータクリーニングがある。このステップは、基本的には後でさまざまなアルゴリズムを実行するのに使えるようなフォーマットにデータを変換することを意味する。残念ながら、この作業はルーチンワークで退屈なことが多く、データサイエンティストの中には、モデリングに集中するために他の人を雇ってデータクリーニングをさせる人もいる。
データクリーニングの仕事には、データ操作の知識、さまざまなデータ列のあいだにある関係性を把握する能力、異常や傾向を見極める方法などが求められることが多い。このタイプの仕事の初任給は、データセットの複雑さに応じて、50~90ドル程度である。
№4: データモデルの構築
次に紹介するのは、より実践的な知識を身につけ、より強力なポートフォリオを構築するのに役立つタイプのギグワークだ。この仕事にはデータモデルの設計、構築、そして開発が含まれる。このタイプの仕事では特定のタスクを達成するために、機械学習、人工知能、またはビッグデータに関するアルゴリズムを実装する必要がある。
また、ボットやレコメンデーションシステム、その他の特定分野に関するデータサイエンスアプリケーションの構築なども含まれる。この種のプロジェクトの良い点は、非常に儲かることだ。数千ドルを稼げるプロジェクトもあれば、複数月にわたる拘束が求められるプロジェクトもある。
№5:リサーチ
これは特殊なギグワークで、モデルの設計に役立つ顧客調査の実施とデータの抽出に重点を置いている。この仕事には、アンケートの実施や結果の分析が含まれる。また、プロトタイプの作成や、特定の問題に対する実装ソリューションの提案なども含まれる。
データを扱うのが好きで、プロジェクトをより良くするための質問をしたり、顧客が必要な製品を手に入れる手助けをしたりできるのであれば、このタイプの仕事はあなたに向いているかも知れない。このような仕事は、経験やプロジェクトの複雑さに応じて、50~200ドル程度の報酬が支払われる。
№6:コンサルティング
次に紹介するギグワークは主に経験豊富なデータサイエンティストや、学界や研究機関で働いている人向けのもので、コンサルティングだ。この仕事では、顧客は特定のトピックに関する専門知識に基づいてあなたを雇うのを選ぶ。彼らは可能性のある方向性や解決策についてあなたに質問し、フィードバックを求め、場合によっては顧客自身が分析を行うこともある。
このタイプの仕事は、フリーランスの仕事の中でも最も高額な報酬を得られるもので、自分が見合うと思う金額を基準に時給を設定することができ、顧客があなたの知識に対して(提案した報酬額が)適正な価格だと思えば、喜んで支払ってくれるだろう。
№7:コンテンツライター
最後になったが教えることに関連したギグワークで、私がよくやっているのがコンテンツライティングだ。データサイエンスやプログラミングは人気を集めており、あらゆるレベルの人が知識を広げたり、新しいトピックを学んだりするためのリソースを探している。そうしたニーズを満たすには、ブログ記事や技術チュートリアルを読むことが有効だ。
テクニカルコンテンツを掲載する多くのウェブサイトでは、複雑な情報をわかりやすく伝えられる人材を常に求めている。そして、これらの記事には多くの場合それなりの報酬が支払われ、75ドルから500ドル、記事の長さや質によってはそれ以上の金額が支払われることもある。
まとめ
データサイエンスに限らず、どんな仕事でも就活をしたことがある人は、仕事を獲得するには何かしらの困難があると思っているに違いない。求人に応募すると、運良く返事が来ることもあれば、返事が来ないこともあるだろう。応募条件が現実的ではない場合も多く、経験を必要とする求人を探すことになるが、経験は仕事をしなければ得られない。インターンシップでさえ、簡単にはなれない。
では、仕事が見つからない場合、どのようにして経験を積み、スキルを身につけられるだろうか。実行可能な1つの方法として、まずはフリーランスのデータサイエンティストとして活動することが挙げられる。フリーランスのデータサイエンティストになれば、働くプロジェクトを選び、賃金を指定し、データサイエンス業界の仕事の応募に使えるポートフォリオを作成できる。
この記事では、ウェブサイトで見かける、応募可能で最も一般的なデータサイエンスのギグワークをいくつか見てきた。そして、経験したプロジェクトを増やしたいのか、学習スキルを高めたいのか、お金を稼ぎたいのかなどの目的に応じて、今回紹介した職務の中から自分の好みに合ったものを選べるのだ。
原文
『7 Types of Gigs You Can Do as A Freelance Data Scientist』
著者
Sara A. Metwalli
翻訳
吉本幸記(フリーライター、JDLA Deep Learning for GENERAL 2019 #1取得)
編集
おざけん