この記事では、データサイエンティストにとって重要なポートフォリオについて、目的や作成方法、種類を紹介します。
データサイエンティストになりたいけど、何から始めればいいのかわからない、ポートフォリオを作ってみたいという人も多いでしょう。ぜひこの記事を参考にしてみてください。
【この記事でわかること】 ※クリックすると見出しにジャンプします |
目次
ポートフォリオって何?
まず、ポートフォリオとはそもそも何なのかについて解説していきます。
ポートフォリオはデータサイエンティストとして就職、転職する上で非常に重要となります。ポートフォリオという言葉自体は聞いたことがあるけど、それがどうデータサイエンティストと関係するのかが良くわからないという人も多いのではないでしょうか?
ここでは、ポートフォリオは個人評価ツールと言った意味を持ちます。また、マイナビクリエイターでは以下のように定義されています。
- あなたが持つ技術力や生み出す品質がわかるもの
- あなたの個性や作風、こだわりがわかるもの
- あなたの制作に対する熱意や取り組みの姿勢がわかるもの
- あなたがチームのリーダーあるいは一員として、どのような働きができるのかわかるもの
- あなたが要求される条件に対して、どのような対応ができるのかわかるもの
このような内容を含み、相手に自分のデータサイエンティストとしての実力を客観的に示せるものがデータサイエンティストのポートフォリオです。
ポートフォリオの構成
ポートフォリオは、A4やA3サイズの紙にプリントアウトしたものをクリアファイルやバインダーで束ねたものが基本形です。以下のような構成で作ります。
- 表紙
- 冒頭ページ
- 作品の紹介
冒頭ページには、自己紹介や自分のキャリア・経験、クリエイターとしてのポリシー、これからどんなクリエイターを目指すのかといったビジョンをまとめます。
主に重要となるのは作品の紹介です。企業側はここを見てどのようなスキルを持つ人材なのかを判断します。
ポートフォリオを作る目的
ポートフォリオがどのようなものなのかわかりました。そこで、次はポートフォリオを作る目的を紹介します。
ポートフォリオを作る1番の目的は自分のデータサイエンティストとしての実力を示すことです。
データサイエンティストは現在さまざまな分野で必要とされている職業となっています。しかし、その分志望する人数も多く、狭き門であると言えるでしょう。
そのため、自分が「企業側が採用したいと思えるレベル」のデータサイエンティスト人材であるということを示す必要があります。ポートフォリオはこの目的に有用でしょう。
▼関連記事はこちら
・データサイエンスの3要素を解説 – 基礎から活用事例まで紹介>>
・データサイエンスで重要なデータリテラシーとは?わかりやすく解説>>
・データサイエンティストに役立つ資格8選|比較表を用いて解説!>>
データサイエンティストのロードマップ
データサイエンティストのロードマップを紹介します。
データサイエンティストになるためには、以下のステップを踏んでいきます。
- 基礎知識を身につける
- データ処理を学ぶ
- 実装について学ぶ
- 実力を示して職に繋げる
ポートフォリオが必要になるのは4つ目のステップになります。まだステップ3までが身についていない場合は、ポートフォリオを作成する前に基礎的なスキルを学習しましょう。
▶機械学習の完全ロードマップ【初学者向け】-4ステップで職に繋がる>>
ポートフォリオの作成方法
ポートフォリオに入れる内容、そして良いポートフォリオを作るにはどうすればいいのかなど、作成方法を紹介します。
内容
まず、ポートフォリオにどんなことを盛り込めばいいのか、内容を紹介します。
ポートフォリオには、データサイエンティストとしての仕事を経て得られた成果物を入れるのがいいでしょう。また、その中でも個人で作成できるものが向いています。
具体的には以下のようなものが、ポートフォリオには向いているでしょう。
- 機械学習モデル
- Webサービス
- ダッシュボード
- パイプライン
- 分析レポート
良いポートフォリオを作るには
では、良いポートフォリオを作るにはどうすればいいのでしょうか?まず、作成する上で特に気を付けなければならないことは、「面接の限られた時間内にパラパラと全体に目を通し、どんなクリエイターなのかを見極めなくてはならないという採用担当者の立場と目線」からポートフォリオを作ることです。
そのため、特に以下の3つのポイントに注意しましょう。
- 自分にできる仕事の幅が伝わるように意識する
- 冒頭だけでなく最後まで作品を見てもらえるように意識する
- 採用後のあなたのポジションをイメージしやすくするように意識する
▶あなたのポートフォリオを目立たせる8つの機械学習/AIプロジェクト>>
ポートフォリオを通じて自分が求められているスキルを持つ人材であることをアピールすることが重要です。
データサイエンティストに必要とされるスキルは、主にビジネス力、データサイエンス力、データエンジニアリング力の3つに分かれています。
以下の記事でこれらのスキルについて詳しく書かれています。参考にしてみてください。
▶データサイエンスの3要素を解説 – 基礎から活用事例まで紹介>>
ポートフォリオにおすすめの作品3つ
ポートフォリオの内容として特におすすめのものを3つ紹介します。以下の3つです。
それぞれ解説します。
機械学習モデル
まず1つ目が機械学習モデルです。
機械学習モデルを作成する際は、データ分析における一連の流れにおけるアプローチが適切であることをアピールできるような内容である必要があります。
機械学習のプロセス、最終成果物としてのコードに加え、試行錯誤の履歴も残しておきましょう。また、以下のポイントをしっかりアピールできると良いポートフォリオになります。
- 機械学習で解くべき課題設定の妥当性
- 課題を機械学習の問題へ落とし込む際の妥当性
- 実装コードの可読性
- ベースラインとして使うモデルの妥当性
- モデルのチューニングの妥当性
- 利用するデータの前処理の妥当性
- 性能を評価する指標を適切に選択していること
- 設定した問題に対して良い性能を出していること
Webサービス
2つ目がWebサービスです。
この場合作成したサービスそのものが最も重要になってきます。どのようなサービスなのか、どういった用途やシーンで使われることを想定して作られているかなどの解説をして、サービスの意図をしっかりと理解できるような内容にしましょう。
また、以下のポイントをしっかりアピールできると良いポートフォリオになります。
- 納得感のあるユースケースを設定していること
- 使用している機械学習のモデルが適切であること
- 自身で作成した機械学習のモデルを用いてシステムが構築されていること
- 機械学習モデルの更新を考慮したシステム設計になっていること
- モデルを利用しやすいインターフェイスになっていること
- わかりやすいAPI設計書を記述していること(OpenAPIの形式に沿っているとなお良い)
- 実装したコードの可読性
- テストコードが必要十分に記述されていること、また妥当なテストであること
- クラウドインフラを用いてWebサービスをホスティングしていること(プロダクション環境を想定した冗長化やパフォーマンスチューニングもできているとなお良い)
- CI/CDパイプラインを構築していること
分析レポート
3つ目は分析レポートです。
分析レポートは、どういった目的で、何を実行して、何がわかったのか、次にどのようなアクションをとるべきなのか、といった情報を分かりやすく伝えるための手段です。データサイエンティストに必要とされるビジネス力もこのレポートでアピールできます。
また、以下のポイントをしっかりアピールできると良いポートフォリオになるでしょう。
- 適切な課題設定ができること
- 設定した課題に対して、妥当なアプローチをとっていること
- 妥当な論理展開がなされていること
- 数学的、統計学的に誤りのない展開がなされていること
まとめ
この記事では、データサイエンティストに転職、就職する際重要となるポートフォリオについて紹介してきました。
データサイエンティストに転職しようと考えている人、どんな内容にすればいいのか悩んでいる人はぜひ参考にしてみてください。