最終更新日:
こんにちは、AINOW編集部のの本田くれあです!武蔵野大学データサイエンス学部でデータサイエンスの勉強をしています。
今、データサイエンティストに注目が集まっています。ときには21世紀で最もセクシーな仕事とも言われ、データ活用に注目が集まる今、あらゆる分野でデータサイエンティストの重要性が高まっているといえるでしょう。
2012年のHarvard Business Reviewにおけるインタビューにおいて、GoogleのチーフエコノミストのHal Varian氏が、データサイエンティストのことを「21世紀最もセクシーな職業」と述べたことで、データサイエンティストが脚光を浴びるきっかけとなりました。
▼Hal Varian氏の発言
“The sexy job in the next 10 years will be statisticians. People think I’m joking, but who would’ve guessed that computer engineers would’ve been the sexy job of the 1990s?”
▼日本語訳
“今後10年間のセクシーな仕事は統計学者になるだろう。冗談だと思われるかもしれませんが、しかし、1990年代のセクシーな仕事はコンピュータ・エンジニアだと誰が想像したでしょうか?”
Harvard Business Reviewの記事はこちら
世界のデータ量は急激に増えています。InstagramやTwitter、LINEなど、今多くの日本人が、スマートフォンやPCなどのデバイスを通して、さまざまなサービスを利用し、Web上での行動などのあらゆる情報が、ビッグデータとして蓄積されています。蓄積された膨大なデータは、広告などのビジネスにつながっています。
データ活用が企業にとってあたりまえになる今、必要性が増す職業こそ、データサイエンティストです。
目次
データサイエンティストとは?
データサイエンティストとは
一般社団法人データサイエンティスト協会によるとデータサイエンティストとは「データサイエンス力、データエンジニアリング力をベースにデータから価値を創出し、ビジネス課題に答えを出すプロフェッショナル」と定義されています。
データサイエンティストとは、蓄積されたビッグデータを分析し、分析結果から導かれた手法を活用することで企業に貢献する職業です。IT化が進んだ現代社会において、さまざまな業界の企業で大量のデータが溢れかえっている中、ビッグデータを扱えるデータサイエンティストの需要はますます高まっています。
データサイエンティストを簡潔に表すと「膨大なデータを分析し、そこから得られた結果をビジネスに活用する」職業と言えます。
特にデータサイエンティストの活躍が目立つのは、Amazonや楽天などのショッピングサイトやソーシャルゲームなどのサービスを展開するWeb系の企業です。
しかし、昨今では、Web系の企業以外でもデータサイエンスが活用されています。例えば、農業においては、気温や湿度、収穫量などのデータを蓄積し、分析することで効率の良い栽培に生かす例もあります。
また、小売店では、売上や来店者数の予測、在庫量の最適化などの分野でデータサイエンティストが活躍しています。
データサイエンティストが注目される理由
Webサービスの台頭によるビッグデータ市場の拡大
2000年代に入り、インターネット技術が急激に発展しました。今では多くの企業がホームページを開設する他、インターネット上にさまざまな便利なサービスが多く展開されています。これにより、膨大なデータがインターネットを介して収集されるようになりました。
さらに、今では生活の必需品となったスマートフォンの台頭により、インターネットがさらに身近な存在になりました。ソーシャルゲームやSNSなど、あらゆるアプリケーションやサービスをさまざまな企業が提供することで、私たちのWeb上での行動データが収集され、分析の対象になっています。
その他、第一次産業から第三次産業まで、あらゆる分野にデータ活用の裾野は広がっています。
サービスの改善や広告掲載など、現在の企業において、データ活用は当たり前になりつつあります。
そんなデータを活用し、事業に貢献できる存在としてデータサイエンティストに注目が集まっています。
▼ビッグデータについて詳しくはこちら
データサイエンスの歴史
データサイエンティストを取り巻くデータサイエンスの歴史はどのように変遷してきたのでしょうか。
ドイツのインターネットサービス会社IONOSのデータサイエンティスト Dominik Haitz氏によると、データサイエンスの歴史は、ビッグデータがまだビジネスにあまり関係していなかった2010年代以前、ビッグデータが注目され始めた2010年代、そしてディープラーニングが注目を浴びた2010年代末という3つの時代に区切ることができるといいます。
データサイエンティストの第1の波は、データが膨大になり、データサイエンスが実際に生まれる前に生じました。これは2010年代より前のことです。
当時は統計学者やその周りのアナリストが現在のデータサイエンティストが行っている多くのことを行っていました。しかし、データの重要性の社会的な認知は少なく、データサイエンスは大きな流行とはなりませんでした。
第2の波は2010年代の初頭に訪れます。大規模なデータの収集が進み、大規模なデータを活用するビジネスの需要が高まりました。データサイエンティストのニーズも高まりましたが、どのような人物を雇うべきかを模索しており、統計などの分野の学科の卒業生に頼っていたといいます。
第2の波に属するデータサイエンティストは実に多くのトライを重ねていましたが、PoC(実証実験)の段階で終わってしまうケースも多く、現実的な変化をもたらすことには失敗しました。
そして現在、2010年代の終わりかけて、ディープラーニングなどのAIが流行する中、データサイエンティストの第2の波に突入しました。
第3の波に属するデータサイエンティストは試行錯誤を重ね、イノベーションを起こし、データの中から効率的にビジネス的価値を見つけ出し、データ分析を行ってその結果を活用するまでに乗り越えるべきギャップを埋めてきました。
▼データサイエンティストの歴史に関して詳しくはこちら
データサイエンティストに必要なスキル
膨大なデータを分析し、分析結果を活用してビジネスに貢献するデータサイエンティストには、さまざまなスキルが求められます。
一見すると、データを分析する力だけが必要と考えられがちです。しかし、それだけではなく、企業における課題を理解し、解決していくビジネス力も求められます。
一般社団法人 データサイエンティスト協会は、データサイエンティストに必要とされるスキルを以下の通りに示しています。
ビジネス力:課題背景を理解した上で、ビジネス課題を整理し、解決する力
データサイエンス力:情報処理、人工知能、統計学などの情報科学系の智恵を理解し、使う力
データエンジニアリング力:データサイエンスを意味のある形に使えるようにし、実装、運用できるようにする力
データ活用となると、自社ですでに蓄積された膨大なデータを活用することで、すぐに成果に結びつくと思われがちです。しかし、単なるデータ分析だけではビジネスを変えることはできません。
「データを活用すれば、事業が拡大する」と安易に解釈せず、課題背景や企業の現場の声を重視し、データ分析の結果を使ってもらえるように調整するスキルもデータサイエンティストにとっては重要です。
データサイエンティストとデータアナリストとの違い
データサイエンティストとよく似ている「データアナリスト」という職業があります。
大量のデータを分析するという点ではデータサイエンティストもデータアナリストも共通しています。
一方で、データアナリストはデータを処理する業務に重きが置かれています。
しかし、データ分析では単にデータを分析し、その結果を導けばビジネスで活用が進むわけではありません。このような分析者は一般的に「データアナリスト」と呼ばれ、ビジネスでの活用までを見据えて問題設定をする「データサイエンティスト」と区別されます。
データアナリストは与えられた問題やデータをもとに、分析結果を導くことが主であり、上掲の図内の「データサイエンス力」が重視されています。
データサイエンティストでは、データサイエンス力に加え、データエンジニアリング力とビジネス力が必要とされます。3つのスキルを駆使することで、データ分析を「分析して終わり」にせず、その先にあるビジネス拡大に繋げることが求められているのです。
データサイエンティストの仕事内容
ここまで、データサイエンティストに必要なスキルについて紹介してきました。ここからは実際にデータサイエンティストはどのような仕事をしているのかについてお伝えします。
データサイエンティストの仕事は大きく分けて以下の4つが挙げられます。
会社の課題の把握
データサイエンティストは、データを収集する前に、課題の把握を行います。真にビジネスに貢献するデータ分析を行うには、課題(問題)設定が最も重要と言っても過言ではありません。どんなに素晴らしい分析手法を使ったとしても、課題設定が間違えていれば結果にたどり着くことはできません。
データサイエンティストは、現場に存在する課題を発見するために、時には現場の担当者と緊密な関係を築くことも必要です。
具体的には以下のような仕事を行います。
・ビジネス現場のヒアリング
・課題の選定と優先度の決定
・達成すべき目標(KPI)の明確化
・目標をクリアするための仮説の洗い出し
データ収集 / 環境整備
課題を把握し、仮説設定を終えれば、データ分析に必要なデータを準備します。データ分析においては、闇雲に蓄積されたデータでは、十分な分析精度が実現できません。
精度の高い分析を可能にするために、目的に合ったデータを収集し、分析可能なようにデータ整理(データクレンジング)を行います。
また、APIなどを介してデータ収集を行うプログラムを作ったり、必要なデータを保有している部門とのコミュニケーションも必須です。
さらに、データ分析に必要なデータベースやデータ分析基盤構築することもデータ分析の前段階として重要です。データベースやデータ分析基盤は、GoogleやMicrosoftなどがクラウド基盤を構築しているなど、既存のツールを使うことで大きく効率化が可能です。
データ分析
データベースやデータ分析基盤の整備が終われば、データ分析に入ります。さまざまな分析手法の中から適切な手法を選び、設定した課題を解決できるような「答え」を見つける作業です。
▼参考記事
昨今では、プログラムを書くことなく、マウス操作で分析を行うことができるツール(GUIツール)の普及も進んでいます。
複雑な分析手法はツールによる効率化が難しいケースもありますが、データ分析を効率化する手段として、GUIツールの活用も視野にいれるといいでしょう。
▼参考記事
▼参考記事
課題解決 / 提言
データ分析が終われば、その結果を必要な部門に報告します。設定したKPIが達成されているかを項目別に整理します。
また、分析して得られた内容から、ビジネス施策を立案して提言します。
時には、次なる問題を明らかにすることで、次のデータ分析の施策につなげることもあります。
どんな分野でデータサイエンティストは求められているのか
スマートフォンやPCなどのデバイスの数が増加している今、Web上に展開するサービスや、アプリケーションが絡む領域では特にデータサイエンティストが活躍しています。
- Web広告領域
- Webサービス領域
- ソーシャルゲーム領域
など
また、その他の分野でもデータサイエンティストの重要性は高まっています。あらゆる分野で、データが蓄積されている今、データサイエンティストが活躍できる領域も拡大しています。
- 銀行や証券会社、保険会社などの金融領域
- ヘルスケア領域
- 電力領域
- アパレル領域
- 小売領域
- 製造領域
- 自動車領域
など
データサイエンティストの仕事の魅力
データサイエンティストの仕事の魅力は何なのでしょうか?
データサイエンティストの魅力について武蔵野大学データサイエンス学部准教授の中西崇文氏にデータサイエンティストの仕事の魅力についてお聞きしました。
中西氏:「色んな分野の方と仕事ができることではないでしょうか。データサイエンスは幅広い分野に使えるので、色んな人と協力し合いながら色んな仕事ができます。
働き方としてもデータサイエンティストは時間を自由に時にはテレワークという働き方も非常にマッチしているので、創造力を生かした働き方ができるというところも魅力です。」
データはさまざまな分野の会社に貯蓄されているため、自分の興味のある分野のデータを分析して働くことができます。
例えば、ファッションに興味があるなら、次の流行はどんなファッションか、こういう人にはこれが売れる!などなど分析するのはとても魅力的です。
データサイエンティストになる方法
先述のデータサイエンティストに必要なスキルのうち、「データサイエンス力」と「データエンジニアリング力」は体系化されやすく、昨今、学習環境が整備されています。
Web上では、データサイエンスに関連するさまざまなコンテンツが公開されています。また、データ分析の手法を学べる学習サービスも多く展開されています。自分にあった方法で、「データサイエンス力」「データエンジニアリング力」を身に着けましょう。
一方で、「ビジネス力」は、そのノウハウがされづらく、書籍や学習サービスを通してもスキルを得にくいデメリットがあります。「データサイエンス力」「データエンジニアリング力」を身に着けた後に、プロジェクトの実践を通してビジネス力(課題を見つける力や他部署と円滑なコミュニケーションをとるスキル)を学ぶことが求められます。
プロジェクト型の学習を提供するスクールに通うだけでなく、学生の方はインターンシップに参加してみる、社会人の方は、初歩としてデータアナリスト的な立場からプロジェクトに参画する中でビジネス力を培うなど、ご自身にあった流れで必要なスキルを習得していきましょう。
データサイエンスが学べる書籍5選
- タイトル:データサイエンス入門
内容:データサイエンスとは何かをまず知りたい方向け。データ処理・分析に必要な情報学と統計学の基本知識を理解し、データから新たな価値を引き出すスキルの学び方が紹介されています。 - タイトル:見て試してわかる機械学習アルゴリズムの仕組み機械学習図鑑
内容:機械学習の各手法のイメージを掴みたい方向け。複雑な機械学習のアルゴリズムの仕組みをこの一冊で学ぶことができ、また実際の使い方や注意点も分かります。さらに各アルゴリズム毎にScikit-Learnを使用したコードを記載しているので見るだけでなく試すこともできます。 - タイトル:Python実践データ分析100本ノック
内容:Pandas、Scikit-learnを覚えたてで実践につなげたい方向け。データのクレンジングから機械学習、最適化問題まで100本ノックをこなしてビジネス現場で即戦力になれる「応用力」を身につけることができます。 - タイトル:東京大学のデータサイエンティスト育成講座~Pythonで手を動かして学ぶデータ分析~
内容:網羅的にかつ腰を据えて学びたい方向け。東京大学で実施された人気の講座で使われた教材がベースとなっており、データサイエンティストになるための基礎が詰め込まれています。 - タイトル:データサイエンティストの秘密ノート 35の失敗事例と克服法
内容:実践的で即戦力になるデータ分析を学びたい方向け。SBT社が手掛けた事例を元に、データ分析を行う際に起こりやすい失敗事例とその克服法を解説し、読者はリアリティのある、真に役立つデータ分析の実例を学ぶことができます。
また、Pythonが学べる無料ドキュメントを京大が無料公開しています。
京都大学の喜多一教授が公開したPythonの教科書で、無料で公開され、コンピュータやプログラムの仕組みなどの基盤的から、実際にプログラムを動かすところまで詳しく書いてあるので、初心者の方でも理解を深めやすいと思います。
おすすめの学習サービス5選
Udemy
①Grow with Googleが提供する「はじめてのAI」については無料で受講し、最後に修了証を得ることができます。こちらはAIについての知識が全くない初心者向けの講座なので、まずこの講座を受けてAIの知識を身につけてからプログラミング言語の学習や資格試験に取り組むことをお勧めします。
[対象受講者]- AI についての基礎的な知識を得たいと思っている方
- AI が実際のビジネスにどう活用されているのか知りたい方
- AI を使って何かやってみたい、ビジネスに役立てたい方
- 人工知能、AI、機械学習、ニューラルネットワーク、ディープラーニングなどの言葉は聞いたことがあるが、それぞれについて説明できない方
②「キカガク」の講座では機械学習からAIに関する内容の講座で、プログラミング言語はpythonを使用しています。また数学初心者・統計初心者にもわかりやすいように手書きで一から解説があるのでとてもわかりやすいです。機械学習の概念を実装しながら理解できるのも大きな特徴です。
TechTrain
TechTrainはインプット型の講座のUdemyと違って、実践的に開発をしていくアウトプット型の講座です。
またこのサービスの1番の特徴と言っても良いところが、わからないところはメンターに相談しながら進めることができることです。
約25社で働いているエンジニア約60名から、自分が聞きたい技術レイヤーに合わせてメンターとして選ぶことができます。
全国にあるエンジニアコミュニティ11の団体と提携していて勉強会、交流会に参加できます。またコンペのようなものも開催され、日常であまり交流のないエンジニアの方と交流できる貴重な体験になります。
PyQ
ステップを踏んでPythonを学習するのに最適な学習サイトです。
初心者でも簡単にできるステップから、機械学習やWebアプリ・API、統計分析など応用まであるので幅広い範囲の人が勉強できます。
個人ライトプランは3040円(税込)/月です。
AI Academy
こちらは初心者からでもデータサイエンスを幅広く、実践的に学べるオンライン教材です。AI Academyの最も大きな特徴はオンラインと対面での授業を行っていて、受講料が手軽という点です。無料でできるフリープランと、980円/月のライトプラン、4~10万円/月のBootCampコースがあるので、自分のレベルにあったコースで学習ができます。
またAI Academyではオンライン教材としては珍しく講座に学習記録を残すこともできます。具体的には、フリープランでは講座上に蛍光ペンを引くことができ、ライトプランではコメントを書き込むことができます。
42 Tokyo
こちらはDMM.comが東京都港区六本木グランドタワーに設立した「社会に接続する学校」です。学校といっても先生がいるのではなく、生徒同士が教え合う仕組みになっています。
42 Tokyoの大きな特徴としては、
- 24時間365日開放
- 学歴不問
- 学費完全無料
入学の条件は、やる気のある16歳以上とシンプルなのですが、入学試験として事前テストと、4週間課題に取り組み、その状況を審査されるので、「気軽に勉強」よりかはガッツリ勉強したい方におすすめです。
▼42 Tokyoの取材記事はこちら
データサイエンスが学べる大学・大学院
データサイエンス学部3選
日本国内の大学でも、データサイエンスをカリキュラムに取り入れる流れが加速しています。
滋賀大学は日本で初めてデータサイエンス学部を設立し、その後、横浜市立大学と武蔵野大学にデータサイエンス学部が設立されました。
また、東京工業大学は、全大学院生を対象にAIやデータサイエンス関連の教育を実施すると発表しており、理系学部においてカリキュラムの一つとしてデータサイエンスが取り入れられるケースも増えています。
▼関連記事
【国内に設置されたデータサイエンス学部】
- 滋賀大学
設立:2017年
特徴:日本初のデータサイエンス学部で、定期的に講演を開くなど、アクティブにデータサイエンスの分野で活躍する教授が豊富にいることが大きな特徴であり、それが教育の強みです。また有名企業との連携やコラボ授業なども豊富にあり、非常にアクティブな大学です。 - 横浜市立大学
設立:2018年
特徴:数学重視のカリキュラムで、プログラミングで必要な数学の基盤をしっかり固められるのが特徴です。また、たくさんの企業とタッグを組み、データを提供してもらっているのでオープンデータが豊富にある環境で学べることも大きな強みです。 - 武蔵野大学
設立:2019年
特徴:ビッグデータやAIを活用した統計分析だけではなく、それを超えて価値創造をするまでの領域です。1年の後期から自分のやりたい研究テーマを扱いながら、企業で実際に仕事をしている方から直接お話や指導をしていただき実践的に取り組む授業も大きな特徴です。
AINOWでは、武蔵野大学 データサイエンス学部の現役学生へのインタビューも公開しています。合わせてご覧ください。
▼関連記事
データサイエンス学部について詳しくは以下の記事を参照ください。
データサイエンスが学べる大学院
大学の学部へのデータサイエンスのカリキュラム導入の流れと共に、大学院でもデータサイエンス関連のカリキュラム編成が進んでいます。社会人の方の学び直しなども対象となっているケースがあります。ぜひご参考ください。
立教大学は大学院に、人工知能科学研究科を2020年4月に開設。AIやデータサイエンスの知識や技術だけでなく、先端技術を活用してさまざまな社会課題の解決を実現するための実践力を育成を目指しています。
▼立教大学 人工知能科学研究科の取材記事はこちら
また、上述のデータサイエンス学部を設置する大学の大学院でもデータサイエンス関連の学科が設置される動きがあります。
滋賀大学は国内の大学で始めて大学院に「データサイエンス研究科」を2019年4月1日に開設しました。横浜市立大学は、2020年4月にデータサイエンス研究科を開設しています。武蔵野大学は2021年4月に大学院にデータサイエンス研究科を開設する予定です。
データサイエンス関連のインターンシップ
先述のデータサイエンティストに必要なスキルのうち、特に「ビジネス力」は現場でこそ培うことができます。また、「データサイエンス力」を身につけるためにも、学習で使う整備されたデータだけではなく、企業にあるさまざまなデータに触れ、対処法を学ぶことが大切です。
武蔵野大学データサイエンス学部では2年生の夏から学部生全員がインターンシップに参加します。就業先は大学から紹介された会社でも、自分で見つけてきた会社でも構いません。
データサイエンティストが活躍する分野は、日に日に広がっています。早い段階から、さまざまな分野に触れ、実際に働くことで、本当の意味で活躍できるデータサイエンティストへの道が開けます。
▼インターンシップをしながらスキルを身につける重要性について詳しくはこちら
【インターンシップ情報サイト】
- Wantedly
Wantedlyはやりがいや環境で求人者と求職者をマッチングするビジネスSNSです。インターンシップの掲載情報数は国内でも最大級です。データサイエンティストに職種を絞り込んで検索することも可能で、2020年4月15日時点で120件のデータサイエンティスト関連インターンシップ情報が掲載されています。 - Infla
Inflaは、長期インターン・有給インターン募集に特化したサイトです。エンジニアからデータサイエンティストまで幅広いインターンシップ情報が掲載されています。
データサイエンティスト関連の資格
データサイエンティストになるために特に必要な資格はありませんが、持っておくと有効な資格の紹介します。
統計検定、基本情報処理技術者試験 / 応用技術者試験、OSS-DB技術者認定試験、オラクルマスターなどがあります。3つの試験をピックアップして簡単にまとめたいと思います。
統計検定
概要:中高生・大学生・社会人を対象に、各レベルに応じて統計に関する知識や、統計の集計結果をビジネスに活用する能力を評価する民間の検定試験です。
統計検定データサイエンス基礎という検定試験も2020年から導入されました。
受験料:
4級:3,000円(税込)
3級:4,000円(税込)
2級:5,000円(税込)
準1級:8,000円(税込)
1級(統計数理および統計応用):10,000円(税込)
1級(統計数理のみ):6,000円(税込)
1級(統計応用のみ):6,000円(税込)
基本情報処理技術者試験
概要:「情報処理の促進に関する法律」に基づき経済産業省が、情報処理技術者としての「知識・技能」が一定以上の水準であることを認定している国家試験です。
受験料:5,700円(税込)
オラクルマスター
概要:「日本オラクル社」が公式に運営する「Oracle Database」シリーズを扱う技術力を認定する試験です。
受験料:
ブロンズ:44,520円(税込)
シルバー:66,780円(税込)
ゴールド:229,040円から519,040円(税込)
プラチナ:974,000円(税込)
しかしこれらはIT系共通の資格でデータサイエンスに特化している訳ではありません。
そこで最近ディープラーニング協会主催のG検定(ジェネラリスト)とE資格(エンジニア)も注目されるようになってきました。
こちらも詳しくは下のリンクを参照ください。
AINOWのデータサイエンティスト関連記事
▼「仕事のできる」データサイエンティストと見なされるために実践すべき6つの行動
▼データサイエンティストが身につけるべきスキルについてさらに詳しくはこちら
▼データサイエンティストを目指すソフトウェアエンジニアの人にオススメ
まとめ
ここまでデータサイエンスとはどんな仕事か、データサイエンティストになるためにはどうすればいいかについて紹介してきました。
データサイエンティストは様々な分野で活躍できます。
データサイエンスは、マーケティングについて学びたくて経営学部を目指していた私が「これだ!」と思えた分野です。きっと皆さんも自分のやりたい分野をじっくり考えてみるとどこかに必ず「データ」を活かせる部分があるはずです。
ぜひこの記事を参考に、データサイエンティストを目指してみてください。