最終更新日:
同氏は、大量のデータサイエンティストを雇えばデータサイエンスプロジェクトが成功すると考えるのは間違っていると指摘します。多数のデータサイエンティストが協力してもデータサイエンスプロジェクトが失敗する原因は、プロジェクトチームに以下に示すような役割を担う人材が欠如しているからなのです。
- データサイエンストランスレーター:ビジネス上の問題をデータサイエンスの問題に翻訳する役割を担う人材。ビジネスユーザとエンジニアの橋渡し役。
- 行動心理学者:データ分析から得られたヒトの行動パターンの原因を特定する役割を担う人材。心理学や人類学の素養があるのが望ましい。
- データストーリーテラー:データが示す事実やその事実が意味することをひとつのストーリーにまとめて伝える役割を担う人材。データサイエンスプロジェクトの成果から何らかの行動につなげる助けとなる。
以上のように解説したうえで、データサイエンスプロジェクトとは様々な才能が結集して取り組むべきチームスポーツのようなもの、と同氏は述べます。似たような能力の人材ばかり大量に集めてもデータサイエンスプロジェクトは成功しない、というわけなのです。
データサイエンスプロジェクトの成功には「心理学」や「ストーリーテリング」といった文系的な才能も不可欠であることを説く同氏の考察は、ともすれば理系的才能に恵まれた人材に目を奪われがちなデータサイエンス業界を鋭く批判していると言えるでしょう。
なお、以下の記事本文はGanes Kesari氏に直接コンタクトをとり、翻訳許可を頂いたうえで翻訳したものです。
データサイエンティストの雇用が過熱気味ななか、ほとんどの企業がカギとなる3つの役割を見過ごし、そのことによってプロジェクトがしばしば失敗している。
充分な人数のデータサイエンティストを雇えばデータ分析を強化できる、と多くの企業が誤った思い込みに陥っている。こうした思い込みが、おそらくこの職種の求人が2013年から250%も増加した理由となっている(※訳註1)。
以上のような風潮に関して、McKinseyはある金融サービスを提供する大企業の事例を報告している。この企業のCEOは、進歩的なデータ分析の熱狂的支持者であった。とりわけ彼は1,000人のデータサイエンティストを雇っていることを誇りにしており、そうしたデータサイエンティストに平均して年間25万ドルを支払っていた。
その後、雇ったデータサイエンティストたちが期待したほどではなかったことが判明した。彼らは、厳密な意味におけるデータサイエンティストですらなかったことが明るみにもなったのだった。
ちなみに名目年収がもっとも高かった都市は、サンフランシスコの166,519(約1,800万円)ドルなのだが、生活費を差し引いた実質年収がもっとも高かったのはヒューストンの123,010ドル(約1,340万円)であった。
画像出典:Indeed「Data Scientist: A Hot Job That Pays Well」[/caption]目次
スキップできないデータサイエンティストの役割
どの業界にも共通した問題として、データサイエンティストの役割がはっきりと理解されず、さらにはデータサイエンスチームにおいて不可欠な役割についても理解されていない、ということがある。こうした問題の存在が、多くのデータ分析プロジェクトが失敗する主要な理由となっている。
データマネージャー、機械学習エンジニア、そしてビジュアライゼーションデザイナーといった役割は今や一般に流布するにいたった。しかし、以下に挙げる流布している職種とは別の3つの重要なスキルを優先的に雇わなければ、既存のデータサイエンスチームメンバーがデータ分析の機会を逃してしまい、イニシアティブも失ってしまってプロジェクトが失敗し、ビジネスを大きくすることができなくなるのだ。
以下では、以上のような重要な3つのスキルとその役割を詳細に解説したい。
1.データサイエンストランスレーター
データサイエンスに関するイニシアティブは、ビジネス的な問題を正しく把握することによって取ることができる。データサイエンストランスレーターは、プロジェクトのなかでもっともインパクトのある部分の特定を助けてくれる。彼らはビジネス上の挑戦をデータ分析によって解決できるかたちへと変えてくれるのだ。
データサイエンストランスレーターは問題領域を深く理解しており、データの流れを円滑にし、有能なコミュニケーターでもある。彼らはビジネスユーザ、データエンジニア、データサイエンティスト、そして視覚化の専門家のあいだに立って橋渡し役となる。
データサイエンストランスレーターは、データサイエンスチームにおけるすべての役割をひとつに結びつける接着剤として働くのだ。
データサイエンストランスレーターはソリューションに命を吹き込み、データサイエンスチームにおけるすべての役割をひとつに結びつける接着剤として働く。彼らの役目はプロジェクトが完了した後も続き、ユーザがソリューションを採用することを助け、プロジェクトの成果をチームで共有することも促す(※訳註2)。
見つけられる限りのデータサイエンティストを雇いなさい。データ分析を本当のビジネス的価値に接続するトランスレーターが欠けていることに気づいていないだろうから。― Mckinsey
- ビジネス的問題を理解するのに必要な各業界に関するドメイン知識
- 機械学習とディープラーニングに関するSTEM分野の知識
- プロジェクト管理スキル
- 起業家精神。ただしこのスキルを「教える」ことは困難
またデータサイエンストランスレーターを確保するにあたっては、新規に雇用するより自社の人材を同職種に対応できるように育成することが望ましいと指摘している。というのも、新規に雇用した人材は自社に固有の知識を有していないからである。
アメリカの企業においては、データサイエンストランスレーターを育成する動きが強まっていることも報告されている。例えば、大手調査会社Mckinseyは2018年に1,000人の同職種を育成した。
データサイエンストランスレーターが組織に欠けている時に見られる兆候
もしデータ分析プロジェクトが分析に価値があることを示せていないのならば、ビジネス的問題を特定する初期のイニシアティブで間違っていたのかも知れない。もしビジネスチームとデータサイエンスチームが互いに隔離されて働いていたら、ビジネス的問題をデータサイエンスの問題に翻訳する際に何らかの情報が失われるかも知れない。もしプロジェクトチームがゆっくり死につつあるのならば、内部的な援助が足りないのかも知れない。
以上のようなトラブルは、プロジェクト内部で奮闘する人員に欠けている兆候なのである。こうした問題はデータサイエンストランスレーターを雇うか育成することによって解消する。ビジネス的問題を分析する素養のあるヒトが、この役割に適任である。Mckinseyのレポートによると、アメリカにおけるデータサイエンストランスレーターに関する需要は2026年までに400万人に達すると見られている。
あなたが属する業界でデータサイエンスに関連したスキルについてギャップを感じている場合、正しいビジネス的洞察力を持った内部的な人員を育成すればより多くの成功をつかむだろう。
またAINOW翻訳記事「12の機械学習スタートアップと働いてわたしが学んだこと」では、素晴らしいAI製品を作るためには「AI製品についてビジネス的指標に照らして話し続け、そうしたビジネス的指標をAIのモデリングにおける指標にいかにして翻訳するか」が重要だと指摘している。
2.行動心理学者
機械学習モデルはデータからパターンを特定することを得意としている。しかし、ビッグデータから導かれる多くのパターンを解釈して、そうしたパターンのなかに隠されたビジネス的価値をもたらすひと握りの宝石を選び出すには依然としてヒトが必要とされている。今日、ほとんどのデータサイエンスのアプリはヒトの行動の意味を明らかにすることに注力している。それゆえ、ヒトビトがなぜそのように行動するのかを理解する専門家が必要なのだ。
人文科学や人類学の専門家はデータサイエンスチームにおける役割を大きくするだろう。
行動心理学者は、顧客の購買時の選択やなぜそうするのかを理解することを助けてくれる。彼らは、ユーザのエンゲージメントを促進したり、ライフスタイルの変化を伝播させたりするのに必要な行動を特定することができる。AIがよりヒトの生活に浸透するにつれて、人文科学や人類学の専門家はデータサイエンスチームにおける役割を大きくするだろう。
行動心理学者が組織に欠けている時に見られる兆候
ヒトの行動に関する予測や洞察が的外れになっていないか。データサイエンスチームがヒトの選択に関して解釈するのに悪戦苦闘していないか。こうした兆候は、データサイエンス製品がまだ出荷段階に達していない印でもある。もしチームのなかでヒトの行動が話題にもなっていないならば、深刻な赤信号が灯っている。
以上のような兆候が見られる時は、心理学や社会学の素養があるヒトが担う役割をデータサイエンスチームに用意しよう。そして、そうしたヒトをAIソリューションや製品の機能を定義するディスカッションに参加させよう。彼らにヒトの行動に関して考察してもらい、ユーザの選択がユーザにとって何を意味するのかについて特定してもらおう。
3.データストーリーテラー
アナリストとエンジニアにデータビジュアライゼーションの入門講座を受けさせればデータストーリーテラーになる、と素朴に思い込んでいる管理職がいる。しかし、データストーリーテラーはビジュアライゼーションの専門家と同じではないのだ。データに関するストーリーは視覚だけから構成されるわけではない。データストーリーテラーは、ユーザにデータに関して何が起こっているのかを理解するためのコンテクストを提供するのだ。
データストーリーテラーはデータに関する洞察を要約して、その要約をビジネス的なアクションにつなげるためにナラティブを付加する。Gartnerのレポートは、データに関するストーリーには3つの要素が必要だと述べている。その要素とはデータビジュアライゼーション、ナラティブ、そしてコンテクストである(※訳註4)。
データに関する洞察に命を吹き込むためにも、データサイエンスチームにストーリーテラーが必要なのだ。
かの有名な心理学者ダニエル・カーネマン(※訳註5)は「数字のために決断するヒトなどいない。ヒトにはストーリーが必要なのだ」と言った。データに関する洞察に命を吹き込むためにも、データサイエンスチームにストーリーテラーが必要なのだ。
- ビジュアライゼーション:視覚化されたデータ。データは視覚的に整理されてはじめて直観的に理解できるようになる。
- ナラティブ:提示されたデータは、ストーリーの聴き手である意思決定者に直接関係するものとして「訴えられる」べきである。「ストーリー」と「ナラティブ」の違いに関してはForbesジャパンの2017年12月の記事「2017年は「ストーリー」型マーケティング終焉の年に」によると、ストーリーは自己完結型なのに対しナラティブは開放的で結果は未定である、と説明している。つまり、ストーリーは一定の結論を伝えて終わるのに対し、ナラティブは聴き手への訴えや問いかけで終わる。
- コンテクスト:データストーリーは、聴き手や聴く状況によって価値が変わる。例えば売上の推移を示したグラフを営業チームに見せた場合は成約を増やす交渉術に関心を示す一方で、会計チームに同じグラフを見せると売上を予測する要因に興味を示すだろう。データストーリーは、適切なコンテクストで提示された場合に意思決定者を何らかの行動に導く。
以上のように解説したうえで、データストーリーを伝えることによって聴き手に何らかの行動を促すことの重要性を強調している。
データストーリーテラーが組織に欠けている時に見られる兆候
Gartnerのレポートによると、50%のデータサイエンスプロジェクトが悪いストーリーテリングのために失敗している。もしユーザがデータサイエンティストによって作られた洞察を理解するのに悪戦苦闘しているならば、データ理解の問題に直面している。もしデータ分析を表示したダッシュボードから決断を導き出せないならば、分析と決断をつなぐはずのストーリーテリングがミッシングリングとなっているのだ。
以上よりデータサイエンスプロジェクトを成功に導くには、次のようなことを実行しよう。データビジュアライゼーションの専門家がよりビジネスを理解できるように支援しよう。より効率的な情報交換のためにデータサイエンストランスレーターを鍛えよう。データに関するストーリーテリングの技術も訓練しよう。データサイエンスチームが考案した選択の行動可能性を確認し、その行動に投資した場合の見返りを見積ろう。
完璧なデータサイエンスチーム
データサイエンスはチームスポーツである。チームは技術、ビジネス、視覚化、そしてソフトスキルに精通していなければならない。以上に述べた3つの役割には互いに重複し合う領域に関する専門的ノウハウが求められるのだが、しばしば見落とされてしまう。
ビジネス的問題を定義してそれを解決するためのアプローチを考案するのを助けるトランスレーターの役割は、重要である。機械学習アルゴリズムによって明らかになったヒトの行動パターンを解釈する行動心理学者の役割も、重大である。
最後に、データストーリーテラーがデータに関する洞察をひとつの統一的なナラティブに再構成して、洞察から導かれる行動を組織全体に促進し普及させるのだ。以上の3つの役割がひとつでも欠けると、データサイエンスをめぐる努力は無駄となる。
・・・
データサイエンスが果たす役割全体を理解したい?もしデータサイエンス業界でユニコーンになるスキルについて知りたいならば、この記事をチェックしてください。
この記事は、最初にThe Enterprisers Projectにおいて公開されました。挿入された画像は、初出記事に追加したものです。
原文
『The 3 Missing Roles that every Data Science Team needs to Hire』
著者
Ganes Kesari
翻訳
吉本幸記(フリーライター、JDLA Deep Learning for GENERAL 2019 #1取得)
編集
おざけん