最終更新日:
こんにちは。エンゲル・イザワです。最近よく聞く「HRテック」という言葉。そのうちの「退職率予測」について、理解しておきたい数字についてまとめてみました。
話題のHRテック、あなたは知ってる?
HRテックは人事部の担当者でなくとも一度は耳にしたことがあるのではないだろうか。
HRテックは企業の採用・育成・評価・配置(HR)とクラウド、ビッグデータ、AIなどのテクノロジーを結び付けた造語だ。そのひとつに含まれるのが「退職率予測」。
人材会社パーソルホールディングスは従業員の性別、年齢、勤続年数、職位滞留年数などから一人ひとりの退職確率を約90%の精度で予測するモデルを開発。人事部と上司で退職予備軍者の情報共有をすることでマネジメントに生かしている。
外部向けに提供しているサービスもいくつかある。HuRAidは AIによる勤怠分析で約90%の的中率で退職率を予測する。また、TISはHRアセスメントサービスのひとつとして退職者予測を提供している。注目を浴びるHRテックでは、今後もこれまでにない様々なサービスの登場が期待される。
的中率90%って何?
ところで、退職率予測の精度90%、的中率90%という数字はどう解釈すべきだろうか。「退職率予測」の導入を検討している企業なら正しく理解しておきたい数字だ。
正答率、再現率、適合率
一般に、統計学で予測の精度を表す言葉は3つある。「正答率」「再現率」「適合率」そして「F値」だ。
これらの違いを、社員一人一人について「辞める」or「辞めない」を予測するモデルの例に当てはめてみよう。このとき、下図のように4タイプの社員が存在することになる。
この場合、正答率といったときには
つまり、「全体でどれくらい予測が正しかった」かを表す指標で、私たちに最も身近で理解しやすいのが特徴だ。ただ、この正答率の弱点はザックリしすぎている点だ。極端な例を挙げれば、100人に1人しか退職しない職場で、全員に「辞めない」という予測を行えば、正答率は99%になる。実際に辞めた人を事前に予測できたかどうかにフォーカスした指標が必要だ。
そこで有益なのは、再現率という指標。
つまり、実際に辞めてしまった人のなかで事前に予測できた割合と言い換えられる。先ほどの極端な例の場合だと、この値は0÷1=0となり、有益な指標であることがわかる。また、式からわかるように、「予測ミス退職(辞めないと予測されていたにも関わらず、辞めてしまった社員)」が少ないほど、再現率は高くなる。この予測ミス退職が減れば、事前に予測できず何も対策できずに辞められてしまうというケースが少なくなる。そのため、少しでも辞める確率のある社員を見つけて、なんとしても予想外の急な辞職を防ぎたいという戦略に最適な指標といえる。ただ、もちろん再現率にも弱点がある。ほとんどすべての社員を「辞める」と予測してしまえば原理的に「予測ミス退職」が低くなり、再現率は大きく出てしまう点だ。
さらに、再現率と混同しやすいのが適合率で
辞めると予測された社員のうち、実際にはどれくらいが辞めたのかの割合であり、予測の信頼度とも言い換えることもできる。精度や的中率と言われた場合はこの適合率のことを指す可能性が高い。特徴として「予測ミス在職(辞めると予測されたけれど実際には辞めなかった社員)」が下がれば適合率は上がることになる。この「予測ミス在職」が減れば、人事としては、辞めるかどうか微妙な人に対して資源と時間を使うことがなくなる。つまり、本当に辞めそうな人を見つけだし、必要なケアをじっくり時間をかけて行いたいという戦略にはピッタリの指標だ。
ただし注意が必要なのが再現率とは逆のパターンで、ほとんどすべての社員を「辞めない」と予測してしまえば原理的に「予測ミス在職」は減り、適合率は大きく出てしまう点だ。
具体例
ここまでざっくり説明してきたが、ここで具体的なケースを考えてみよう。
結局のところ、再現率、適合率が高いとは何だろうか。例えばあなたに50人の部下がいる。来年には10人が辞めることがわかっていて、もし適切な対応をとればその10人のうち何人かは引きとめられるかもしれない。ただ、その10人が誰なのかはわからない。その10人を特定するために離職率モデルを導入する。
もしここで適合率の高いモデルを導入すると、例えば結果は次のようになる。辞めると予測された人は5人だけ。ただこの5人は、真に辞める10人が高い確率で含まれている。あなたはこの5人を引き留めることに集中できるかもしれないが、残りの5人を特定できないことに不満を覚えるかもしれない。
そこでやはり、再現率の高いモデルを導入する。そうすると結果は例えば次のようになる。辞めると予測された人は20人。この20人の中には、当然、真に辞める10人以外の人も含まれている。ただ先ほどのように、何も対策できずに退職されるケースは減る。しかし一方で、一度に20人の部下を気にかけるのは難しく感じるかもしれない。20人のなかには本当は辞める気のない人も含んでいるので、そういう部下を必要以上に気にかけることになるのは時間の無駄と感じるだろう。このように再現率と適合率はトレードオフになっているのだ。どちらにもそれぞれの良さがあり、どちらが優れたモデルか決めることはできない。
F値
具体例でみたように再現率と適合率はトレードオフの関係になっている。そこで、両者のバランスをとったF値という指標もある。このF値が高ければ性能が良いことを意味する。
予測だけで終わらないために
予測モデルの指標について、その使い分けも交えて紹介してきた。
もしあなたが人事の担当者なら、まずやるべきなのは自社の取る退職ケア戦略を決めること。退職確率が高い人がわかったところで、どういうケアをしていくのか。本当に辞めそうな人にだけ必要なケアをするのか、逆に少しでも辞めそうな人に広くケアをしていくのか。そのうえで、前者なら適合率、後者なら再現率を指標として最適なサービスを選ぶのが良いだろう。どちらか決めかねている場合は、無難にF値を指標にするのもありだろう。
結局のところ、退職確率が高い人を予測できたとしてもコンピュータや人工知能だけでは問題を解決できない。最後は人が人に対して、悩みを親身になって聞き、適切な声かけを行うことなどが必要だ。そうであるならば、まずは自社の資源のなかでどんな人にどのようなケアをできるかを考え、そこから逆算して必要な予測モデルの導入を検討していくべきだろう。