【SANNOエグゼクティブマガジン】人事領域におけるデータサイエンスの展開例

1 古典的な統計分析の限界

 現代はビッグデータの時代である。ICT技術の進展により、あっという間に、膨大で多種多様な情報が入手できる時代になった。ありとあらゆるものがデータ化され、世の中に情報があふれているといっても過言ではない。このようなビッグデータの時代となると、旧来の統計学的な発想では十分に対応できない場合も出てきてしまう。なぜなら、そもそも統計学は、少数のデータから全体を推測するために発達した学問だからである。つまり、「少数から全体の法則を見いだす」ための手法論なのだ。現代のように、大量のデータが簡単に集まってしまう時代では、古典的な統計学の機能である「少数のデータから全体を推測」する必要性が薄れてしまったのである。
 このようなことから、現代では「標本の平均値の違いから母集団の違いを推測する」よりも、「そもそもこのデータはどのようなルールに基づいて出現しているのか」といった法則性を推測することに関心が移ってきた。だからこそ、複雑な現象を分かりやすい要素で置き換え説明していく「モデリング」が注目されているのだ。

2 モデリングとは

 モデルとは、データをうまく説明するための単純化した法則のことである。さまざまな要素が複雑に絡み合い、捉えどころのない難解な現象であったとしても、重要な要素を抜き出し、十分に把握可能な事柄に単純化することで、現象を理解し、検討することが可能になる。
 このようなモデリングで使えるのが「データマイニング手法」である。比較的結果が分かりやすく、人事領域でも広く活用できそうな手法の一つが「決定木」である。
 決定木とは、不均質なデータの集団を、最終的には均質なデータ集団となるように樹状に分岐させていく手法のことである。以下で、具体的な活用例を用いてみていこう。

3 決定木の活用事例~人材特性診断を用いて~

 データの出現ルールを明らかにすることで、ビジネス上有益な知見が得られそうな領域は極めて多岐にわたる。特に人事領域は興味深い事柄が多い。例えば、部下の働き方に影響を与えるマネジメントとはどのようなものなのだろうか。
 今回、都内に本社を置き、全国に事業展開を行っているA社の協力を得て、管理職登用前の中堅社員798人に関する人材特性診断について、決定木による分析を行った。そこでは興味深い結果が得られたので、その一部を紹介したい。

ここでは、本学が提供している人材特性診断の一つである経営人材特性診断「EXE」(エグゼ)を活用した。これは、経営人材候補者に対して、トップマネジメントとしての適性などを評価するための診断であり、3カテゴリー・12ディメンションで評価している。
図表 経営人材特性診断EXEディメンション一覧
 「EXE」による診断結果を説明変数とし、目的変数に部下1人当たりの過去3年間の合計総労働時間を置いて、決定木で分析してみると図の通りとなる。
図表 部下の総労働時間を決める上司のマネジメント
    ※〇の数字は、一人当たりの過去3年間の合計総労働時間を示す
 決定木では上から順番に分岐のルールを読み解いていく。また、最下段の数字は総労働時間の平均値である。例えば、「柔軟な視点」のスコアが49以上で「胆力」が50未満の上司の場合、部下の総労働時間の平均値は5654時間ということになる。
 この決定木を読み解くと、最も部下の平均総労働時間が少なくなる上司は、「柔軟な視点」のスコアが49以上、「胆力」が50を超え、「自負」が52以上、「決断」が50未満の場合であった。つまり、柔軟なものの見方ができ、度胸もあり、自分を信じ、しかし自分で決断しない(部下に任せていることかもしれない)上司の下では労働時間が少なくなる傾向にあるといえる。
 ここで注目したいのは、「決断」という要素である。前述の総労働時間が最も少なくなる分岐をたどっても、最後に「自分で決断」する上司の下では総労働時間が6000時間を超える結果となっている。労働時間を少なくするのであれば、部下の自主性に任せることに効果があるかもしれない。
 この決定木の1番目の分岐は「柔軟な視点」だが、このスコアが低い(すなわち右側に分岐する)と、おおむね6000時間以上の総労働時間となっている。「頭の固い」上司の下では年次有給休暇を取得したり、定時で帰ることが難しいのかもしれない。

4 データマイニングの機械学習やAIへの応用

 このように、データの背後に隠された法則性やルールを抽出し、それを未知な対象に当てはめることで「予測する」ことが可能なのだ。
 例えば、既存の管理職のEXEのスコアと部下のパフォーマンスのデータがある程度そろっていれば、「部下のパフォーマンスを引き出せる管理職特性」の法則性も明らかとなる。この法則性を、まだ管理職に登用されていない候補者に当てはめてみることで、その候補者が管理職になったとき、部下がどのようなパフォーマンスを発揮できるか予測することも可能である。
 このように、「既存のデータから法則性を学び、その法則性を基に未知の現象における予測や意思決定を行う」技術を総称して「機械学習」と呼んでいる。
 データを「学習」して、未知の事柄について「予測」することが、まるで人間の知性を具体化しているようであり、実際にAI(人工知能)の核となる技術として活用されている。AI技術の進展は、機械学習の技術の進展と置き換えてもよいかもしれない。

5 人材育成の必要性

 いくら技術が進歩したところで、AIは道具の一つでしかない。しかも、そのAIの技術的なベースである機械学習は、ある程度のことであれば我々の手元のPCで十分に実装可能である。高価なAIを導入するのもよいが、徹底的にデータ活用の戦略を練り、データサイエンスにまつわるリテラシーを備えた社員が社内に数人いるだけで、もしかしたら、それは最先端のAIを装備するよりも、はるかに会社に貢献できるかもしれない。
 手元のデータを洗い出し、そのデータを活用し、どのようなビジネスを展開すべきか考えていくためにも、鋭いデータリテラシーを兼ね備えた社員の存在が必要不可欠な時代となったといえるだろう。