イベントリポート「事例から探る!データ活用ができる人材育成」
去る2019年7月26日(金)に、本学研究員 冨沢 日出夫による、2019 SANNOフォーラム「事例から探る!データ活用ができる人材育成」を開催いたしました。
同フォーラムは、7月23日(火)の福岡開催からスタートし、最終は10月4日(金)の仙台まで全国6か所で行われます。
本コラムでは、代官山で行われた内容をリポートします。
【開催概要】
日時:2019年7月26日(金)13:30~16:30
会場:産業能率大学 代官山キャンパス(産能マネジメントスクール)
対象:データサイエンス活用の推進者、人材育成部門の責任者・ご担当者の方
【2019 データサイエンス無料セミナー 開催予定】
07月23日(火) 福岡
07月26日(金) 代官山
09月02日(月) 名古屋
09月17日(火) 大阪
09月24日(火) サピア(東京駅)
10月04日(金) 仙台
イベント開催目的と概要
AIやビッグデータの活用に欠かせない「データサイエンス」。
言葉は知っているものの、具体的に「何ができるのか」「何に活かせるのか」など、なかなか理解が追い付かない方も少なくないのではないでしょうか。
本フォーラムでは、そのような悩みをお持ちの方を対象に、データサイエンスの基本から、データを活用できる人材の育成に至るまで、幅広い内容をご紹介しました。
当日は60名を超える方にお越しいただき、講演のなかで簡単なワークも行いました。
隣同士で名刺交換を行ったり、積極的に発言されたりする様子も見られ、会場は終始活気に溢れていました。
第1部 これからのビジネスに役立つデータサイエンスのあり方
担当研究員
データサイエンスの基本
まずは、データサイエンスの基礎的な説明がされました。
最近よく耳にするワードも解説され、来場者の方も熱心に耳を傾けていました。
なぜ現代では統計学ではなく、データサイエンスなのか
統計学は、一部のデータから全体を推測することができる。データを収集することが難しい時代においては、有効な手段であった。
しかし、昨今ではデータ収集が極めて容易となり、大量のデータを入手することが可能となった。そのため、統計学的なアプローチではなく、データからルールを抽出し、その抽出されたルールから未来を予測するデータサイエンスが必要とされている。
ビッグデータ時代の到来
ブロードバンドの拡大、ストレージ容量の拡大、インメモリーデータベース技術の発展など、いわゆる情報化社会を紐解く技術の発展により、現代は「ビッグデータの時代」と称される。
◇ビッグデータとは・・・
- 一般的なPC・データ処理アプリケーションでは処理することが困難な、巨大で複雑なデータの集合体。
- 一般的に、エクサバイト※以上がビッグデータとされている。
※1EB(エクサバイト)は10億GB(ギガバイト)。
機械学習とAI
機械学習とは、機械(コンピュータ)が、データの集合からその法則性を学ぶことを指す。
AIとは、ソフトウェアを用いて人間のふるまいの一部を再現したものであり、AIは機械学習に含まれる。
機械学習による実例
データサイエンスの基本が一通り説明されたところで、講演は実例の紹介に移りました。
実例紹介の導入に行われたワークは少々難しく、来場者の方も思考を巡らせながら話し合いをされていました。
ここでは、当日行われたワークの一部を公開します。
Q1 | ターゲット・コーポレーション社は、アメリカ合衆国の小売業者である。 機械学習を用いて、顧客の買い物リストデータから何を予測したか? |
来場者の方からは、「レコメンド機能に役立てたのでは?」「家族構成を予測したのでは?」といった声が挙がりました。
それでは、正答を見てみましょう。
A | 顧客の病気を予測した。 買い物リストから顧客の病気を予測し、薬などのクーポンを配布することに役立てた。 |
想像していなかった回答に、会場には感嘆の声があがりました。
さらに、もう一題を紹介します。
Q2 | ヒューレット・パッカード社は、コンピュータの開発・製造・販売を行うアメリカ合衆国の企業である。 機械学習を用いて、従業員の学歴・入社試験成績・初任部署・残業時間・休暇日数から何を予測したか? |
こちらは、来場者の方より、正答が挙がりました。
A | 退職のリスク。 社員が退職する意思があるか、どの程度あるのかを予測した。 |
人事教育部門に携わる方が多くいらっしゃったこともあり、来場者の方は非常に興味を示している様子でした。
データサイエンスのプロセス
基礎説明、実例の紹介を通して、来場者の方がデータサイエンスに具体的なイメージを持ち始めたところで、講演はデータサイエンスのプロセスに移ります。
ビジネスの理解を明確に!
「ビジネスの理解」は、業界人・専門人でなければ理解できない、極めて重要なプロセスである。
ビジネスの理解の段階で目的が不明瞭のまま進行してしまうと、後のデータ収集やデータ解析も的を射たものにならなくなってしまう。
目的を精緻に磨き上げることが大事。
事例紹介
データサイエンスの理解が深まったところで、本学がご支援した事例を3つ紹介しました。
本リポートでは、その一部を取り上げます。
事例 人材特性診断を使って人材育成の方向性を考える
・企業情報 | : | 株式会社A社。 |
・課題 | : | 属人的な育成方針の決定評価、マネジメントの在り方の検討ではなく、客観的な視点からのアプローチの模索。 |
・課題解決のための目的 | : | ①労働時間を決定する人材特性の追究。 ②パフォーマンス(賞与評価)を決定する人材特性の追究。 |
・モデル作成の手法 | : | 決定木分析※。 ※データマイニング手法の一つで、樹木状のモデルを作成する分析方法。 |
目的①のモデル作成
・目的 | : | 労働時間を決定するルール(要因)の抽出。 |
・目的変数※ | : | 2016年総労働時間。 |
・説明変数※ | : | 本人S-ProⅡスコア&上司EXEスコア*。 |
・分析結果 | : | 部下に長時間労働(年間総労働時間2,000時間以上)をさせないマネジャーを育成するには、胆力を鍛え、柔軟な視点を養うのが効果的だと思われる。 |
目的②のモデル作成
・目的 | : | 賞与評価(本人のパフォーマンス)を決定するルール(要因)の抽出。 |
・目的変数※ | : | 賞与評価平均。 |
・説明変数※ | : | 本人S-ProⅡスコア&上司EXEスコア*。 |
・分析結果 | : | A社の人材育成の鍵を握るのは資源獲得力だと思われる。 |
※ | 目的変数 | : | 予測したい変数。分析によって説明される変数。 |
説明変数 | : | 目的変数を説明する変数。因果関係の原因となる。 |
* | : | プロ人材の開発と活用を目的に、成果を出していくプロセスに必要な能力を診断するツール。 | |
: | 経営人材候補者の峻別時に、対象者の基本的な特性を測定する診断ツール。 | ||
: | 人事領域におけるデータサイエンスの展開例。 |
その他、「ATMの紙幣残量を予測し、効率的なATM巡回計画を行う事例」や「トンネルの保守点検について、暗黙知を形式知化し、検査の精度向上を目指す事例」が取り上げられました。
これらは、いずれも「現場担当者や熟練社員の感覚・知見」が大きく関与する事例として紹介されました。
- AIの導入は、現場の業務遂行に大きく貢献できるが、現場を知らないAI技術者が設計したAIエンジンでは、現場にそぐわない・使えない事態が生じる危険性もある。
- AI技術者の技術的知見と現場担当者の暗黙知の融合が成功の鍵。
AIや機械学習という言葉から、統計学に精通した専門的な人材のみが分析にあたっているというイメージを持たれていた方には、新鮮な発見だったようです。
第2部 事例から探るデータ活用人材育成 成功に向けたポイント
第1部では、データサイエンスの効果や重要性が示されました。
しかしながら、データサイエンスについて理解は深まったものの、実際に導入を検討するとなれば、なかなか具体的なイメージを持てない方も少なくないかと思われます。
第2部では、そのような悩みを解消すべく、本学の過去の支援実績をもとに、導入・運用における成功のポイントが紹介されました。
担当者
藤原 隆明(ふじわら たかあき)
学校法人産業能率大学 第1普及事業部 普及事業2課
※所属・肩書は掲載当時のものです。
前職の教育会社にて、主にIT実務教育の企画・提案・運営支援などを経験し、現職に至る。
現在は人材育成に関する普及アドバイザーとして、顧客向けの各種教育(研修やコンサルティング等)の企画・提案・運営支援などを行っている。
データサイエンスの導入
データサイエンスに関心を持ち、いざ導入をしようにも、様々な問題から、導入までうまく進まないケースがあることが述べられました。
本学が携わった支援で、実際に企業で頻繁に生じた問題を例に挙げ、その解決方法が示されました。
【よくある問題】
- 決裁者や教育担当がデータサイエンスに詳しくないため、教育的ゴールが設定できない、イメージできない。
- データサイエンスに関する社内の理解がないため、事業部・他部門を巻き込めない。
- いざ始めることになったが、どう進めていけばよいか分からない。
自社が上記のどの段階に当てはまるか、来場者の方に挙手をお願いしたところ、多くは(1)の段階でつまづいており、(3)の段階まで至っている方は、数名でした。
先に挙げた三つの問題を踏まえたうえで、データサイエンス導入を考えるポイントが提示されました。
・データサイエンス教育の「成果」とは何なのか?
「何ができるようになれば成功か」を考えるよりも、「どんな事業・サービスが実現できるとよいか」といった実務上のゴールを設定し、そのゴールへの技術的手段としてデータサイエンスを取り入れることが望ましい。
教育的な成果を設定する必要はなく、「データサイエンティストの育成」を目的にしてはならない。
事業の結果が成果となることで、他部門や現場も巻き込みやすくなる。
・データサイエンス教育は「何教育」なのか?
- 知的技能の習得を目指す課題解決型教育
データサイエンスの手法を、現実の問題・課題(実務)に適用し、解決策を考える。 - プロジェクトマネジメント教育に近い
実務の問題解決には、利害関係者の巻き込みが不可欠である。
具体的には、関係者への協力要請や、システムへのアクセス権限の把握など、内部の調整が必要となる。
単なるデータの分析家ではなく、データを活用して課題を解決できる人材を育成する観点が重要。
データサイエンス導入中の問題
ここまで、データサイエンスの導入のポイントについて説明されました。
しかしながら、晴れてデータサイエンスの導入が決まったものの、導入中にも問題が生じ、うまく進まなくなってしまうケースもあるとのことです。
【よくある問題】
- ビジネス課題と分析手法の関連付けがうまくいかない。
- 社内にあるデータが不十分。もしくは、取り出せる状況でない。
- 分析の結果を意味づけたり、うまく解釈したりすることができない。
前項と同じく、このような問題を踏まえ、解決のポイントが提示されました。
- 分析に関する予備知識が不十分の場合、データサイエンスで何ができるのか分からず、目標設定をすることが困難となる。
あくまで、実際の問題解決が優先だが、最低限の知識インプットを実施することは有効である。 - 課題やゴールが決まった段階から、早めにデータを収集し、整備しておくことが重要。
実際、欠損値や異常値、全角・半角のばらつきなど、データ整備に時間を要する場合が多い。 - データ解析を行う人材には、多様性があるとよい。
若手だけでなく、ベテランの知見によって得られる成果もある。
推奨する学習設定
ここまでを踏まえて、推奨する学習設計(下図)が紹介されました。
STEP1: | 良質な課題形成をするため導入教育を実施。 |
STEP2: | データサイエンスプロジェクトのPDCA(CRISP-DM)を小さく回し、機運を醸成する。 |
STEP3: | さらにPDCA(CRISP-DM)を回すことで、データサイエンスを活用した新サービスの実装などを目指す。 |
来場者の方からの質問・感想
当日参加いただいた来場者の方より、多くの質問と、好意的な感想を頂きました。
頂いた質問や感想は全て本学の今後の研究や活動の参考にしますが、本リポートでは、その一部を掲載いたします。
質疑応答
Q1 | データ活用について、インプットは①現状からモデルを見つけるのか、または②仮説からデータを探すのか、どちらから取り組むのが有効か。 |
A 現状からモデルを見つけることが望ましい。
データサイエンスは、「手元にあるデータで最善を模索する」ことが基本。
ただし、もし仮説があるのであれば、同時進行で取り組んでみてもよい。
Q2 | データサイエンスの活用は有効だと思われるが、決定者が躊躇する場合、社内訴求はどのように行うことが適切か。 |
A 小さな課題で成功事例を作る。
いきなり経営戦略に関わるような大きな課題ではなく、小さな課題での成功事例が積み上がっていくと、上層部の説得に効果的。
社内普及については、労政時報 第3962号(2018年)にて、『人事担当者のためのデータアナリティクス/データリテラシー入門 ~第6回・完 データサイエンス(HR Tech)の社内への浸透』を執筆しているため、参考になると思われる。
頂いた感想
- 組織課題の決定の重要性を認識することができました。
- 基礎概念の確認から進めていただいたため、初心者にはわかりやすかった。
- データサイエンスの活用の道筋が開けた。
- 事例を題材にした話が多く、データサイエンスの活用をイメージすることができた。
- データサイエンスをビジネスに活用するために必要なことを理解できました。