総合研究所の概要

お問い合わせ

資料請求リスト

ビッグデータ時代を賢く生きるために~統計学のススメ~最近の傾向・ご支援から見えること

SANNOエグゼクティブマガジン


ビッグデータの時代の到来

ビッグデータが流行っている。ちょっとした書店に行くと、“ビッグデータ時代の○○”とか、“戦略的ビッグデータ活用術”といった書籍が沢山目につく。特にIT技術の進展で、我々は容易に、非常に大量のデータを入手・加工することが可能になってきた。これまで気にも留めなかった情報が、実は工夫次第で貴重なビジネスの種にもなるのだ。

代表的なのは、Suica® [ⅰ]をはじめとするICカードである。ICカードは、通常IDがあり、様々な情報がこのIDと紐づけされている。現在の私たちの日常生活は、様々な場面でICカードを使っている。そこでは、IDと紐づけられた情報がドンドン蓄積していくのだ。IC カードでの購買行動が、顧客情報とともに蓄積されていく。個人情報の取り扱いとして慎重を要するのはもちろんだが、マーケティングなど様々な分野で活用が期待できる。

他にもある。最近では、スマホも強力なビッグデータ収集装置である。とあるアプリを使うと、位置情報、検索項目など時々刻々と情報が蓄積されてくる。インターネット上で売買されている商品の購買記録なども、丹念に積み上げた顧客情報として活用できるだろう。

どうだろうか? あなたの会社には、日の目を見ないで延々と蓄積され続けている情報はないだろうか? このようなデータは、活用次第で、業務に思わぬメリットを与えてくれる。

統計学と結びつけると魔法がおこる!?

データマイニング[ⅱ]の技術進展の効果もあり、統計学の理屈と上手に結びつけ活用することで、ビッグデータはまるで魔法のようなことを我々に見せてくれる。イェール大学のイアン・エアーズ教授は、以下のようなことを著書「その数学が戦略を決める(文芸春秋),2007年」の中で紹介している。

たとえば、アメリカのとある航空会社では、顧客情報を詳細に記録し蓄積している。氏名、年齢、性別はもちろん、この顧客に降りかかったトラブルやその後の利用動向なども記録しておくのだ(たとえば、預けた手荷物の紛失、どの便に何回搭乗したかなど)。このようなデータを膨大に蓄積しておくと、自社便を頻度良く使う顧客の特徴が見えてくるのだ。たとえば、30歳代後半から40歳代前半の男性ビジネスマンでマイアミ―シカゴ便を利用するお客様のリピート率は高いとか、1年以内に悪天候での代替着陸や、手荷物の紛失といったトラブルに出会ったお客様は2回同じような憂き目にあうと、二度と同じ便には乗らなくなるといった傾向が明らかになってくるのだ。すると、客室乗務員も一度手荷物紛失などといった憂き目にあったお客様に対しての対応を工夫することができる。

「お飲み物は何になさいますか?ああ、それと、一月前のシカゴ便で手荷物を紛失してしまい、本当に申し訳ありませんでした。その後の当社の対応で何かお困り事などありませんでしたか?」。

このように、客室乗務員から声をかけられたらどうだろうか?手荷物を紛失されて不愉快な思いをし、「もう二度とこの会社の飛行機には乗るまい」と思いつつあったとしても、気の利いた一声があれば思いとどまるかもしれないのだ。手荷物紛失といったトラブルは無いに越したことは無いが、大事な顧客を他社にとられる前に防衛線を張ることができる。

IT技術とデータマイニング技術の進展により、このようなビッグデータの活用が、以前と比べ格段に容易で効果的になっている。こ のようなデータは使わないと損である。しかし、早まってはいけない。ビッグデータに過剰な期待は禁物である。

ビッグならば全てOKか?

データは必ずしも、“大きければよい”というものでもない。ビッグデータだからこそ威力を発揮する場面もあれば、必ずしも“ビッグでなくても良い”場合もあるのだ。

ビッグであることの利点は、何といっても無作為化(ランダム化) [ⅲ]である。通常、我々の身近にある情報は、全て何かしらの属性と紐づいている。たとえば、「ある商品の訴求力を高める改良を加えたい」なんて思ったとしたら、その改良効果について、全ての消費者がどのように感じるか“平均的”な意見を知りたいと考えるだろう。そのとき、通常は消費者を属性に分け、母集団の構成比率に対応して層化し標本を抽出し調査を行う。この属性が予めわかっているときは良いが、必ずしもわかっている場合ばかりとは限らない。わかっていたとしても、属性による層化抽出が物理的に難しいケースもある。このようなときは、データが多いと便利である。属性による“かたよりが相殺されてしまうほど”ビッグになってしまえば、そもそも母集団に近い傾向になるので標本抽出といった概念すらいらなくなってしまうのだ。

しかし、何テラバイトもの巨大なデータを収集し(最近はそのようなデータを売るビジネスもある)、解析のための設備投資をするとなると、莫大なコスト・労力がかかる。一方で、精緻な統計学の知見を活用し、上手に 無作為抽出すれば、400件程度のデータがあれば、95%位の確からしさで母集団の性質を推測することができる。400件程度であれば、ノートPC上のエクセルで十分解析可能である。また、そのくらいの規模であれば、全て直接調査が可能である。得たデータの信頼度といった観点からも標本抽出は優れている。どうだろうか?数百万円のコストでできる調査に何千万円、時には何億円もの経費をかけるのがはたして賢い選択だろうか?

“ビッグデータ”という流行言葉に惑わされることなく、自社は何を志向し、何を実現しようとしているかシッカリと見据え、基本的な統計リテラシーをベースに情報収集し活用することが必要なのではないだろうか。

〔ⅰ〕Suica®は東日本旅客鉄道株式会社の登録商標です。
〔ⅱ〕大量データを解析し、その中にある関係性やパターンなどを探し出す技術
〔ⅲ〕母集団から分析対象を取り出す際に、人の意図・意志を加えないようにする操作の仕方

お問い合わせはこちらから

ページ先頭へ

  • 導入のご相談、提案のご依頼、各種ご質問はこちらからどうぞ
  • 資料をご希望の方はこちらからどうぞ(無料)
  • デジタルカタログはこちらから
  • 官公庁・自治体職員向け研修案内
  • 総合研究所 経営管理研究所
  • グローバルマネジメント研究所
  • サンノーWebサポート
  • SuperGrace Web成績管理システム
  • マナビバサンノー
  • sannoメール登録

他のコンテンツを見る