本書では、グーグル、アマゾン、フェイスブック、ツイッターのIT企業に共通する成功要因は、データの分析力にあるという。ビッグデータとは、Volume(データ量)、 Velocity(データの生成・更新頻度)、 Variety(多様なデータ)からなる。
アメリカのスーパー、ウォルマートでは1時間当たり100万件のトランズアクションを処理し、2.5ペタバイトのデータをデータウェアハウスに蓄積して商品の在庫や価格決定の最適化を行っている。また、ツイッターのつぶやきは、ピーク時7000件/秒になっているという。因みに、1012をテラ、1015をペタ、1018をエクサといい、1ペタバイトのデータは、新聞朝刊の100万年分に相当するという。(余談、日本、中国では1012を兆、1016を京、1020を垓、・・・1060を那由多、1064を不可思議、1068を無量大数という。)
企業内外に蓄積されたデータを組織的かつ系統的に集約、整理、分析し、ビジネス上の意思決定に有用な洞察を生み出すしくみ、活動のことをビジネスインテリジェンスといい、本書のサブタイトルに「巨大なデータが戦略を決める」とあるように、あらゆる企業で、データの活用が競争力の源泉となる時代が来ている。
製造業で有名なのがコマツのコムトラックスと呼ぶ、建設機械の稼働状況の遠隔監視システムである。建設機械にセンサーやGPSを取りつけ、機械の現在位置、稼働状況、燃料の残量、消耗部品の交換時間等を収集、衛星通信、携帯電話等を使ってコマツのサーバに送信する。それを分析してユーザーに保守サービス、運転の仕方などのアドバイスをするのである。商品、サービスからデータ活用のダントツ化によって、コマツブランドの維持に貢献している。身近かなところでは、マクドナルドのワンツーワン・マーケティングがある。「とくするケータイサイト」というのに加入しているユーザーが2600万人(日本人の5人に1人)いて、顧客一人ひとりの購買履歴の分析から購買パターンに応じて、一人ひとりに内容の異なるクーポン(例えば、土日によくコーヒーを購入する顧客には、週末の朝のコーヒーが無料になる)を携帯電話に配信している。面白い活用に、ツイッター上の風邪に関するツイートを自動抽出し、気温や湿度との関連性を分析し、風邪の流行を予測するウェブサイトがある。
CPUの処理能力の向上、ハードディスクの単価の下落、大量データを高速処理するソフト「ハドュープ」等によって、時間やコストをかけずに、大量データを高速で処理することができるようになったことから、これらのビジネスモデルが可能になったのである。将来は、データの収集、分析、最適化を行うデータ・アグリゲータと呼ばれるビジネス、それに携わるデータサイエンティストが脚光を浴びる時代である。
しかしながら、いつの時代も、データ(事実)を大切にする企業風土が大切である。①従来からの常識が幅を効かせ、データの正当性が検証されない、②データ(事実)の裏付けのない意思決定をしていても批判されない(むしろ、ヒラメキ尊重)、③分析スキルを備え、データの山から宝を発掘できる人がいない、ような会社からはデータによるビジネスチャンスは生まれない。最近、アメリカでは、“Data is the new oil ” というデータの重要性を説く言葉をよく聞くという。 (杉山 哲朗)