Master KTさん『データドリブンの極意 〜Tableauブートキャンプで学ぶデータを「読む」「語る」力 』技術評論社(2021)から、受託型専業プランナーの仕事に活かせそうなポイントをメモしてみました。
企業にデータドリブンマインドを生み出したり、仕組みづくりを推進したりしようとする方々に対して、tableau(タブロー)愛をお持ちの筆者ならではの視点で、その方法論をレクチャーする内容です。「人に教えること」を教えるというところで、データを扱ったことのない新人社員などにもレクチャーする際にも参考になるでしょう。
最低もつべきデータリテラシー
データストーリーテリング:データの背景にあるストーリーを導ける
データビジュアライゼーション:最適な表現を選べる/視覚的表現から理解できる
データの基礎プロファイル:データがどんな行動の結果であるか粒度などを把握できる
分析プラットフォーム:データや分析結果、意見が共有されることで文化が醸成されることを理解できる
「データストーリーテリング」という言い方に非常に共感しました。個人的には、ストーリーを導く力というよりは、データからストーリーを編み出す力ではないかと思っています。おそらく、上手な問いかけと仮説力(総じてアブダクション力)が重要になるのでは?と考えています。
データ分析のポイント
データストーリーテリングを行う際には
- ディメンジョン(側面:時間・場所・人・モノなどのカテゴリに区分できる)
- メジャー(数値:売上や利益などの数字)
に分けて考える。
分析対象のデータには、ディメンジョンとメジャーがどのくらいあるかを把握しておくこと。分析する際には、データをキューブ(立方体)に例えて、
- スライス(切り取り:ある軸でフィルターをかける)したり、
- ダイズ(転がす:いろいろなディメンジョンを掛け合わせる)したりする。
さらに、深堀(ドリルダウン)や横堀(ドリルスルー)をして分析する。いずれにしても、マスターデータマネジメント(MDM)がきちんとできていないと、いざというときに使い物にならないし、深堀・横堀していくときに欲しい情報が入手できない。
こういったデータ分析のスキルを身につけるトレーニングは、筋トレと同じで、現在どの部分のスキルを使って何をしているのか?を意識することが大事だと書かれています。データから情報へのまとめ方、ビジュアライゼーションなどは、他の本にも詳しいので割愛します。
目的を見失わない
「仕事の目的→データを抽出→どう見せるかを選定する→データを見る→発見がある→共有する・行動する」というタスクがあるが、→の順にきれいに動くはずはなく、あちこち行き来しながら、目的を達成する。目的がデータ抽出や分析にならないようにすること。結果的に目的が的外れであっても、それは新しい知見につながる。
過去の情報系システム
- 基幹系システム:データを正確に漏れなく、その瞬間に記録する
- 過去の情報系システム:入力されたデータを参照する
基幹―ETL-DWH-DM/Cube-BI
- ETL(Extract Transform Load)基幹システムからデータを取得する
- DWH(Data Warehouse):取得したデータをためておく
- DM(Data Mart):ある程度集計された全体感が見えるデータをためておく
- Cube:複数の切り口の掛け合わせであらかじめ集計されたデータをためておく
- BI(Business Intelligence):ためたデータを引き出して参照する
※DMとCubeの容量、スピード、分析の柔軟性に限界があり、最近は大きなデータをそのまま処理する方法(Data Lakeの設置)がとられている。
特にカーディナリー(Cardinality:濃度)が高い・低い=データ分析の粒度が小さい・大きいを柔軟に変化させて分析できることが重要なケースもあり、これまでのDMやCubeなどでは、対応しにくくなったというのが、理由のようです。
最近の情報系システム
基幹―DataLake-DWH-BI
※ELT(Extract Load Transform)技術がData Lakeに入っている
※構造化データ(行と列で構造化された)だけでなく、半構造化データ(ログ、JSON形式)、構造化できないデータ(画像、動画、音源、ドキュメント)も処理する。
少し対話形式の本は読みにくいかなと思いましたが、データドリブン組織文化を作っていくうえで、的確に要点を突いた内容となっておりスタッフの目線合わせには良い本だと思います。
