どこでも「ビッグデータ解析」とか言われるようになりました。
いろんなツールも出てきており、だれでもデータ解析できるようになってきたようです。
ですが、本当の意味のデータ解析をしている人は・・・・?
実はあまりいないと言うのが答え。
解析ツールをぶん回しても、数字、データを単にひねくり回したようなものです。
データ解析の対象を熟知する必要がある
データ解析を行うには、その対象となるものの動きを熟知していないとできないのです。
つまり業務を知らないとできないということ。
具体例を挙げます。
月末の数字は月末に正しく入っているのか?
例えば、企業の売上のデータを分析することを考えます。データベースのテーブルを見ると、月末の売上データと言う項目があります。
さて、この分析を考えたとき、当月末日で分析したとき、データは入っていますでしょうか?
単に数字しか見ていない分析者だとしたら、単に数字が入っていれば、「データはある。」と判断するかもしれません。
ちょっとわかっている人だと、「月末その日だとまだデータは入っていないのでは?はいっていても怪しいかも?」と思うかもしれませんね。
では、「確定情報」はいつ入るのでしょう?
通常の場合、月末のデータが固まるのは翌月の数営業日と考えられます。データの修正などが入る可能性もあるからです。また、月末前に誰かが想定値を入れてしまう可能性もあります。
つまり、現実の業務フローを知らなければ、何の情報を分析しているかわからないと言うことなのです。
別の例を挙げましょう。
セブンイレブンのレジには二列のボタンがあることを知っている方も多いと思います。これ、色の違いが性別。数字が年齢レンジを表しているのですね。このボタンを押さないとレジが開かない仕組みになっています。要は、店員さんはお客様を見て、年齢、性別を入れていると言うことです。
これにより、何時にどの性別、年齢の人が何を買ったのがわかるわけです。
全て正しく入っていれば信頼できますが、現実には、店員がいい加減に入れている可能性もあるわけです。
このような実情を知らない人が、このデータは正しいと思い込んで分析したら、どうなるでしょうか?そのデータの信頼度はどの程度正しいのでしょう?その状態で、コンマ何%の数字をあげることはどれだけ正しいのか?
私は証券系の金融データを扱っていました。そこでは皆さんも良く知っている、企業の予想利益情報と言うのがあります。何気なく、分析している人がいますが、これも厳密にいうと、
- この3月期末の予想データはいつ予想されているのか?
を認識している人がどれくらいいるでしょうか?
また、
- 3月末決算の企業データと9月末、12月末決算の企業データを比べるのは正しいのかどうか?
と考える人はどれくらいいるでしょう?
つまり、データとはどのように生成されているのかを認識せずに分析すると言うことは、大きな間違いであることがすぐにわかると思います。このことを認識していない自称「データアナリスト」が実に多いのです。まぁ、そういう方々はデータアナリストでもなんでもなく、単に「ツール使い」なわけですが・・・
真のデータマネージャが必要な理由
対象となる人々の行動様式がわからないと、いくら分析しても「無意味なデータいじり」になりかねません。本当のデータアナリスト、データマネージャとは「なぜそういうデータになるのか?」というところまで考える人間です。
実は、これがBIツールがきちんと稼働しない大きな理由なわけです。RPAなどもそうですね。対象となるデータソースのデータ入力業務を知らなければ、出てくる結果も「?」なわけです。
つまり、「ビッグデータ」をそのまま数字として扱っていたのでは、間違った結果を導き出してしまうと言うこと。そのデータの生い立ちすべてを知って初めて意味のある結果を見出すことができると言うことです。
ベンダーに高い分析ツールを買わされ、そのツールがそこそこ分析結果が出してしまうのを見て「やった気」になってしまってませんか?
だとしたら、それは単に「数字いじり」です。
もし、そのような解析だけやっていたとしたら・・・そのビッグデータ解析は無意味であるということです。
この記事へのコメントはありません。