ブログ

データの取り扱い

私はもともと金融数理学=Quantsをやっていました。今で言えばデータアナリストとも言えます。そのためデータに対する扱い方についてはすごく敏感だったりします。

皆さんがデータベース項目を見るとき、項目名だけで納得していないでしょうか?

実はデータを使えるかどうかは項目名だけでは判断できません。そのデータの定義はもちろんのこと、その更新タイミングまで見てはじめて使えるかどうかの判断ができるわけです。

具体的な例をあげます。

私自身は金融系でしたので、株式の予想データを使うことがあります。
何も知らない人であれば、単純に「あ、予想データがあるんだ。じゃ、実績ではなくてこちらを使おう」となります。

ですが、よく考えてみてください。

その会社の決算月はいつですか?3月ですか?9月ですか?それとも12月?
その予想データはいつの予想データを指しているのですか?

つまり、そのデータがどのように作られるか知らないと正しい分析ができないということなのです。

「そこにあるから使える、使ってい良いというわけではない。」
データを扱う人間であれば、これについて神経質になりすぎるくらいの方が正しいです。

 

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

CAPTCHA


PAGE TOP