これくらいのデータでも統計取れますか?
「どうしてもデータが少ししか集まらない」
「データ収集にお金がかかってしまう」
こんな時でも統計的に検証することはできるのでしょうか?
こんにちは!
はやとです
どうしてもデータをとることが難しく、
10くらいのデータしか収集することができなかった時でも
実は検証することはできます。
もちろん、
データの数が多いほど
正確な検証ができるので、
参考になるかどうかは数字ひとつ
違うだけで大きく左右されます。
例えば、下の表を見てみて下さい。
今回は、「労働時間が長ければ出世するのか」
について相関があるのかという事を
題材にして考えてみたいと思います。
上の表において、
合計12人が調査の対象になったという事が分かります。
この12人の中で出世をしたのは6人なので、
その6人の内訳が12時間以上労働していた人に
関係性があるのかを
調べるという考え方を用いるのです。
今回、「出世する」「出世しない」の人数がそれぞれ6人ずつ
になっています。
このうち、6人を無作為に抽出して、
4人以上が12時間以上働くという
確率がいくらかという事を
求める考え方です。
そしてそれらの確立をすべて足し合わせると、
28.4%になります。
このことから、
関係がないとは言えないものの、
統計で判断の基準とされる5%を
大幅に上回ってしまっているので、
これでは誤差で出てきた結果だと判断する方が
良いと結論付けることができます。
ですが、仮に下の様に結果が違っていた場合、
同様の計算をすれば、0.8%となり、
労働時間が12時間以上ならば、
出世すると結論付けることができるのです。
このように、データの数が例え少なくとも
ある程度の分析をすることができます。
以上の知識は、高校数学で習う
確率の知識があれば考えることができる内容になっています。
なので、まずは確率を学ぶことを
お勧めしたいと思います。
確率は感覚的にできてしまいそうで
できないことによって
苦手な人が多くいます。
確率についての記事は以前にも書きましたので、
いかに感覚ではなく
論理的に考える必要があるか、
実感してみて下さい!
それではまた!