これくらいのデータでも統計取れますか?

f:id:statistics529:20200624233256j:plain

「どうしてもデータが少ししか集まらない」

「データ収集にお金がかかってしまう」

 

こんな時でも統計的に検証することはできるのでしょうか?

 

こんにちは!

 

はやとです

 

どうしてもデータをとることが難しく、

10くらいのデータしか収集することができなかった時でも

実は検証することはできます。

 

もちろん、

データの数が多いほど

正確な検証ができるので、

参考になるかどうかは数字ひとつ

違うだけで大きく左右されます。

 

例えば、下の表を見てみて下さい。

 

f:id:statistics529:20200624185926p:plain

 

今回は、「労働時間が長ければ出世するのか」

について相関があるのかという事を

題材にして考えてみたいと思います。

 

上の表において、

合計12人が調査の対象になったという事が分かります。

この12人の中で出世をしたのは6人なので、

その6人の内訳が12時間以上労働していた人に

関係性があるのかを

調べるという考え方を用いるのです。

 

今回、「出世する」「出世しない」の人数がそれぞれ6人ずつ

になっています。

 

このうち、6人を無作為に抽出して、

4人以上が12時間以上働くという

確率がいくらかという事を

求める考え方です。

 

そしてそれらの確立をすべて足し合わせると、

28.4%になります。

 

このことから、

関係がないとは言えないものの、

統計で判断の基準とされる5%を

大幅に上回ってしまっているので、

これでは誤差で出てきた結果だと判断する方が

良いと結論付けることができます。

 

ですが、仮に下の様に結果が違っていた場合、

同様の計算をすれば、0.8%となり、

労働時間が12時間以上ならば、

出世すると結論付けることができるのです。

 

f:id:statistics529:20200624233157p:plain

このように、データの数が例え少なくとも

ある程度の分析をすることができます。

 

以上の知識は、高校数学で習う

確率の知識があれば考えることができる内容になっています。

 

なので、まずは確率を学ぶことを

お勧めしたいと思います。

確率は感覚的にできてしまいそうで

できないことによって

苦手な人が多くいます。

 

確率についての記事は以前にも書きましたので、

いかに感覚ではなく

論理的に考える必要があるか、

実感してみて下さい!

 

statistics529.hatenablog.com

 

それではまた!