どれほど強い関係かをどう表現できますか?

f:id:statistics529:20200611011352j:plain

こんにちは!

 

はやとです。

 

前回のブログから

基礎統計の4分野について

詳しくお話をしています。

statistics529.hatenablog.com

 

本日は第2弾!

 

相関

 

についてです!

 

相関とは、2つの指標について

関係があるか、無いかを調べる考え方のことです。

 

 

年齢と血圧の関係や

 

親の年収と子供の学歴、

 

売り上げと商品陳列

 

などが代表例になります。

 

ただ、

現実問題、上のような例のように

誰もが納得するような

明快な関係が見えるとは限りませんよね。

 

ですが、実は

その相関の度合いを

数値化して評価することができる

便利なものがあるのです!

 

それが

 

相関係数

 

というものです。

 

f:id:statistics529:20200611011556p:plain

 

相関係数とは、

1から-1

までの間で

相関の強さの度合いを

表します。

 

ですが、ここで注意しなくてはならないのが、

-1だと相関がないという

訳ではないという事です。

むしろ

強い負の相関を持つ

という表現をします。

f:id:statistics529:20200611011646p:plain

 

一方、下のグラフは

先ほどに比べれば

少しだけデータにばらつきがありますね。

f:id:statistics529:20200611011716p:plain

ここで相関係数を調べてみると、

 

相関係数は0.89

 

となり、

やはり上のものと比べれば

弱い相関になっていることが

数値として表されます。

 

こうして、

どれほどの

関係性の強さがあるのかを

数字で評価することができるのです。

 

これらの図は

エクセルにデータを打ち込めば

簡単に出すことができます。

 

また、相関係数

関数というものを使えば

小難しい式を覚えていなくとも

出すことができます。

 

試しに

 

=CORREL(A2:A11,B2:B11)

 

と打ち込んでみて下さい。

 

f:id:statistics529:20200611011931p:plain

 

ぜひ一度職場にあるデータを

2つ組み合わせて

相関をとってみて下さい。

 

月別の売り上げや

 時間ごとの利用率

年齢別の購入額など

 

何でも構いません。

エクセルに数を入力すれば

分かりやすく

図を出してくれます。

 

相関係数の公式や

求め方などは一旦置いておいて、

まずは実験をしてみて下さい!

 

 

次回は基本統計の4要素の後半

検定と回帰について

お話していきます。

 

それではまた!