統計学の応用知識

 ここでは、応用的な知識について説明します。応用的な知識というのは主に二つのデータが組み合わさったものの用語について説明します。、

質的変数

 統計学において平均が取れないデータのこと
あなたはビックデータを知っていますか?
「はい」・・・8人
「いいえ」・・250人

量的変数

 統計学において平均の取れるデータのこと
あなたの身長はいくつですか?
168cm 190cm 193cm 174cm 178cm

共分散

 二つのデータの偏差の積の平均のこと
木の太さと高さの関係
木1木2木3木4木5平均分散標準偏差
太さ22272919332624.8√24.8
高さ1315181420166.8√6.8

この値の共分散は、
{(22-26)(13-16)+(27-26)(15-16)+(29-26)(18-16)+(19-26)(14-16)+(33-26)(20-16)}÷5=59÷5=11.8
となる。

相関係数

 二つのデータの相関関係を表し、共分散を標準偏差同士の積で割った値のこと
相関係数rは必ず-1≦r≦1の間の値を取る。また相関係数rには3つの性質がある。
 (?)rの値が1に近いとき、強い正の相関関係がある
  (ひとつのデータの値が大きくなれば、もう一つのデータの値も大きくなる)
 (?)rの値が0に近いとき、相関関係はない
  (二つのデータに関係性はない)
 (?)rの値が-1に近いとき、強い負の相関関係がある
  (ひとつのデータの値が大きくなれば、もう一つのデータの値は小さくなる)
共分散の例をつかう。
r=11.8÷(√24.8√6.8)≒0.91
これより木の太さと高さには強い正の相関関係があると考えられる。