統計学の応用知識
ここでは、応用的な知識について説明します。応用的な知識というのは主に二つのデータが組み合わさったものの用語について説明します。、
質的変数
統計学において平均が取れないデータのこと
例
あなたはビックデータを知っていますか?
「はい」・・・8人
「いいえ」・・250人
量的変数
統計学において平均の取れるデータのこと
例
あなたの身長はいくつですか?
168cm 190cm 193cm 174cm 178cm
共分散
二つのデータの偏差の積の平均のこと
例
木の太さと高さの関係
| 木1 | 木2 | 木3 | 木4 | 木5 | 平均 | 分散 | 標準偏差 |
太さ | 22 | 27 | 29 | 19 | 33 | 26 | 24.8 | √24.8 |
高さ | 13 | 15 | 18 | 14 | 20 | 16 | 6.8 | √6.8 |
この値の共分散は、
{(22-26)(13-16)+(27-26)(15-16)+(29-26)(18-16)+(19-26)(14-16)+(33-26)(20-16)}÷5=59÷5=11.8
となる。
相関係数
二つのデータの相関関係を表し、共分散を標準偏差同士の積で割った値のこと
相関係数rは必ず-1≦r≦1の間の値を取る。また相関係数rには3つの性質がある。
(?)rの値が1に近いとき、強い正の相関関係がある
(ひとつのデータの値が大きくなれば、もう一つのデータの値も大きくなる)
(?)rの値が0に近いとき、相関関係はない
(二つのデータに関係性はない)
(?)rの値が-1に近いとき、強い負の相関関係がある
(ひとつのデータの値が大きくなれば、もう一つのデータの値は小さくなる)
例
共分散の例をつかう。
r=11.8÷(√24.8√6.8)≒0.91
これより木の太さと高さには強い正の相関関係があると考えられる。