統計学の基礎知識

 では、基本的なことから説明していきます。

平均

 一つのデータで値が変わるもののうち、一つ一つのデータの値をそのデータの個数で割った値のこと
5 8 3 10 4
これらの平均値は、(5+8+3+10+4)÷5=6となる。

中央値(メジアン)

 一つのデータで値が変わるもののうち、それらのデータを大きさの順に並べたときに中央の位置に来る値のこと
 なお中央に来る値が二つあるとき(データの値の数が偶数のとき)はその二つの数の平均の値を取る。
5 8 3 10 4
これらの中央値は、3 4 D 8 10となる。

最頻値(モード)

 一つのデータで値が変わるもののうち、データの中で最も個数の多い値のこと
7 7 8 8 8
これらの最頻値は、8となる。

偏差

 あるデータのうちのひとつをx1として、そのデータ全体の平均値をxと置くと、x1-xを平均値からの偏差という。
 もちろん偏差の平均を取ると0になる。
5 8 3 10 4
5の平均値からの偏差は1である。

分散

 偏差の二乗の平均の値のこと
 これはデータの値の散らばり度合いを表し、データの各値が平均値から離れるほど大きな値を取る。
5 8 3 10 4
これらの分散は{(6-5)2+(8-6)2+(6-3)2+(10-6)2+(6-4)2}÷5=6.8となる。

標準偏差

 簡単にいうと分散の平方根のこと
 分散は二乗するため、もしデータの値のそれぞれの単位がmだったときに分散はuになってしまうので平方根を取る。
5 8 3 10 4
これらの標準偏差は√6.8=2.6076…である。