統計学の基礎知識
では、基本的なことから説明していきます。
平均
一つのデータで値が変わるもののうち、一つ一つのデータの値をそのデータの個数で割った値のこと
例
5 8 3 10 4
これらの平均値は、(5+8+3+10+4)÷5=6となる。
中央値(メジアン)
一つのデータで値が変わるもののうち、それらのデータを大きさの順に並べたときに中央の位置に来る値のこと
なお中央に来る値が二つあるとき(データの値の数が偶数のとき)はその二つの数の平均の値を取る。
例
5 8 3 10 4
これらの中央値は、3 4 D 8 10となる。
最頻値(モード)
一つのデータで値が変わるもののうち、データの中で最も個数の多い値のこと
例
7 7 8 8 8
これらの最頻値は、8となる。
偏差
あるデータのうちのひとつをx1として、そのデータ全体の平均値をxと置くと、x1-xを平均値からの偏差という。
もちろん偏差の平均を取ると0になる。
例
5 8 3 10 4
5の平均値からの偏差は1である。
分散
偏差の二乗の平均の値のこと
これはデータの値の散らばり度合いを表し、データの各値が平均値から離れるほど大きな値を取る。
例
5 8 3 10 4
これらの分散は{(6-5)
2+(8-6)
2+(6-3)
2+(10-6)
2+(6-4)
2}÷5=6.8となる。
標準偏差
簡単にいうと分散の平方根のこと
分散は二乗するため、もしデータの値のそれぞれの単位がmだったときに分散はuになってしまうので平方根を取る。
例
5 8 3 10 4
これらの標準偏差は√6.8=2.6076…である。