度数分布
- ・この章で知っておくべき言葉
- ・度数分布表
- ・ヒストグラム
- ・箱ひげ図
表計算ソフトを使って計算できるってすごい!平均値や最頻値を求めるとそのデータの特徴がわかるね!
でも度数分布表の方が段階別に数を分けるから、特徴をとらえやすいと思う。
度数分布表?
そうだね。度数分布表があれば数多くのデータがあっても特徴がわかりやすくなるね。では度数分布表について説明していこう。
この章で知っておくべき言葉
階級...データの範囲のこと。
階級値...階級の中央値。
度数...その階級内のデータの個数。
度数分布表
度数分布表とはデータを範囲ごとに分割し、まとめたデータである。例えば、100点満点のテストを40人が受けたデータが横図になっていたとき、特徴をとらえにくい。
ここで度数分布表があると階級ごとに人数を分けることができるため、特徴がわかりやすくなる。実際このデータの図を見たときに61〜80点の範囲は他の範囲より人数が多いことがわかる。このように分かりにくいデータや数え切れないデータでも、度数分布表にまとめることでデータの特徴や傾向などを知ることができる。
また、度数分布表をグラフ化したヒストグラムもあるぞ。
ヒストグラム
ヒストグラムでは度数分布表をグラフにするときに使用され、データの散らばり具合を棒グラフ状にして表している。これにより度数分布表より分かりやすくデータの特徴を読み取ることができる。
うーん...棒グラフとヒストグラムってなんか似てるけど、違いって何?
棒グラフとヒストグラムの違い
棒グラフでは複数のデータを比較させてデータの大小を明示的に示すが、一方ヒストグラムは1つのデータの分布を可視化するために使われる。
また、ヒストグラムの他にも箱ひげ図を作ることもできるぞ。
箱ひげ図
箱ひげ図ではヒストグラムと同じくデータを特徴を分かりやすく伝えることができるが、ヒスグラムとの違いとしては同じ箱ひげ図のデータと比較しやすいという点だ。また、図のようにデータの下位から25%の位置の数値を表す第1四分位数、中央値(下位から50%)を表す第2四分位数、上位25%(下位から75%)を表す第3四分位数と平均値、そして最大値と最小値が表現されている。
これはヒストグラムとの違いとかあるの?
もちろんだ。
ヒストグラムと箱ひげ図の違い
ヒストグラムは1つのデータの分布を可視化するために使われるが、箱ひげ図は複数の分布を比較することに使われる。
- ①データは度数分布表にまとめることでその階級の人数を分かりやすくすることができる。
- ②ヒストグラムや箱ひげ図などのグラフや図にすることによって特徴を捉えたり、比較することができる。