意味からわかる高校受験

データの活用とは何か?

平均値・中央値・最頻値・箱ひげ図を、基礎からやさしく解説

このページで学ぶこと

データの活用とは、集めた数値を整理して、特徴を読み取る学習です。
データの問題が苦手な子は、
「平均値と中央値の違いがわからない」
「最頻値って何?」
「度数分布表の読み方がわからない」
「相対度数の計算で止まる」
「箱ひげ図のどこを見ればいいかわからない」
「問題文が長くて、何を答えればいいかわからない」
というところで止まりやすいです。 このページでは、データの用語をひとつずつ確認しながら、表やグラフの読み取り方をやさしく説明します。

図で見る:データの読み方

このページの大事な考え方を、図で先に確認しましょう。

データを表とグラフで読む図。
データ問題では、数字そのものだけでなく、増え方・減り方・差に注目します。

データとは何か?

データとは、調べたり測ったりして集めた数や情報のことです。 たとえば、
テストの点数
身長
走ったタイム
1日の勉強時間
気温
アンケートの結果
などがデータです。 データの活用では、このような数を整理して、
どんな特徴があるか
どちらのグループが高いか
どのあたりに集まっているか
ばらつきは大きいか
を読み取ります。
データの活用は、計算だけでなく「読み取る力」も大切です。

代表値とは何か?

代表値とは、データ全体の特徴を代表する値です。 中学でよく使う代表値は、次の3つです。
平均値
中央値
最頻値
名前 意味 見るポイント
平均値 全部を足して、個数で割った値 全体をならした値
中央値 小さい順に並べたとき、真ん中にくる値 真ん中の人・真ん中のデータ
最頻値 一番多く出てくる値 一番よく出る値
代表値は、データ全体をひとことで表すための値です。

平均値とは何か?

平均値とは、全部の値を足して、データの個数で割った値です。
平均値 = データの合計 データの個数
たとえば、5人のテストの点数が、
60点、70点、80点、90点、100点
だとします。 合計は、
60 + 70 + 80 + 90 + 100 = 400
です。 5人分なので、
400 ÷ 5 = 80
です。
平均値は80点です。

中央値とは何か?

中央値とは、データを小さい順に並べたとき、真ん中にくる値です。 たとえば、
4、6、7、9、10
という5つのデータでは、真ん中は7です。
中央値は7です。
データの個数が偶数のときは、真ん中が2つになります。 たとえば、
4、6、7、9
なら、真ん中は6と7です。 この2つの平均をとります。
(6 + 7) ÷ 2 = 6.5
データの個数が偶数のときは、真ん中2つの平均が中央値です。

最頻値とは何か?

最頻値とは、データの中で一番多く出てくる値です。 たとえば、
2、3、3、4、5、5、5、6
では、5が一番多く出ています。
最頻値は5です。
最頻値は、1つとは限りません。 同じ回数で一番多く出る値が複数ある場合もあります。
最頻値は「一番大きい値」ではありません。
「一番多く出てくる値」です。

範囲とは何か?

範囲とは、データの最大値と最小値の差です。
範囲 = 最大値 - 最小値
たとえば、
12、15、18、20、27
というデータでは、最大値は27、最小値は12です。
27 - 12 = 15
範囲は15です。
範囲を見ると、データがどれくらい広がっているかがわかります。

外れ値に注意

データの中に、ほかの値から大きく離れた値があることがあります。 これを外れ値と呼ぶことがあります。 たとえば、
60、65、70、75、100
では、100がほかの値より大きく離れています。 このような値があると、平均値が大きく変わることがあります。
平均値は外れ値の影響を受けやすいです。
中央値は外れ値の影響を受けにくいです。
データを読むときは、平均値だけで判断しないことも大切です。

度数分布表とは何か?

度数分布表とは、データをいくつかの階級に分けて、それぞれに何個のデータがあるかを表にしたものです。
階級 度数
0点以上20点未満 2人
20点以上40点未満 4人
40点以上60点未満 8人
60点以上80点未満 5人
80点以上100点以下 1人
ここで、
階級:データを分ける区間
度数:その階級に入るデータの個数
です。
「20点以上40点未満」は、20点は入りますが、40点は入りません。

相対度数とは何か?

相対度数とは、全体の中で、その階級に入るデータがどれくらいの割合かを表す数です。
相対度数 = その階級の度数 度数の合計
たとえば、全体が20人で、ある階級の度数が5人なら、
5 ÷ 20 = 0.25
です。
相対度数は0.25です。
これは全体の25%という意味です。
相対度数は、割合の考え方とつながっています。

ヒストグラムとは何か?

ヒストグラムとは、度数分布表をグラフにしたものです。 横軸に階級、縦軸に度数をとり、棒で表します。
0-20 20-40 40-60 60-80 80-100 度数 階級 ヒストグラム
ヒストグラムを見ると、どの階級にデータが多いかがわかります。

累積度数とは何か?

累積度数とは、ある階級までの度数を順番に足していったものです。 たとえば、次のような度数分布表があります。
階級 度数 累積度数
0以上10未満 3 3
10以上20未満 5 8
20以上30未満 7 15
30以上40未満 5 20
2つ目の累積度数8は、
3 + 5 = 8
です。
累積度数は、そこまでに何個あるかを表します。

箱ひげ図とは何か?

箱ひげ図とは、データの散らばり方をわかりやすく表す図です。 箱ひげ図では、次の5つをよく見ます。
最小値
第1四分位数
中央値
第3四分位数
最大値
最小値 第1四分位数 中央値 第3四分位数 最大値 箱ひげ図
箱ひげ図は、データの真ん中あたりや、ばらつきを見るための図です。

四分位数とは何か?

四分位数とは、データを小さい順に並べて、4つの部分に分けるときの区切りの値です。 よく使うのは次の3つです。
名前 意味
第1四分位数 小さいほうから4分の1あたりの値
第2四分位数 中央値のこと
第3四分位数 小さいほうから4分の3あたりの値
第2四分位数は、中央値と同じです。

四分位範囲とは何か?

四分位範囲とは、第3四分位数から第1四分位数を引いた値です。
四分位範囲 = 第3四分位数 - 第1四分位数
たとえば、第1四分位数が20、第3四分位数が35なら、
35 - 20 = 15
です。
四分位範囲が大きいほど、真ん中あたりのデータのばらつきが大きいと考えられます。

箱ひげ図の読み取り方

箱ひげ図では、次のようなことを読み取ります。
中央値はどこか
最大値・最小値はどこか
箱の幅は大きいか小さいか
ひげは長いか短いか
どちら側にデータが広がっているか
箱の部分は、データの真ん中あたりの半分を表します。
箱ひげ図では、箱が大きいほど人数が多い、という意味ではありません。
箱の幅は、データのばらつきの大きさを表します。

データの問題を解く流れ

データの問題は、次の順番で見ると解きやすくなります。
  1. 何を聞かれているか確認する
  2. 平均値・中央値・最頻値・範囲のどれを使うか考える
  3. 表やグラフの数字を正確に読む
  4. 「以上」「未満」に注意する
  5. 割合や相対度数なら、全体を確認する
  6. 箱ひげ図なら、中央値・四分位数・最大値・最小値を見る
データの問題は、計算よりも「どこを読むか」が大切なことが多いです。

例題1:平均値

5人の点数が、60点、70点、80点、80点、90点でした。
平均値を求めなさい。
まず、全部足します。
60 + 70 + 80 + 80 + 90 = 380
5人分なので、5で割ります。
380 ÷ 5 = 76
答え:76点

例題2:中央値

次のデータの中央値を求めなさい。
12、8、15、10、20
まず、小さい順に並べます。
8、10、12、15、20
真ん中の値は12です。
答え:12

例題3:最頻値

次のデータの最頻値を求めなさい。
3、4、4、5、5、5、6、7
一番多く出てくる値は5です。
答え:5

例題4:相対度数

全体が40人で、ある階級の度数が8人です。
この階級の相対度数を求めなさい。
相対度数は、
その階級の度数 ÷ 全体の度数
です。 だから、
8 ÷ 40 = 0.2
答え:0.2

例題5:四分位範囲

第1四分位数が18、第3四分位数が42です。
四分位範囲を求めなさい。
四分位範囲は、
第3四分位数 - 第1四分位数
です。
42 - 18 = 24
答え:24

データの活用でよくあるつまずき

間違いやすい考え方

・平均値だけで判断する
・中央値を出す前に並べ替えない
・最頻値を一番大きい値だと思う
・範囲を最大値+最小値にする
・相対度数で全体を確認しない
・箱ひげ図の箱の大きさを人数だと思う

正しい考え方

・平均値は外れ値に注意する
・中央値は小さい順に並べてから求める
・最頻値は一番多く出る値
・範囲は最大値−最小値
・相対度数は度数÷合計
・箱の幅はばらつきを表す
データの問題が苦手な子は、まず「何を求める問題か」を言葉で確認しましょう。

確認問題

問題1
平均値の求め方を答えましょう。
問題2
5、8、10、12、15 の中央値を求めましょう。
問題3
2、3、3、4、4、4、5 の最頻値を求めましょう。
問題4
7、10、12、18、21 の範囲を求めましょう。
問題5
全体が50人で、ある階級の度数が15人です。相対度数を求めましょう。
問題6
第1四分位数が12、第3四分位数が30です。四分位範囲を求めましょう。

答え

問題1:データの合計 ÷ データの個数
問題2:10
問題3:4
問題4:21 - 7 = 14
問題5:15 ÷ 50 = 0.3
問題6:30 - 12 = 18

まとめ

データの活用は、表やグラフから情報を読み取る単元です。
データとは、集めた数や情報のことです。
平均値は、データの合計を個数で割った値です。
中央値は、小さい順に並べたとき真ん中にくる値です。
最頻値は、一番多く出てくる値です。
範囲は、最大値−最小値です。
度数分布表は、階級ごとの度数を表した表です。
相対度数は、その階級の度数を全体の度数で割った値です。
箱ひげ図は、データの散らばり方を見る図です。
四分位範囲は、第3四分位数−第1四分位数です。
データの問題が苦手なときは、あわてて計算せず、「平均値を聞かれているのか」「中央値を聞かれているのか」「表のどこを読むのか」を確認しましょう。

次に学びたい内容