このページで学ぶこと
データの活用とは、集めた数値を整理して、特徴を読み取る学習です。
データの問題が苦手な子は、
「平均値と中央値の違いがわからない」
「最頻値って何?」
「度数分布表の読み方がわからない」
「相対度数の計算で止まる」
「箱ひげ図のどこを見ればいいかわからない」
「問題文が長くて、何を答えればいいかわからない」
というところで止まりやすいです。
このページでは、データの用語をひとつずつ確認しながら、表やグラフの読み取り方をやさしく説明します。
図で見る:データの読み方
このページの大事な考え方を、図で先に確認しましょう。
データ問題では、数字そのものだけでなく、増え方・減り方・差に注目します。
データとは何か?
データとは、調べたり測ったりして集めた数や情報のことです。
たとえば、
テストの点数
身長
走ったタイム
1日の勉強時間
気温
アンケートの結果
などがデータです。
データの活用では、このような数を整理して、
どんな特徴があるか
どちらのグループが高いか
どのあたりに集まっているか
ばらつきは大きいか
を読み取ります。
データの活用は、計算だけでなく「読み取る力」も大切です。
代表値とは何か?
代表値とは、データ全体の特徴を代表する値です。
中学でよく使う代表値は、次の3つです。
平均値
中央値
最頻値
| 名前 |
意味 |
見るポイント |
| 平均値 |
全部を足して、個数で割った値 |
全体をならした値 |
| 中央値 |
小さい順に並べたとき、真ん中にくる値 |
真ん中の人・真ん中のデータ |
| 最頻値 |
一番多く出てくる値 |
一番よく出る値 |
代表値は、データ全体をひとことで表すための値です。
平均値とは何か?
平均値とは、全部の値を足して、データの個数で割った値です。
平均値 =
データの合計
データの個数
たとえば、5人のテストの点数が、
60点、70点、80点、90点、100点
だとします。
合計は、
60 + 70 + 80 + 90 + 100 = 400
です。
5人分なので、
400 ÷ 5 = 80
です。
平均値は80点です。
中央値とは何か?
中央値とは、データを小さい順に並べたとき、真ん中にくる値です。
たとえば、
4、6、7、9、10
という5つのデータでは、真ん中は7です。
中央値は7です。
データの個数が偶数のときは、真ん中が2つになります。
たとえば、
4、6、7、9
なら、真ん中は6と7です。
この2つの平均をとります。
(6 + 7) ÷ 2 = 6.5
データの個数が偶数のときは、真ん中2つの平均が中央値です。
最頻値とは何か?
最頻値とは、データの中で一番多く出てくる値です。
たとえば、
2、3、3、4、5、5、5、6
では、5が一番多く出ています。
最頻値は5です。
最頻値は、1つとは限りません。
同じ回数で一番多く出る値が複数ある場合もあります。
最頻値は「一番大きい値」ではありません。
「一番多く出てくる値」です。
範囲とは何か?
範囲とは、データの最大値と最小値の差です。
範囲 = 最大値 - 最小値
たとえば、
12、15、18、20、27
というデータでは、最大値は27、最小値は12です。
27 - 12 = 15
範囲は15です。
範囲を見ると、データがどれくらい広がっているかがわかります。
外れ値に注意
データの中に、ほかの値から大きく離れた値があることがあります。
これを外れ値と呼ぶことがあります。
たとえば、
60、65、70、75、100
では、100がほかの値より大きく離れています。
このような値があると、平均値が大きく変わることがあります。
平均値は外れ値の影響を受けやすいです。
中央値は外れ値の影響を受けにくいです。
データを読むときは、平均値だけで判断しないことも大切です。
度数分布表とは何か?
度数分布表とは、データをいくつかの階級に分けて、それぞれに何個のデータがあるかを表にしたものです。
| 階級 |
度数 |
| 0点以上20点未満 |
2人 |
| 20点以上40点未満 |
4人 |
| 40点以上60点未満 |
8人 |
| 60点以上80点未満 |
5人 |
| 80点以上100点以下 |
1人 |
ここで、
階級:データを分ける区間
度数:その階級に入るデータの個数
です。
「20点以上40点未満」は、20点は入りますが、40点は入りません。
相対度数とは何か?
相対度数とは、全体の中で、その階級に入るデータがどれくらいの割合かを表す数です。
相対度数 =
その階級の度数
度数の合計
たとえば、全体が20人で、ある階級の度数が5人なら、
5 ÷ 20 = 0.25
です。
相対度数は0.25です。
これは全体の25%という意味です。
相対度数は、割合の考え方とつながっています。
ヒストグラムとは何か?
ヒストグラムとは、度数分布表をグラフにしたものです。
横軸に階級、縦軸に度数をとり、棒で表します。
ヒストグラムを見ると、どの階級にデータが多いかがわかります。
累積度数とは何か?
累積度数とは、ある階級までの度数を順番に足していったものです。
たとえば、次のような度数分布表があります。
| 階級 |
度数 |
累積度数 |
| 0以上10未満 |
3 |
3 |
| 10以上20未満 |
5 |
8 |
| 20以上30未満 |
7 |
15 |
| 30以上40未満 |
5 |
20 |
2つ目の累積度数8は、
3 + 5 = 8
です。
累積度数は、そこまでに何個あるかを表します。
箱ひげ図とは何か?
箱ひげ図とは、データの散らばり方をわかりやすく表す図です。
箱ひげ図では、次の5つをよく見ます。
最小値
第1四分位数
中央値
第3四分位数
最大値
箱ひげ図は、データの真ん中あたりや、ばらつきを見るための図です。
四分位数とは何か?
四分位数とは、データを小さい順に並べて、4つの部分に分けるときの区切りの値です。
よく使うのは次の3つです。
| 名前 |
意味 |
| 第1四分位数 |
小さいほうから4分の1あたりの値 |
| 第2四分位数 |
中央値のこと |
| 第3四分位数 |
小さいほうから4分の3あたりの値 |
第2四分位数は、中央値と同じです。
四分位範囲とは何か?
四分位範囲とは、第3四分位数から第1四分位数を引いた値です。
四分位範囲 = 第3四分位数 - 第1四分位数
たとえば、第1四分位数が20、第3四分位数が35なら、
35 - 20 = 15
です。
四分位範囲が大きいほど、真ん中あたりのデータのばらつきが大きいと考えられます。
箱ひげ図の読み取り方
箱ひげ図では、次のようなことを読み取ります。
中央値はどこか
最大値・最小値はどこか
箱の幅は大きいか小さいか
ひげは長いか短いか
どちら側にデータが広がっているか
箱の部分は、データの真ん中あたりの半分を表します。
箱ひげ図では、箱が大きいほど人数が多い、という意味ではありません。
箱の幅は、データのばらつきの大きさを表します。
データの問題を解く流れ
データの問題は、次の順番で見ると解きやすくなります。
- 何を聞かれているか確認する
- 平均値・中央値・最頻値・範囲のどれを使うか考える
- 表やグラフの数字を正確に読む
- 「以上」「未満」に注意する
- 割合や相対度数なら、全体を確認する
- 箱ひげ図なら、中央値・四分位数・最大値・最小値を見る
データの問題は、計算よりも「どこを読むか」が大切なことが多いです。
例題1:平均値
5人の点数が、60点、70点、80点、80点、90点でした。
平均値を求めなさい。
まず、全部足します。
60 + 70 + 80 + 80 + 90 = 380
5人分なので、5で割ります。
380 ÷ 5 = 76
答え:76点
例題2:中央値
次のデータの中央値を求めなさい。
12、8、15、10、20
まず、小さい順に並べます。
8、10、12、15、20
真ん中の値は12です。
答え:12
例題3:最頻値
次のデータの最頻値を求めなさい。
3、4、4、5、5、5、6、7
一番多く出てくる値は5です。
答え:5
例題4:相対度数
全体が40人で、ある階級の度数が8人です。
この階級の相対度数を求めなさい。
相対度数は、
その階級の度数 ÷ 全体の度数
です。
だから、
8 ÷ 40 = 0.2
答え:0.2
例題5:四分位範囲
第1四分位数が18、第3四分位数が42です。
四分位範囲を求めなさい。
四分位範囲は、
第3四分位数 - 第1四分位数
です。
42 - 18 = 24
答え:24
データの活用でよくあるつまずき
間違いやすい考え方
・平均値だけで判断する
・中央値を出す前に並べ替えない
・最頻値を一番大きい値だと思う
・範囲を最大値+最小値にする
・相対度数で全体を確認しない
・箱ひげ図の箱の大きさを人数だと思う
正しい考え方
・平均値は外れ値に注意する
・中央値は小さい順に並べてから求める
・最頻値は一番多く出る値
・範囲は最大値−最小値
・相対度数は度数÷合計
・箱の幅はばらつきを表す
データの問題が苦手な子は、まず「何を求める問題か」を言葉で確認しましょう。
確認問題
問題1
平均値の求め方を答えましょう。
問題2
5、8、10、12、15 の中央値を求めましょう。
問題3
2、3、3、4、4、4、5 の最頻値を求めましょう。
問題4
7、10、12、18、21 の範囲を求めましょう。
問題5
全体が50人で、ある階級の度数が15人です。相対度数を求めましょう。
問題6
第1四分位数が12、第3四分位数が30です。四分位範囲を求めましょう。
答え
問題1:データの合計 ÷ データの個数
問題2:10
問題3:4
問題4:21 - 7 = 14
問題5:15 ÷ 50 = 0.3
問題6:30 - 12 = 18
まとめ
データの活用は、表やグラフから情報を読み取る単元です。
データとは、集めた数や情報のことです。
平均値は、データの合計を個数で割った値です。
中央値は、小さい順に並べたとき真ん中にくる値です。
最頻値は、一番多く出てくる値です。
範囲は、最大値−最小値です。
度数分布表は、階級ごとの度数を表した表です。
相対度数は、その階級の度数を全体の度数で割った値です。
箱ひげ図は、データの散らばり方を見る図です。
四分位範囲は、第3四分位数−第1四分位数です。
データの問題が苦手なときは、あわてて計算せず、「平均値を聞かれているのか」「中央値を聞かれているのか」「表のどこを読むのか」を確認しましょう。