【1年生】データの分析と活用 〜データを読み解く達人になろう!〜

こんにちは!今日は「データの分析と活用」という単元について一緒に学んでいきましょう。
「データ」と聞くと、なんだか難しそうに感じるかもしれませんが、実は私たちの身の回りにあふれています。例えば、クラスのテストの点数、スポーツの記録、最近流行っている動画の再生回数など、これらはすべて「データ」です。

この章では、バラバラに散らばった数字を整理して、「結局、このデータは何を伝えているの?」という正体を見破る方法を学びます。最初は少し言葉が多いですが、一つずつ丁寧に進めていけば大丈夫です!

1. データを整理する(度数分布表とヒストグラム)

たくさんの数字が並んでいるだけでは、全体の特徴が分かりにくいですよね。そこで、まずはデータをグループ分けして整理します。

① 度数分布表(どすうぶんぷひょう)

データをいくつかの区間に区切って、それぞれの区間にどれだけのデータがあるかをまとめた表のことです。

【覚えておきたい用語】
階級(かいきゅう): 区切った区間のこと。(例:10点以上〜20点未満)
階級の幅: 区間の広さのこと。(例:10点から20点なら、幅は10点)
度数(どすう): その階級に入っているデータの個数(人数など)のこと。
階級値(かいきゅうち): その階級の真ん中の値のこと。 \( (\text{階級の始まり} + \text{階級の終わり}) \div 2 \) で計算できます。

② ヒストグラムと度数折れ線

表をグラフにすると、もっと分かりやすくなります!

ヒストグラム(柱状グラフ): 横軸に階級、縦軸に度数をとって、長方形を並べたグラフです。棒グラフに似ていますが、柱の間に隙間がないのが特徴です。
度数折れ線: ヒストグラムの各長方形の上の辺の真ん中を線で結んだグラフです。データの変化の様子が分かりやすくなります。

【ポイント!】
ヒストグラムを見ると、「どこに一番たくさんの人が集まっているか」がひと目でわかります!

【豆知識】
「ヒストグラム」という名前は、ギリシャ語で「直立したもの」という意味からきていると言われています。背比べをしているみたいですね!

★ここまでのまとめ★
バラバラなデータは、度数分布表にまとめ、ヒストグラムにして「見える化」しよう!

2. 相対度数(そうたいどすう)

「A組で80点以上の人は5人、B組は10人でした。どっちのクラスの方が80点以上の割合が高い?」
これ、実は人数だけでは比べられません。なぜなら、クラス全体の人数が違うかもしれないからです。

そこで登場するのが相対度数です!

相対度数の公式

\( \text{相対度数} = \frac{\text{その階級の度数}}{\text{度数の合計}} \)

・相対度数は、全体を 1 としたときの割合を表します。
すべての階級の相対度数を合計すると、必ず 1 になります。(計算チェックに使えます!)

【例え話】
10人中1人がお菓子を持っているのと、100人中1人が持っているのでは、「お菓子を持っている人の割合」が違いますよね。相対度数は、この「割合」を比べるための道具です。

★ここまでのまとめ★
データの合計人数が違うグループを比べるときは、相対度数を使おう!

3. 代表値(だいひょうち)

データ全体の特徴を一言で表すための数字を「代表値」と言います。主に3つの有名人がいます。

① 平均値(へいきんち)

みなさんおなじみの「平均」です。
\( \text{平均値} = \frac{\text{データの値の合計}}{\text{データの個数}} \)

② 中央値(メジアン)

データを小さい順(または大きい順)に並べたとき、ちょうど真ん中にくる値のことです。
※注意! データが偶数個のときは、真ん中の2つの平均をとります。

③ 最頻値(モード)

データの中で、最も多く現れる値(一番人気の値)のことです。
度数分布表では、度数が最も大きい階級の階級値を答えます。

【よくある間違い!】
「最頻値」を答えるときに、度数(人数)を答えてしまうミスが多いです!答えるのは「階級値(点数や時間など)」の方ですよ!

【豆知識:使い分けのヒント】
・普段は平均値が便利!
・極端に大きすぎる(または小さすぎる)データがあるときは、平均が引きずられてしまうので中央値がおすすめ!
・アンケートなどで「一番人気」を知りたいときは最頻値

★ここまでのまとめ★
データの正体を知るには、平均値・中央値・最頻値のどれを使うのがベストか考えよう!

4. データの散らばりと範囲(レンジ)

同じ平均点でも、「全員が平均点に近いクラス」と「0点から100点までバラバラなクラス」では様子が違いますよね。この「散らばり具合」を見る指標が範囲です。

範囲(レンジ)の求め方

\( \text{範囲} = \text{最大の値} - \text{最小の値} \)

範囲が大きければ大きいほど、データの散らばりが大きいということになります。

【ポイント!】
範囲は「一番大きいもの」と「一番小さいもの」の差を見るだけなので、計算はとても簡単です!

5. 最後に:グラフを読み取るときのコツ

データの分析で一番大切なのは、計算することだけではありません。「このデータから何が言えるかな?」と考えることです。

・山が左に寄っている? 右に寄っている?
・2つの山がある?(これは2つの異なるグループが混ざっているサインかも!)
・去年と比べて、全体的に値が上がっているかな?

最初は難しく感じるかもしれませんが、ニュースの天気予報やスポーツの統計を見る時に「これはどの代表値かな?」と少し意識するだけで、どんどん得意になりますよ!

応援しています。頑張りましょう!