【数学B】統計的な推測 〜全体を知るための魔法の道具〜
こんにちは!今日は数学Bの大きな山場のひとつ、「統計的な推測」について一緒に学んでいきましょう。
「統計」と聞くと、「計算が面倒そう…」「難しそう…」と感じる人も多いかもしれません。でも、実はこの分野は私たちの生活に一番身近な数学なんです!
例えば、テレビの視聴率、選挙の出口調査、お菓子の内容量のチェックなど、これらはすべて「一部を調べて全体を予想する」という統計の考え方を使っています。
最初は言葉に慣れるまで少し時間がかかるかもしれませんが、一歩ずつ進めば必ず理解できます。リラックスして始めていきましょう!
1. 確率変数と確率分布:まずは基本のキ!
統計的な推測を始める前に、データの扱い方のルールを知っておく必要があります。
① 確率変数 \( X \) って何?
サイコロを振って出る目のように、「とる値によって確率が決まる変数」のことを確率変数といいます。通常、大文字の \( X \) で表します。
例えば、サイコロを1回振って出る目を \( X \) とすると、\( X \) が 1 になる確率は \( \frac{1}{6} \) です。これを \( P(X=1) = \frac{1}{6} \) と書きます。
② 期待値(平均)・分散・標準偏差
データの「中心」や「バラつき」を表す大事な指標です。
- 期待値 \( E(X) \):いわゆる「平均」のことです。値にその確率をかけて、全部足します。
\( E(X) = x_1p_1 + x_2p_2 + \dots + x_np_n \) - 分散 \( V(X) \):データの「バラつき」具合です。値が平均からどれくらい離れているかを表します。
便利な計算式: \( V(X) = E(X^2) - \{E(X)\}^2 \) (「2乗の平均」マイナス「平均の2乗」と覚えましょう!) - 標準偏差 \( \sigma(X) \):分散のルートです。単位を元に戻したバラつきの指標です。
\( \sigma(X) = \sqrt{V(X)} \)
【ポイント】
「分散が大きい = データが散らばっている」「分散が小さい = データが平均付近に集まっている」というイメージを持ちましょう!
2. 二項分布:○か×かの世界
「シュートが入るか入らないか」「コインの表が出るか裏が出るか」のように、2通りの結果しかない試行を \( n \) 回繰り返すときの分布を二項分布と呼び、\( B(n, p) \) と書きます。
二項分布 \( B(n, p) \) の公式
回数を \( n \)、起こる確率を \( p \) とすると、驚くほど簡単に計算できます。
● 期待値: \( E(X) = np \)
● 分散: \( V(X) = np(1-p) \)
● 標準偏差: \( \sigma(X) = \sqrt{np(1-p)} \)
【豆知識】
期待値が \( np \) になるのは直感的にも納得しやすいですよね。例えば、成功率 10% (\( p=0.1 \)) のクジを 100回 (\( n=100 \)) 引いたら、平均 10回 (\( 100 \times 0.1 \)) 当たるはずです!
3. 正規分布:統計界の王様
世の中の多くのデータ(身長、テストの点数など)は、平均を中心に左右対称な山形のカーブを描きます。これを正規分布 \( N(m, \sigma^2) \) と言います。
※ \( m \) は平均、\( \sigma^2 \) は分散です。
標準化(ここがテストに出やすい!)
どんな正規分布も、平均 0、分散 1 の「標準正規分布 \( N(0, 1) \)」に変身させることができます。これを標準化と言います。
変身の呪文(公式)はこれです:
\( Z = \frac{X - m}{\sigma} \)
【ステップ:標準化の使い方】
1. 問題文から平均 \( m \) と標準偏差 \( \sigma \) を見つける。
2. 上の式に代入して \( X \) を \( Z \) に変換する。
3. 教科書の巻末にある「正規分布表」から確率を読み取る。
【よくある間違い】
分母を「分散 \( \sigma^2 \)」にしてしまうミスが多いです!必ず「標準偏差 \( \sigma \)」で割ってくださいね。
4. 母集団と標本:一部から全体を推測する
ここからが「統計的な推測」の本番です!
- 母集団:調査対象の全体(例:日本中の高校生)
- 標本(サンプル):実際に調べた一部(例:選ばれた100人の高校生)
標本平均 \( \bar{X} \) の性質
母集団の平均(母平均)を \( m \)、標準偏差(母標準偏差)を \( \sigma \) とします。
そこから \( n \) 個のデータを抜き出したときの平均 \( \bar{X} \) について、以下のことが成り立ちます。
● 期待値: \( E(\bar{X}) = m \) (標本の平均は、元の平均と同じ!)
● 標準偏差: \( \sigma(\bar{X}) = \frac{\sigma}{\sqrt{n}} \) (人数を増やすほど、バラつきは小さくなる!)
【たとえ話】
スープの味見を想像してください。鍋全体が「母集団」で、お玉1杯が「標本」です。しっかりかき混ぜて(無作為に抽出して)いれば、お玉1杯の味(標本平均)で鍋全体の味(母平均)がわかりますよね。お玉を大きくする(\( n \) を大きくする)ほど、味の判断は正確になります。
5. 推定:自信を持って予想する
標本のデータから、未知の母平均 \( m \) を「だいたいこの範囲にあるはずだ!」と予想することを推定と言います。
信頼区間 95% の公式
一番よく使われるのが「95%の確率でこの中にある」と言える範囲です。
\( [ \bar{X} - 1.96 \frac{\sigma}{\sqrt{n}}, \bar{X} + 1.96 \frac{\sigma}{\sqrt{n}} ] \)
この 1.96 という数字は、正規分布表から導かれた「95%をカバーする特別な数字」です。テスト前にはこの数字を覚えておきましょう!
【ポイント】
「95%信頼区間」とは、「同じような調査を100回やったら、そのうち95回はその範囲の中に本当の答え(母平均)が含まれているよ」という意味です。
最後に:学習のアドバイス
最初は「\( \bar{X} \)(エックスバー)」や「\( \sigma \)(シグマ)」などの記号に圧倒されるかもしれません。
でも、やっていることは一貫して「バラバラなデータを整理して、全体を賢く予想する」ということだけです。
最初は公式を見ながらで構いません。まずは教科書の例題を1つずつ、標準化の手順に沿って解いてみてください。
計算が合うようになると、パズルのように楽しくなってきますよ!
今回のまとめ:
1. 期待値は「平均」、分散は「バラつき」。
2. 正規分布は \( Z = \frac{X-m}{\sigma} \) で標準化して表を使う。
3. 標本平均の標準偏差は \( \sqrt{n} \) で割る。
4. 95%信頼区間には「1.96」が登場する。
「統計的な推測」をマスターすれば、ニュースの数字の見方が変わります。頑張っていきましょう!応援しています!