【数学B】統計的な推測 〜データの裏側を読み解く魔法〜

こんにちは!数学Bの「統計的な推測」のページへようこそ。
「統計」と聞くと、「計算が面倒くさそう…」「公式が難しそう…」と身構えてしまうかもしれません。でも、安心してください!
この章は、「一部のデータから全体を予想する」という、現実世界で最も役に立つ数学のひとつです。例えば、テレビの視聴率調査や、新薬の効果判定などもこの考え方を使っています。
共通テストでも頻出の分野ですが、ポイントさえ押さえれば、実は強力な得点源になります。一緒に楽しくマスターしていきましょう!


1. 確率変数と確率分布

まずは基本の言葉から整理しましょう。ここがグラグラしていると後が大変です!

確率変数とは?

サイコロを振ったときに出る目のように、「とる値によって確率が決まる変数」のことを確率変数(ふつう \(X\) で表します)と呼びます。

期待値・分散・標準偏差

これらはデータの「特徴」を表す数字です。

  • 期待値 \(E(X)\): いわゆる「平均」のことです。何度も繰り返したとき、平均してどれくらいの値になるかを表します。
    \(E(X) = x_1p_1 + x_2p_2 + \dots + x_np_n\)
  • 分散 \(V(X)\): データの「バラつき」具合です。値が大きいほど、データが散らばっています。
    \(V(X) = E(X^2) - \{E(X)\}^2\) (「2乗の平均」マイナス「平均の2乗」と覚えましょう!)
  • 標準偏差 \(\sigma(X)\): 分散にルートをつけたものです。単位を元に戻すイメージです。
    \(\sigma(X) = \sqrt{V(X)}\)

【ポイント】変数の変換
\(Y = aX + b\) のとき、以下の関係が成り立ちます。これは計算を楽にするための必須テクニックです!
・\(E(aX + b) = aE(X) + b\)(平均はそのまま変化する)
・\(V(aX + b) = a^2V(X)\)(分散は \(a\) の2乗倍になる。定数 \(b\) はバラつきに関係ないので消える!)
・\(\sigma(aX + b) = |a|\sigma(X)\)


2. 二項分布(Binomial Distribution)

「成功か失敗か」の2択を、何度も繰り返すときに使う分布です。

どんなときに使う?

「シュートを10回打って、ゴールに入る回数」「サイコロを100回振って、1の目が出る回数」など、「確率 \(p\) で起こることを \(n\) 回繰り返す」場合です。これを \(B(n, p)\) と書きます。

公式の覚え方

二項分布 \(B(n, p)\) の期待値と分散は、めちゃくちゃシンプルな公式になります。
・期待値:\(E(X) = np\)
・分散:\(V(X) = np(1-p)\) ※ \(1-p\) を \(q\) と置くこともあります。

例:成功率 20% (\(p=0.2\)) のフリースローを 100回 (\(n=100\)) 行うとき
平均して何回入ると思いますか? \(100 \times 0.2 = 20\) 回ですよね。これが期待値 \(np\) です。直感的で分かりやすいですね!

【豆知識】
\(n\) が十分に大きいとき、この二項分布は次に説明する「正規分布」に形が似てきます。これを利用して計算を簡略化するのが共通テストの定番です。


3. 正規分布(Normal Distribution)

統計学の中で最も重要な、「左右対称の山型のカーブ」です。

標準化:魔法の呪文 \(Z = \frac{X - m}{\sigma}\)

世の中にはいろんな平均 (\(m\)) や標準偏差 (\(\sigma\)) のデータがありますが、そのままでは比較しにくいです。そこで、「平均を0、標準偏差を1」に変換してしまいます。これを標準化と言います。

【よくある間違い】
標準化の公式で、分子を \(\sigma - m\) にしたり、分母を \(V(X)\) にしたりしないように注意!
「(自分の値 - 平均) ÷ 標準偏差」と日本語で唱えて覚えましょう。

正規分布表の使い方

標準化した \(Z\) の値を使って、教科書の巻末にある「正規分布表」から確率を読み取ります。
・\(P(0 \leqq Z \leqq 1) \approx 0.3413\)
・\(P(0 \leqq Z \leqq 1.96) \approx 0.475\)
※ \(1.96\) という数字は、この後「推定」で大活躍するので友達になりましょう!


4. 母集団と標本

ここからが「推測」の本番です!

母集団: 調査対象の全体(例:日本全国の高校生)
標本(サンプル): 実際に調べた一部(例:ランダムに選んだ100人の高校生)

標本平均 \(\bar{X}\) の性質

ここが一番の難所ですが、乗り越えればゴールはすぐそこです!
母集団の平均を \(m\)、標準偏差を \(\sigma\) とします。そこから \(n\) 個取り出した「標本平均 \(\bar{X}\)」について:

  1. 期待値 \(E(\bar{X}) = m\) (標本の平均の平均は、元の平均と同じ!)
  2. 分散 \(V(\bar{X}) = \frac{\sigma^2}{n}\) (人数を増やすほど、平均のバラつきは小さくなる!)
  3. 標準偏差 \(\sigma(\bar{X}) = \frac{\sigma}{\sqrt{n}}\) (ルート \(n\) 分のシグマ!

【例え話】
スープの味見を想像してください。お玉1杯(標本)の味は、鍋全体(母集団)の味とだいたい同じはずです。たくさん味見(\(n\) を大きく)すればするほど、その味の正確さ(バラつきの小ささ)は増していきますよね。


5. 推定(Estimation)

標本のデータから、母集団の本当の値(母平均 \(m\))を予想します。

母平均の推定(信頼区間 95%)

「本当の平均 \(m\) は、だいたいこの範囲にあるよ!」と言うための公式です。
標本平均 \(\bar{X}\) を使って、以下の範囲に入っている確率が 95% です:
\(\bar{X} - 1.96 \frac{\sigma}{\sqrt{n}} \leqq m \leqq \bar{X} + 1.96 \frac{\sigma}{\sqrt{n}}\)

【ポイント】
・95% 信頼区間なら 1.96
・99% 信頼区間なら 2.58
という数字を使います。問題文に必ず指示があるので、焦らず代入しましょう。


6. 仮説検定(Hypothesis Testing)

「このサイコロ、イカサマじゃない?」といった疑いを、数学的に判定する方法です。

手順を覚えよう

  1. 仮説(帰無仮説)を立てる: 「このサイコロは正しい(偏りがない)」と仮に決めます。
  2. 確率を計算する: もしその仮説が正しいとしたら、今回の結果が起こる確率はどれくらいかを計算します。
  3. 判定する: その確率が、あらかじめ決めた基準(有意水準。ふつう 5% や 1%)より小さければ、「そんなに珍しいことが起こるのはおかしい!仮説が間違っている!」と判断します(これを棄却と言います)。

【例え話】
裁判と同じです。「被告人は無実である」という仮説からスタートし、あまりにも不自然な証拠が見つかったら「無実というのは無理がある(=有罪)」と結論づけるのです。


まとめ:共通テスト突破のコツ

最初は難しく感じるかもしれませんが、大丈夫です。まずは以下の3点を完璧にしましょう!

  • 二項分布の \(np\) と \(npq\) を暗記する。
  • 標準化の公式 \(Z = \frac{X - m}{\sigma}\) を無意識に使えるようにする。
  • 標本平均の標準偏差は \(\frac{\sigma}{\sqrt{n}}\) である(\(\sqrt{n}\) で割るのを忘れない!)。

統計的な推測は、計算パターンが決まっています。公式を紙に書いて壁に貼り、いくつか基本問題を解けば、すぐにコツが掴めますよ。応援しています!