こんにちは,Nayuta Itoです.今回は2025年に行われた共通テスト数学2BCの第5問(確率統計)の解説をしていきたいと思います.問題自体の難易度はそこまで高くはないですが,試験本番で焦ってしまうと結構単純ミスを起こしそうな問題です.私も1問間違えました.間違いなどがあれば指摘いただけますと幸いです.
問題文は他サイトを参照してください.
$ Z = \frac{X - 110}{20} $とおくと,$ Z $は標準正規分布に従い,求める確率は$ P(0 \leqq Z \leqq 1.5) $である.したがって,$ P(110 \leqq X \leqq 140) $は正規分布表の$ 1.50 $の位置にある値,すなわち$ 0.\boldsymbol{4332} $である.
平均が$ n $,成功確率が$ p $である二項分布の平均(期待値)は$ np $であるから,$ Y $の平均(期待値)は$ 200000 \cdot 0.4332 = \boldsymbol{86640}(④) $である.
共通テストあるあるですが,1ページ目の表はほとんど使いません.正規分布に従う確率変数$ X $に対して,$ \frac{X - \text{平均}}{\text{標準偏差}} $の値を$ Z $で表すことがよくあります.このとき,$ Z $は標準正規分布に従うので,正規分布表が与えられていれば$ Z $を経由することで$ X $の値の範囲と確率を相互に変換することができます.
$ W_1, W_2, \cdots, W_n $は互いに独立なので,$ \overline{W} $の分散は$ \frac{1}{n^2}(\sigma^2 + \sigma^2 + \cdots + \sigma^2) = \frac{n\sigma^2}{n^2} = \boldsymbol{\frac{\sigma^2}{n}} (⑥) $である.また,標準偏差は$ \frac{\sigma}{\sqrt{n}} $である.
実際に得られたデータの平均を$ \overline{w} $とすると,$ 95\% $信頼区間は$ \overline{w} - \frac{1.96\sigma}{\sqrt{n}} \leqq m \leqq \overline{w} + \frac{1.96\sigma}{\sqrt{n}} $であるから,$ B - A = 2 \cdot \frac{1.96\sigma}{\sqrt{n}} = \frac{\boldsymbol{3.92\sigma}}{\sqrt{n}}(⑤) $である.
$ \sigma = 20 $のとき,$ B - A \leqq 4 $を満たす$ n $は
\begin{eqnarray*}
2 \cdot \frac{1.96\sigma}{\sqrt{n}} \leqq& 4 \\
\frac{2 \cdot 1.96 \cdot 20}{\sqrt{n}} \leqq& 4 \\
2 \cdot 1.96 \cdot 20 \leqq& 4 \sqrt{n} \\
(2 \cdot 1.96 \cdot 20)^2 \leqq& 16n \\
(1 \cdot 1.96 \cdot 10)^2 \leqq& n \\
n \geqq& (20 - 0.4)^2
\end{eqnarray*}
と求められ,$ 2 $乗の展開公式を用いてこれを計算すると$ B - A \leqq 4 $を満たす最小の自然数$ n $が$ n = \boldsymbol{385} $であることがわかる.
正規分布の和は再び正規分布となり(このような性質を再生性といいます),和の平均は平均の和,和の分散は分散の和となります.
正規分布を$ N(a, b) $と書いたとき,その平均は$ a $,標準偏差は$ \sqrt{b} $です.このようになっている理由の一つとして,多変量正規分布と整合性が取ることがあげられます.多変量では分散に相当するものが行列になるので,標準偏差より分散の方が扱いやすくなるからです.
また,信頼区間の幅はいつもの$ \times 1.96 $ではなくその$ 2 $倍となることに注意してください.
大学入試,特に共通テストが$ 78.4 \times 78.4 $なんていう計算を要求することはほとんどありません.何らかの式変形により$ 1 $桁か$ 2 $桁の掛け算に還元できる可能性が高いです.
対立仮説とは検証したい仮説のことなので,この問題での対立仮説は$ \boldsymbol{m < 110}(⓪) $である.
帰無仮説が正しいと仮定すると,(2)で求めたことから,$ \overline{W} $は$ N\left(110, \frac{20^2}{400}\right) = \boldsymbol{N(110, 1)}(⑤) $に従う.
$ Z = \frac{\overline{W} - 110}{\sqrt{1}} $とおくと,$ Z $は標準正規分布に従うから,$ P\left(\overline{W} \leqq 108.2\right) $は$ P(Z \leqq -1.8) $と等しく,これは正規分布表の$ 1.80 $の値を$ 0.5 $から引いた値である.よって,その値は$ 0.5 - 0.4641 = 0.\boldsymbol{0359} $である.この値をパーセント表示した値は有意水準$ 5\% $より小さいから,帰無仮説は棄却される(①).したがって,有意水準$ 5\% $で今年収穫されるレモンの重さの母平均は$ 110\,\mathrm{g} $より軽いと判断できる(⓪).
対立仮説と帰無仮説に共通部分があってはいけないことに注意しましょう.この問題のように,対立仮説と帰無仮説で全ての可能性が網羅されない(この問題では$ m > 110 $がどちらにも含まれない)こともあります.そのような場合には,仮説検定を始める前からその可能性が排除されているものとみなされます.