2023年共通テスト数ⅡB第3問では、次のようなピーマン分類法が出題されました。
(原文より抜粋 ここから)
(1) ある生産地で生産されるピーマン全体を母集団とし,この母集団におけるピーマン1個の重さ(単位は$ \mathrm{g} $を表す確率変数を$ X $とする。$ m $と$ \sigma $を正の実数とし,$ X $は正規分布$ N(m, \sigma^2) $に従うとする。
(中略)
(2) (1)の確率変数$ X $において,$ m = 30.0, \sigma = 3.6 $とした母集団から無作為にピーマンを1個ずつ抽出し,ピーマン2個を1組にしたものを袋に入れていく。このようにしてピーマン2個を1組にしたものを25袋作る。その際,1袋ずつの重さの分散を小さくするために,次のピーマン分類法を考える。
無作為に抽出したいくつかのピーマンについて,重さが30.0g以下のときをSサイズ,30.0gを超えるときはLサイズと分類する。そして,分類されたピーマンからSサイズとLサイズのピーマンを一つずつ選び,ピーマン2個を1組とした袋を作る。
(原文より抜粋 ここまで)
実際の問題では、この後は25袋作れる確率が0.95以上となるのに必要なピーマンの個数を求めていました。しかし、私は別のところに引っ掛かりました。それは、分散が実際にどれほど小さくなるかということです。
実はこれは厳密に計算することができるので、計算してみましょう。
$ m, \sigma $を正の実数の定数とするとき、確率分布$ N_+(m, \sigma^2) $を以下の密度関数を持つ分布として定義する。
$$ f(x) = \left\{ \, \begin{aligned} & \frac{2}{\sqrt{2\pi}\sigma} e^{-\frac{(x - \mu)^2}{2 \sigma^2}} (x > m) \\ & 0 (x \leq m) \end{aligned} \right. $$
また、確率分布$ N_-(m, \sigma^2) $を以下の密度関数を持つ分布として定義する。
$$ f(x) = \left\{ \, \begin{aligned} & \frac{2}{\sqrt{2\pi}\sigma} e^{-\frac{(x - \mu)^2}{2 \sigma^2}} (x \leq m) \\ & 0 (x > m) \end{aligned} \right. $$
$ X_1 \sim N_+(m, \sigma^2),\hspace{1mm} X_2 \sim N_-(m, \sigma^2) $のとき、$ V(X_1 + X_2) $を求めよ。
$ X = \frac{X_1 - m}{\sigma}, Y = -\frac{X_2 - m}{\sigma} $とおくと、
$$ X, Y \sim N_+(0, 1),\hspace{1mm} V(X_1 + X_2) = \sigma^2 V(X - Y) $$
であることがわかります。
また、任意の連続分布$ S, T $に対し、
\begin{align*} & V(S - T) \\ =& V(S) + V(T) - 2Cov(S, T) \\ \end{align*}
が成り立ちますが、今回の場合は$ X $と$ Y $の同時分布がそれぞれの分布の積で与えられ、したがって独立であるため、
$$ V(X - Y) = V(X) + V(Y) $$
が成り立ち、よって
$$ V(X)=V(Y) $$
を求めればよいことがわかります。
\begin{align*} & E(X) = E(Y) \\ =& \int_0^{\infty} \frac{2}{\sqrt{2\pi}} x e^{-\frac{x^2}{2}} dx \\ =& \frac{2}{\sqrt{2\pi}} \int_0^{\infty} x e^{-\frac{x^2}{2}} dx \\ =& \frac{2}{\sqrt{2\pi}} \left[ -e^{-\frac{x^2}{2}} \right]_0^{\infty} \\ =& \frac{2}{\sqrt{2\pi}} \\ =& \sqrt{\frac{2}{\pi}} \end{align*}
\begin{align*} & E(X^2) = E(Y^2) \\ =& \int_0^{\infty} \frac{2}{\sqrt{2\pi}} x^2 e^{-\frac{x^2}{2}} dx \\ =& \frac{2}{\sqrt{2\pi}} \int_0^{\infty} x^2 e^{-\frac{x^2}{2}} dx \\ \end{align*}
\begin{align*} & E(X^2)^2 = E(Y^2)^2 \\ =& \frac{2}{\pi} \int_0^{\infty} x^2 e^{-\frac{x^2}{2}} dx \int_0^{\infty} y^2 e^{-\frac{y^2}{2}} dy \\ =& \frac{2}{\pi} \int_0^{\infty} \int_0^{\infty} x^2 y^2 e^{-\frac{x^2+y^2}{2}} dxdy \\ =& \frac{2}{\pi} \int_0^{\infty} \int_0^{\frac{\pi}{2}} r^5 \sin^2{\theta} \cos^2{\theta} e^{-\frac{r^2}{2}} drd\theta \hspace{5mm} (x = r \cos{\theta}, y = r \sin{\theta}, dxdy = rdrd\theta) \\ =& \frac{2}{\pi} \int_0^{\infty} r \cdot (r^2)^2 e^{-\frac{r^2}{2}} dr \int_0^{\frac{\pi}{2}} \sin^2{\theta} \cos^2{\theta} d\theta \\ \end{align*}
\begin{align*} & \int_0^{\infty} r \cdot (r^2)^2 e^{-\frac{r^2}{2}} dr \\ =& \int_0^{\infty} 4t^2 e^{-t} dt \hspace{5mm} \left(\frac{r^2}{2}=t, rdr=dt\right) \\ =& [-4t^2 e^{-t}]_0^{\infty} + \int_0^{\infty} 8t e^{-t} dt \\ =& \int_0^{\infty} 8t e^{-t} dt \\ =& [-8t e^{-t}]_0^{\infty} + \int_0^{\infty} 8 e^{-t} dt \\ =& \int_0^{\infty} 8 e^{-t} dt \\ =& [-8 e^{-t}]_0^{\infty} \\ =& 8 \end{align*}
\begin{align*} & \int_0^{\frac{\pi}{2}} \sin^2{\theta} \cos^2{\theta} d\theta \\ & \int_0^{\frac{\pi}{2}} \left(\frac{\sin{2\theta}}{2}\right)^2 d\theta \\ =& \int_0^{\frac{\pi}{2}} \frac{\sin^2{2\theta}}{4} d\theta \\ =& \int_0^{\frac{\pi}{2}} \frac{1 - \cos^2{4\theta}}{8} d\theta \\ =& \int_0^{\frac{\pi}{2}} \frac{1}{8} d\theta \\ =& \frac{1}{16}\pi \end{align*}
よって
\begin{align*} & E(X^2)^2 = E(Y^2)^2 \\ =& \frac{2}{\pi} \cdot 8 \cdot \frac{1}{16}\pi \\ =& 1 \end{align*}
したがって
$$ E(X^2) = E(Y^2) = 1 $$
すなわち
$$ V(X) = V(Y) = 1 - \left(\sqrt{\frac{2}{\pi}}\right)^2 = 1 - \frac{2}{\pi} $$
以上より
\begin{align*} & V(X - Y) \\ =& V(X) + V(Y) \\ =& \left(1 - \frac{2}{\pi}\right) \\ =& 2 - \frac{4}{\pi} \end{align*}
がわかりました。
ピーマン分類法を使わない場合は1袋の分散は$ 2 $となるので、$ \frac{4}{\pi} $だけ小さくなることがわかりました。
ここではピーマンの重さが正規分布に従うと仮定しましたが、他の分布のときは未解決です。 次の記事 で定式化しているので、どなたか解いていただければと思います。