$$$$
皆さんお待ちかね、
匿
(
Twitter
)の偏差値問題シリーズ第3弾である。今回の問題は解説が短いので、偏差値初心者にとっても易しく感じられることだろう。 問題
国語と算数の2教科で構成されるH模試を50人が受験した。受験者のひとりであるPちゃんは、国語と算数の偏差値がともに51であった。2教科の合計点で算出される総合偏差値について、Pちゃんのそれは最大でいくらになるか。
要するに、Pちゃんの総合偏差値の最大値を求める問題である。まずは直感で答えていただきたい。
解説
Pちゃんの総合偏差値は120が最大である。実際、以下のような得点分布の場合に、Pちゃんの各教科ごとの偏差値が51となり、総合偏差値が120となることが計算で確かめられる。(以下の分布はあくまで一例であり、これ以外にも条件を満たす分布は存在する。)
国語の点数(点) | 算数の点数(点) | その得点の組であった人数(人) |
210 | 210 | 1(Pちゃん) |
7 | 393 | 3 |
92 | 308 | 11 |
200 | 200 | 21 |
308 | 92 | 11 |
393 | 7 | 3 |
ちょっと待て
突如として現れた謎の得点分布。確かにこの得点分布において、Pちゃんの国語の偏差値は51であり、算数の偏差値も51であり、総合偏差値は120である。
だが、どのような考察によってこの得点分布を導出したのか。あまりにも天下りが過ぎないか。読者の多くは、そう感じられていることだろう(そう感じていない読者はここで記事を読み終えていただいて構わない)。
これでは解説が解説として機能していない。説明責任を果たせ。逃げるな。そういった声が各所から聞こえてくる。
よって、今から真の解説を書いていく。元の解説より遥かに分量が多くなるが、本問の理解のために読んでおくことを推奨する。
真の解説
全員の得点に同一の点数を加えても、全員の得点から同一の点数を差し引いても、標準偏差や各々の偏差値といったものは変わらない。ゆえに、Pちゃん以外の49人における国語の平均点、算数の平均点が$0$点の場合を考えればよい(こうすることで計算がとても楽になる)。
Pちゃん以外の49人における国語の点数の標準偏差を$s_{49j}$、算数の標準偏差を$s_{49m}$とおく。このとき実は、Pちゃんの国語の得点が$\displaystyle \sqrt{\frac{50}{4899}}s_{49j}$点、算数の得点が$\displaystyle \sqrt{\frac{50}{4899}}s_{49m}$点であるといえる。これを示そう。
Pちゃん以外の国語の得点を$j_1$~$j_{49}$点、Pちゃんの国語の得点を$j_{50}$点とすると、Pちゃんを含めた50人における国語の平均点$M_{50j}$は$\displaystyle \frac{j_{50}}{50}$点になる($\because$Pちゃん以外の49人における国語の平均点は$0$点である)。50人における国語の点数の標準偏差を$s_{50j}$とおいて、これを計算しよう。
標準偏差の定義より、
$$\begin{align}
s_{50j}
&=\sqrt{\displaystyle \frac{1}{50} \sum_{k=1}^{50} (j_k-M_{50j})^2} \\
&=\sqrt{\displaystyle \frac{1}{50} \left((j_{50}-M_{50j})^2 + \sum_{k=1}^{49} (j_k-M_{50j})^2 \right)} \\
&=\sqrt{\displaystyle \frac{1}{50} \left((j_{50}-M_{50j})^2 + \left( \sum_{k=1}^{49} (j_k)^2-2M_{50j}\sum_{k=1}^{49} j_k +\sum_{k=1}^{49} (M_{50j})^2 \right) \right)} \\
&=\sqrt{\displaystyle \frac{1}{50} \left((j_{50}-M_{50j})^2 + \left( 49 (s_{49j})^2-2M_{50j} \times 0 +49(M_{50j})^2 \right) \right)} \\
&=\sqrt{\displaystyle \frac{1}{50} \left(\left((j_{50})^2-2j_{50}M_{50j}+(M_{50j})^2\right) + 49 (s_{49j})^2+49(M_{50j})^2 \right)} \\
&=\sqrt{\displaystyle \frac{1}{50} \left((j_{50})^2-2j_{50}M_{50j}+50(M_{50j})^2 + 49 (s_{49j})^2 \right)} \\
&=\sqrt{\displaystyle \frac{1}{50} \left((j_{50})^2-2j_{50}\left(\frac{j_{50}}{50}\right)+50\left(\frac{j_{50}}{50}\right)^2 + 49 (s_{49j})^2 \right)} \\
&=\sqrt{\displaystyle \frac{1}{50} \left((j_{50})^2-\frac{(j_{50})^2}{25}+\frac{(j_{50})^2}{50} + 49 (s_{49j})^2 \right)} \\
&=\sqrt{\displaystyle \frac{1}{50} \left(\frac{49}{50} (j_{50})^2 + 49 (s_{49j})^2 \right)} \\
&=\frac{7}{50}\sqrt{\displaystyle (j_{50})^2 +50 (s_{49j})^2} \\
\end{align}$$
が判明する(最初に仮定した「49人における国語の平均点が$0$点」がここで活きている)。Pちゃんの国語の偏差値は$51$なので、偏差値の定義より、
$$\begin{align}
\frac{51-50}{10}&=\frac{j_{50}-M_{50j}}{s_{50j}} \\
&=\frac{\displaystyle j_{50}-\left(\frac{j_{50}}{50}\right)}{\displaystyle \frac{7}{50}\sqrt{\displaystyle (j_{50})^2 +50 (s_{49j})^2}} \\
&=\frac{\displaystyle 7j_{50}}{\displaystyle \sqrt{\displaystyle (j_{50})^2 +50 (s_{49j})^2}} \\
\frac{\displaystyle 7j_{50}}{\displaystyle \sqrt{\displaystyle (j_{50})^2 +50 (s_{49j})^2}} &= \frac{1}{10} \\
\frac{\displaystyle 49(j_{50})^2}{\displaystyle (j_{50})^2 +50 (s_{49j})^2} &= \frac{1}{100} \\
4900(j_{50})^2 &= (j_{50})^2 +50 (s_{49j})^2 \\
(j_{50})^2 &= \frac{50}{4899} (s_{49j})^2 \\
j_{50} &= \sqrt{\frac{50}{4899}}s_{49j}
\end{align}$$
と計算されて、Pちゃんの国語の得点が$\displaystyle \sqrt{\frac{50}{4899}}s_{49j}$点であることが示された。
算数の場合についても、Pちゃん以外の算数の得点を$m_1$~$m_{49}$点、Pちゃんの算数の得点を$m_{50}$点として、国語と同様に計算すれば$\displaystyle \sqrt{\frac{50}{4899}}s_{49m}$点であると導ける。 (証明終)
さて、ここから総合偏差値を求めていくので、そのための文字を定義しておこう。Pちゃん以外の合計点を$t_1$~$t_{49}$、Pちゃんの合計点を$t_{50}$点とすると、Pちゃんを含めた50人における合計点の平均$M_{50}$は$\displaystyle \frac{t_{50}}{50}$点になる($\because$Pちゃん以外の49人における国語の平均点および算数の平均点は$0$点である)。Pちゃん以外の49人における合計点の標準偏差を$s_{49}$、Pちゃんを含めた50人における合計点の標準偏差を$s_{50}$とおいて、さらに49人における国語と算数の得点の共分散を${\rm cov}_{49}$、50人における共分散を${\rm cov}_{50}$とおく。
大量に文字を定義したため、読者の中には混乱している人がいるかもしれない。念のため、簡単にまとめたものを以下の表に示す。
| Pちゃん以外の49人における | Pちゃんを含めた50人における |
国語の平均点(点) | $0$ | $M_{50j}$ |
国語の標準偏差(点) | $s_{49j}$ | $s_{50j}$ |
算数の平均点(点) | $0$ | $M_{50m}$ |
算数の標準偏差(点) | $s_{49m}$ | $s_{50m}$ |
合計点の平均点(点) | $0$ | $M_{50}$ |
合計点の標準偏差(点) | $s_{49}$ | $s_{50}$ |
国語と算数の共分散(点2) | ${\rm cov}_{49}$ | ${\rm cov}_{50}$ |
まず、$s_{49}$および$s_{50}$がどのように表されるのかを考える。定義より、
$$\begin{align}
s_{49} &= \sqrt{\frac{1}{49} \sum_{k=1}^{49} (t_k)^2} \\
&= \sqrt{\frac{1}{49} \sum_{k=1}^{49} (j_k+m_k)^2} \\
&= \sqrt{\frac{1}{49} \sum_{k=1}^{49} \left((j_k)^2+(m_k)^2+2j_k m_k\right)} \\
&= \sqrt{(s_{49j})^2+(s_{49m})^2+2{\rm cov}_{49}} \\
\end{align}$$
である。同様に$s_{50}$を計算すると、$\displaystyle \sum_{k=1}^{49} j_k=\sum_{k=1}^{49} m_k=0$より、
$$\begin{align}
s_{50} &= \sqrt{\frac{1}{50} \sum_{k=1}^{50} (t_k-M_{50})^2} \\
&= \sqrt{\frac{1}{50} \sum_{k=1}^{50} \left(j_k+m_k-M_{50}\right)^2} \\
&= \sqrt{\frac{1}{50} \sum_{k=1}^{50} \left((j_k)^2+(m_k)^2+2j_k m_k-2M_{50}(j_k+m_k)+(M_{50})^2\right)} \,\,\,\,\,\, \dots (\bigstar)\\
&= \sqrt{\frac{1}{50} \sum_{k=1}^{50} \left((j_k-M_{50j})^2+(m_k-M_{50m})^2+2(j_k-M_{50j})(m_k-M_{50m})\right)} \\
&= \sqrt{(s_{50j})^2+(s_{50m})^2+2{\rm cov}_{50}} \\
\end{align}$$
である。ところで$(\bigstar)$より、$\displaystyle M_{50}=M_{50j}+M_{50m}=\frac{j_{50}+m_{50}}{50}$も考慮して、
$$\begin{align}
(s_{50j})^2+(s_{50m})^2+2{\rm cov}_{50} &= \frac{1}{50} \sum_{k=1}^{50} \left((j_k)^2+(m_k)^2+2j_k m_k-2M_{50}(j_k+m_k)+(M_{50})^2\right) \\
&= \frac{1}{50} \left( \sum_{k=1}^{50} \left((j_k)^2+(m_k)^2+2j_k m_k\right) \right) -\frac{1}{25}M_{50}\left(\sum_{k=1}^{50} (j_{k}+m_{k})\right)+(M_{50})^2 \\
&= \frac{1}{50} \left( \sum_{k=1}^{50} \left((j_k)^2+(m_k)^2+2j_k m_k\right) \right) -\left(\frac{j_{50}+m_{50}}{50}\right)^2 \\
&= \frac{49}{50} \left((s_{49j})^2+(s_{49m})^2+2{\rm cov}_{49}\right) +\frac{1}{50} (j_{50}+m_{50})^2 -\left(\frac{j_{50}+m_{50}}{50}\right)^2 \\
&= \frac{49}{50} (s_{49})^2 +\frac{1}{50} (j_{50}+m_{50})^2 -\frac{1}{2500}\left(j_{50}+m_{50}\right)^2 \\
&= \frac{49}{2500} \left(50(s_{49})^2 +(j_{50}+m_{50})^2 \right) \\
\end{align}$$
を得るので、先に得た$j_{50}=\displaystyle \sqrt{\frac{50}{4899}}s_{49j}$および$m_{50}=\displaystyle \sqrt{\frac{50}{4899}}s_{49m}$を代入すると、
$$\begin{align}
s_{50} &= \sqrt{(s_{50j})^2+(s_{50m})^2+2{\rm cov}_{50}} \\
&= \sqrt{\frac{49}{2500} \left(50(s_{49})^2 +(j_{50}+m_{50})^2 \right)} \\
&= \sqrt{\frac{49}{2500} \left(50(s_{49})^2 +\left(\sqrt{\frac{50}{4899}}s_{49j}+\sqrt{\frac{50}{4899}}s_{49m}\right)^2 \right)} \\
&= \sqrt{\frac{49}{50} \left((s_{49})^2 +\frac{1}{4899}\left(s_{49j}+s_{49m}\right)^2 \right)} \\
&= \sqrt{\frac{49}{50} \left((s_{49j})^2+(s_{49m})^2+2{\rm cov}_{49} +\frac{1}{4899}\left(s_{49j}+s_{49m}\right)^2 \right)} \\
&= \sqrt{\frac{49}{50} \left(\frac{4900}{4899}\left((s_{49j})^2+(s_{49m})^2\right)+2{\rm cov}_{49} +\frac{2}{4899}s_{49j}s_{49m} \right)} \\
&= \sqrt{\frac{49}{122475} \left(2450\left((s_{49j})^2+(s_{49m})^2\right)+4899{\rm cov}_{49} +s_{49j}s_{49m} \right)} \\
&= \frac{7}{5} \sqrt{\frac{1}{4899} \left(2450\left((s_{49j})^2+(s_{49m})^2\right)+\left(1+4899{\rm corr}_{49} \right) s_{49j}s_{49m}\right)} \\
\end{align}$$
となる(ただし最後の変形で登場する${\rm corr}_{49}$は「Pちゃん以外の49人における国語と算数の得点の相関係数」であるとする)。
この時点でかなりの体力を消耗していることだろうが、どうかもう少しお付き合いいただきたい。
Pちゃんの総合偏差値を$10D+50$とおくと、標準偏差の定義から、
$$\begin{align}
D=\frac{t_{50}-M_{50}}{s_{50}}
\end{align}$$
が成立する。ここに、これまでの議論で判明したものをひとつずつ代入しよう。
$$\begin{align}
\frac{t_{50}-M_{50}}{s_{50}}&=\frac{\displaystyle (j_{50}+m_{50})-\left(\frac{j_{50}+m_{50}}{50}\right)}{\displaystyle \frac{7}{5} \sqrt{\frac{1}{4899} \left(2450\left((s_{49j})^2+(s_{49m})^2\right)+\left(1+4899{\rm corr}_{49} \right) s_{49j}s_{49m}\right)}} \\
&= \frac{\displaystyle 7(j_{50}+m_{50})}{\displaystyle 10\sqrt{\frac{1}{4899} \left(2450\left((s_{49j})^2+(s_{49m})^2\right)+\left(1+4899{\rm corr}_{49} \right) s_{49j}s_{49m}\right)}} \\
&= \frac{\displaystyle 7\left(\sqrt{\frac{50}{4899}}s_{49j}+\sqrt{\frac{50}{4899}}s_{49m}\right)}{\displaystyle 10\sqrt{\frac{1}{4899} \left(2450\left((s_{49j})^2+(s_{49m})^2\right)+\left(1+4899{\rm corr}_{49} \right) s_{49j}s_{49m}\right)}} \\
&= \frac{\displaystyle 7\sqrt{2}\left(s_{49j}+s_{49m}\right)}{\displaystyle 2\sqrt{ 2450\left((s_{49j})^2+(s_{49m})^2\right)+\left(1+4899{\rm corr}_{49} \right) s_{49j}s_{49m}}} \\
&= \frac{\displaystyle \sqrt{98\left((s_{49j})^2+(s_{49m})^2\right)+196s_{49j}s_{49m}}}{\displaystyle 2\sqrt{ 2450\left((s_{49j})^2+(s_{49m})^2\right)+\left(1+4899{\rm corr}_{49} \right) s_{49j}s_{49m}}} \\
&= \sqrt{\frac{\displaystyle 49\left((s_{49j})^2+(s_{49m})^2\right)+98s_{49j}s_{49m}}{\displaystyle 4900\left((s_{49j})^2+(s_{49m})^2\right)+2\left(1+4899{\rm corr}_{49} \right) s_{49j}s_{49m}}} \\
\end{align}$$
以上より、Pちゃんが各教科において偏差値51をとるとき、Pちゃんの総合偏差値は$s_{49j}, \, s_{49m}, \, {\rm corr}_{49}$のみに依存することが判る。$-1 \leq {\rm corr}_{49} \leq 1$であり($\because$相関係数の定義)、$s_{49m}>0$であるから($\because$ $s_{49m}=0$のとき$m_{50}=0$であり、Pちゃんの得点が平均点を上回らない)、何らかの実数$x, \, \theta$を用いて$\displaystyle \frac{s_{49j}}{s_{49m}}=x, \, {\rm corr}_{49}=\cos \theta$とおける。なお、$s_{49m}>0$と同様に$s_{49j}>0$でもあるため、$x>0$である。
$$\begin{align}
\frac{t_{50}-M_{50}}{s_{50}}&= \sqrt{\frac{\displaystyle 49\left((s_{49j})^2+(s_{49m})^2\right)+98s_{49j}s_{49m}}{\displaystyle 4900\left((s_{49j})^2+(s_{49m})^2\right)+2\left(1+4899{\rm corr}_{49} \right) s_{49j}s_{49m}}} \\
&= \sqrt{\frac{\displaystyle 49\left(\left(\frac{s_{49j}}{s_{49m}}\right)^2+1\right)+98\left(\frac{s_{49j}}{s_{49m}}\right)}{\displaystyle 4900\left(\left(\frac{s_{49j}}{s_{49m}}\right)^2+1\right)+2\left(1+4899{\rm corr}_{49} \right) \left(\frac{s_{49j}}{s_{49m}}\right)}} \\
&= \sqrt{\frac{\displaystyle 49\left(x^2+1\right)+98x}{\displaystyle 4900\left(x^2+1\right)+2\left(1+4899\cos \theta \right) x}} \\
&= \left( \frac{\displaystyle 4900\left(x^2+1\right)+2\left(1+4899\cos \theta \right) x}{\displaystyle 49\left(x^2+1\right)+98x} \right)^{-\frac{1}{2}} \\
&= \left( 100-\frac{\displaystyle 2\left(4899-4899\cos \theta \right) x}{\displaystyle 49\left(x^2+1\right)+98x} \right)^{-\frac{1}{2}} \\
&= \left( 100-\left(1-\cos \theta \right)\frac{\displaystyle 9798x}{\displaystyle 49\left(x+1\right)^2} \right)^{-\frac{1}{2}} \\
\end{align}$$
$x>0$において$0<\frac{\displaystyle 9798x}{\displaystyle 49\left(x+1\right)^2}\leq\frac{\displaystyle 9798x}{\displaystyle 49\left((x+1)^2-(x-1)^2\right)}=\frac{\displaystyle 9798x}{\displaystyle 49\times 4x}=\frac{\displaystyle 4899}{\displaystyle 98}$であり、かつ$0 \leq 1-\cos \theta \leq 2$を考慮すると、
$$\begin{align}
\left( 100-(0)\times\frac{\displaystyle 2x}{\displaystyle 49\left(x+1\right)^2} \right)^{-\frac{1}{2}} \leq \left( 100-\left(1-\cos \theta \right)\frac{\displaystyle 9798x}{\displaystyle 49\left(x+1\right)^2} \right)^{-\frac{1}{2}} \leq \left( 100-(2)\times\left(\frac{4899}{98}\right) \right)^{-\frac{1}{2}} \,\,\, \cdots(\clubsuit)
\end{align}$$
$$\begin{align}
\left( 100-(0)\times\frac{\displaystyle 2x}{\displaystyle 49\left(x+1\right)^2} \right)^{-\frac{1}{2}} \leq \frac{t_{50}-M_{50}}{s_{50}} \leq \left( 100-(2)\times\left(\frac{4899}{98}\right) \right)^{-\frac{1}{2}}
\end{align}$$
$$\begin{align}
100^{-\frac{1}{2}} \leq \frac{t_{50}-M_{50}}{s_{50}} \leq \left( \frac{1}{49}\right)^{-\frac{1}{2}}
\end{align}$$
$$\begin{align}
\frac{1}{10} \leq \frac{t_{50}-M_{50}}{s_{50}} \leq 7 \\
\end{align}$$
$$\begin{align}
\frac{1}{10} \leq D \leq 7 \\
\end{align}$$
が必要であるといえよう。
逆に、$\displaystyle D=\frac{1}{10}$となる分布の例、$D=7$となる分布の例のそれぞれを挙げられれば、十分性も示せる。そして今回、そのような例を実際に挙げられる。あと一息である。
$\displaystyle D=\frac{1}{10}$となる例、すなわちPちゃんの総合偏差値が51となる例については簡単に挙げられる。Pちゃんは国語と算数の偏差値がともに51であるため、各々が国語と算数で同点を獲得する場合において、Pちゃんの偏差値が51となる($\because$ある分布における各々の得点を2倍しても偏差値は不変である)。得点を整数にしたければ、$j_{50}=\displaystyle \sqrt{\frac{50}{4899}}s_{49j}$が整数となるような$s_{49j}$を考えて逆算すればよい。実際、$s_{49j}=\sqrt{9798}$となるような国語の得点の分布を考えれば、その分布において$\displaystyle \sqrt{\frac{50}{4899}}s_{49j}=10$は整数となる。簡単な計算により$9798\times 49=22\times 108^2+6\times 193^2$であるので、例えば以下のケースにおいて、Pちゃんの各教科の偏差値は51、総合偏差値も51となることが従う(Pちゃん以外の49人の平均点を$0$点と仮定しているために負の得点が生じているが、それが気になる人は全員の得点に同一の点数を加えてもよい)。
国語の点数(点) | 算数の点数(点) | その得点の組であった人数(人) |
10 | 10 | 1(Pちゃん) |
-193 | -193 | 3 |
-108 | -108 | 11 |
0 | 0 | 21 |
108 | 108 | 11 |
193 | 193 | 3 |
$\displaystyle D=7$となる例、すなわちPちゃんの総合偏差値が120となる例についても考えよう。$D=7$となるのは(つまり等号成立条件は)、$(\clubsuit)$より、$1-\cos \theta=2$のときである。このとき$\cos \theta =-1$であり、従って${\rm corr}_{49}=-1$である。ゆえに、Pちゃん以外の国語と算数の得点の相関係数が$-1$である場合に、Pちゃんの総合偏差値が120となる。先程と同様に、$j_{50}$や$m_{50}$が整数になる場合も計算できて、例えば以下のケースにおいて、Pちゃんの各教科の偏差値は51、総合偏差値は120となることが従う(全員の得点に200点を加えると、最初の解説に示した得点分布となる)。
国語の点数(点) | 算数の点数(点) | その得点の組であった人数(人) |
10 | 10 | 1(Pちゃん) |
-193 | 193 | 3 |
-108 | 108 | 11 |
0 | 0 | 21 |
108 | -108 | 11 |
193 | -193 | 3 |
ここまでの議論を統合して、Pちゃんの総合偏差値は51以上120以下であることが確定する。
あとがき
上記の結果は直感に合致していただろうか。匿本人としては、比較的counterintuitiveな内容だったように思われる。なお、
Twitterにて開催したアンケート調査
では、123名中、正答を導けたのが39名であった(ただし、Twitterの住民は極端な選択肢を好んで選ぶ傾向があるので、実際の理解度と差異を生じている可能性も否定できない)。 ところで、本問をより一般化して、『2教科で構成される模試を$n$人が受験した。受験者Xは、各教科の偏差値がともに$50+\varepsilon$であった($\varepsilon>0$)。このとき、Xの総合偏差値は最大でいくらになるか。』という問題を考えることもできる。この場合、$\varepsilon$の値にかかわらず(
テストと8人の受験者(解答編)
で示したことと同様に、$n$人の集団における偏差値には上限$50+10\sqrt{n-1}$があるので当然$\varepsilon\leq 10\sqrt{n-1}$だが)、Xの総合偏差値の最大値は$50+10\sqrt{n-1}$となる。時間に余裕のある読者は、上の解説を参考にして証明してみよう。 所謂「受験シーズン」が近くなってきたが、万一読者の中に受験生が居られるようであれば、模試の偏差値を恨みがましく睥睨するだけでなく、たまにはこうして「偏差値」そのものの性質を考察する時間を設けるのも風情があるように思う。というか受験生はこんな冗長な記事を読んでいる場合ではない。