テストと8人の受験者（解答編）

126

　前回の記事で紹介した問題の解答を記す。問題文の再掲はするが、前回を読まれていない方はそちらを先に読んでいただきたい。

問題　～更新間隔が大きく空いたので忘却の彼方かもしれませんね～

　あるテストの結果に関して、A〜Eの5人はこう発言した。
A「実はまだ結果を聞いてないんだ。」
B「僕とFの偏差値の和は64しかない。」
C「まあまあ出来た。72点。」
D「私とGの偏差値、40も差が開いているの。」
E「偏差値78、これがオレの実力さ。」
　その後、これらの発言の過半数が真実であると判明した。Hはこのテストで何点を得たか。
　ただし、このテストを受けたのはA〜Hの8人のみである。

方針　～数学Ⅱまでの知識があれば解けます～

この問題は、コーシー＝シュワルツの不等式( Wikipedia )を用いて解くことができる。

コーシー＝シュワルツの不等式
$\displaystyle \left( \sum_{i=1}^n a_i^2 \right) \left( \sum_{i=1}^n b_i^2 \right) \geq \left( \sum_{i=1}^n a_i b_i \right)^2$　　等号成立条件は$\displaystyle \frac{a_1}{b_1}=\frac{a_2}{b_2}=\cdots =\frac{a_n}{b_n}=c$ ($c$は定数)

　証明は Wikipedia に掲載されている(2021/01/26時点)ので、興味のある方は参照されるとよい。余談だが、Wiki内の「数学的帰納法による証明」はかなり独特である。
　さて、~~前回思いのままに罵詈雑言を浴びせた~~Aの発言に注目すると、「発言の過半数が真実」という手がかりなしにテストの結果をAが知っているか否かを論理的に決定する方法は存在しないことがわかる。言い換えれば、Aの発言の真偽は、「発言の過半数が真実」という手がかりによってのみ判断できる。「発言の過半数が真実」。つまり、真実の発言は、3つか、4つか、あるいは5つ。もしも最終的にすべての発言の真偽がわかるのならば、真実の発言はいくつあることになるだろうか。考えていただきたい。
　それから本問では、5人の発言のどこにも登場しないHの得点を求めなければならない。たとえA～Gの7人全員の得点がわかったとしても、Hの得点がわからなければ意味が無い。Hに関する手がかりはどのように問題文中に隠されているか、じっくり目を通していただきたい。
　念のため、偏差値は((素点)-(平均点))÷(標準偏差)×10+50で、標準偏差は「各々の得点と平均点との差」の2乗平均の平方根で算出されることを明記しておく。

解説　～そこそこ長めですがお付き合いください～

　Aの得点を$s_a$点、Bの得点を$s_b$点、$\cdots$、Hの得点を$s_h$点とし、8人の平均点が$m$点であったとする。つまり、$\displaystyle m=\frac{s_a+s_b+\cdots +s_h}{8}$である。~~調子に乗っている人をとにかく叩きのめしたい衝動に駆られているので、~~まずはEの発言のファクトチェックを行う。そのために、まずはEの発言が真実であると仮定する。

　Eの得点を$(m+7x)$点とおくと($s_e=m+7x$と仮定)、平均点が$m$点なので、他の7人の得点の合計は$7(m-x)$点でなければならない。ここで「Eの偏差値がもっとも高くなるような得点分布」を考えると、偏差値の定義より、それは「得点の標準偏差が最小となるような得点分布」であることがわかる。なぜならば、偏差値は素点、平均点、標準偏差から算出される値であり、このうち素点を$(m+7x)$点、平均点を$m$点と仮定したからである。
　では、「得点の標準偏差が最小となるような得点分布」のとき、標準偏差はいくらになるのか？　これを考えるときに、上記のコーシー＝シュワルツの不等式が使える。得点の標準偏差を${\rm SD}$点とおくと、${\rm SD}$は以下の式で表現される。

$${\rm SD}=\sqrt{\frac{(s_a-m)^2+(s_b-m)^2+\cdots +(s_h-m)^2}{8}}$$

　いま$s_e-m=7x$であり、$\displaystyle \sum_{j\in \{ a,b,c,d,f,g,h\} } (s_j-m)=-7x$であるから

$$\begin{eqnarray} (s_a-m)^2+(s_b-m)^2+\cdots +(s_h-m)^2 &=& (s_e-m)^2+\sum_{j\in \{ a,b,c,d,f,g,h\} } (s_j-m)^2 \\ &=& (7x)^2+\frac{1}{7}\left(\sum_{j=1}^7 1^2 \right) \left(\sum_{j\in \{ a,b,c,d,f,g,h\} } (s_j-m)^2 \right)\\ &\geq& (7x)^2+\frac{1}{7}\left(\sum_{j\in \{ a,b,c,d,f,g,h\} } \left(1\cdot (s_j-m)\right) \right)^2\\ &=& (7x)^2+\frac{1}{7}(-7x)^2 \\ &=&56x^2 \end{eqnarray}$$

と計算できて、$\displaystyle {\rm SD}\geq \sqrt{\frac{56x^2}{8}}=\sqrt{7}x$が得られる(Eの発言が真実ならば$s_e>m$より$x>0$であることに注意する)。すなわち、どのような得点分布であっても${\rm SD}$は$\sqrt{7}x$以上となる。ただし、式中2行目から3行目の変形にコーシー＝シュワルツの不等式を用いた。
　このときEの偏差値はもっとも高くなるので、それを求めると、

$$(s_e-m)\div {\rm SD}\times 10+50=(7x)\div \left(\sqrt{7}x\right) \times 10+50 =50+10\sqrt{7}<50+27=77$$

である。Eの偏差値は、最大でも77以上にならないのだ。よって、「偏差値78」などと自称するEの発言は虚偽であることが示された。一体何が「オレの実力」だったのか。

　~~お調子者の虚偽を白日の下に晒して気分をすっきりさせたところで、~~次にBの発言のファクトチェックを行う。出来ればAから順番に検証したいのだが、「方針」でAの発言の真偽判定を保留としたからである。
　Bの発言が真実であると仮定し、BとFの得点の和を$2(m-3y)$点とおく($s_b+s_f=2(m-3y)$と仮定)。すると平均点が$m$点なので、他の6人の得点の合計は$6(m+y)$点でなければならない。ここで「BとFの偏差値の和がもっとも小さくなるような得点分布」を考えると、Eの発言について考えたときと同様に、それは「得点の標準偏差が最小となるような得点分布」であることがわかる。~~天丼。~~
　いま$\displaystyle \sum_{j\in \{ b,f\} } (s_j-m)=-6y$であり、$\displaystyle \sum_{k\in \{ a,c,d,e,g,h\} } (s_k-m)=6y$であるから

$$\begin{eqnarray} (s_a-m)^2+(s_b-m)^2+\cdots +(s_h-m)^2 &=& \left( \sum_{j\in \{ b,f\} } (s_j-m)^2\right) +\left(\sum_{k\in \{ a,c,d,e,g,h\} } (s_k-m)^2\right) \\ &=& \frac{1}{2}\left(\sum_{j=1}^2 1^2 \right) \left( \sum_{j\in \{ b,f\} } (s_j-m)^2\right) +\frac{1}{6}\left(\sum_{k=1}^6 1^2 \right) \left(\sum_{k\in \{ a,c,d,e,g,h\} } (s_k-m)^2\right) \\ &\geq& \frac{1}{2}\left( \sum_{j\in \{ b,f\} } \left(1\cdot (s_j-m)\right) \right)^2 +\frac{1}{6}\left(\sum_{k\in \{ a,c,d,e,g,h\} } \left(1\cdot (s_k-m)\right) \right)^2 \\ &=& \frac{1}{2}(-6y)^2 +\frac{1}{6}(6y)^2 \\ &=& 24y^2\end{eqnarray}$$

と計算できて、$\displaystyle {\rm SD}\geq \sqrt{\frac{24y^2}{8}}=\sqrt{3}y$が得られる(Bの発言が真実ならば$s_b+s_f<2m$より$y>0$であることに注意する)。すなわち、どのような得点分布であっても${\rm SD}$は$\sqrt{3}y$以上となる。ただし、式中2行目から3行目の変形にコーシー＝シュワルツの不等式を用いた。
　このときBとFの偏差値の和はもっとも低くなるので、それを求めると、

$$\left((s_b-m)+(s_f-m)\right) \div {\rm SD}\times 10+50\times (1+1)=(-6y)\div \left(\sqrt{3}y\right) \times 10+100 =100-20\sqrt{3}>100-35=65$$

である。BとFの偏差値の和は、最小でも65以下にならないのだ。よって、「偏差値の和が64」などとFを巻き込みつつ謙遜するBの発言は虚偽であることが示された。わざわざ得点を逆サバする理由について小一時間問い詰めたい。

　ここまでの議論で、BとEの発言が虚偽であることがわかった。さらに「発言の過半数は真実」より、虚偽の発言は高々2つなので、残るA、C、Dの発言は全て真実である。3人の発言の通り、Aはまだテストの結果を聞いておらず、Cは72点を得ていて、かつDとGの偏差値の差は40だったのだ。~~Aには尚更引っ込んでいただきたく存じ上げる。~~

　いよいよ仕上げの段階に入る。今まで標準偏差に注目してBとEの嘘を暴いてきたので、偏差値について述べているDに対しても同じ手法を適用してみよう。そのために、このテストの受験者最高点が$T+2z$点、受験者最低点が$T-2z$点であったとする(受験者最高点・最低点を獲得したのがDかGとは限らないことに注意)。
　$s_a$、$s_b$、$\cdots$、$s_h$を大きい順に並び替えて、$t_1$、$t_2$、$\cdots$、$t_8$になったと仮定する。すると当然、$T+2z=t_1\geq t_2\geq \cdots \geq t_8=T-2z$かつ$\displaystyle m=\frac{t_1+t_2+\cdots +t_8}{8}$である。ここで「$t_1$点を得た人(最高点獲得者)と$t_8$点を得た人(最低点獲得者)の偏差値の差がもっとも大きくなるような得点分布」を考えると、この2人の点差は$4z$点で一定なので、それは「得点の標準偏差が最小となるような得点分布」であることがわかる。~~天丼再び。~~
　$\displaystyle \sum_{i=2}^7 (t_i-m)^2 \geq0$であるから、

$$\begin{eqnarray} (s_a-m)^2+(s_b-m)^2+\cdots +(s_h-m)^2 &=& (t_1-m)^2+(t_2-m)^2+\cdots +(t_8-m)^2 \\ &=& (t_1-m)^2+(t_8-m)^2+\sum_{i=2}^7 (t_i-m)^2 \\ &\geq& (t_1-m)^2+(t_8-m)^2 \\ &=& (T+2z-m)^2+(T-2z-m)^2 \\ &=& 2\left( (T-m)^2+4z^2 \right) \\ &\geq& 8z^2\end{eqnarray}$$

と計算できて、$\displaystyle {\rm SD}\geq \sqrt{\frac{8z^2}{8}}=z$が得られる(Dの発言より$t_1>t_8$なので$z>0$であることに注意する)。すなわち、どのような得点分布であっても${\rm SD}$は$z$以上となる。なお、上記の式変形を検討すると、${\rm SD}=z$となるのは$t_1=m+2z$、$t_2=t_3=\cdots =t_7=m$、$t_8=m-2z$の場合に限られることもわかる(これらは$\displaystyle \frac{t_1+t_2+\cdots +t_8}{8}=m$を満たしている)。
　このとき最高点獲得者と最低点獲得者の偏差値の差はもっとも大きくなるので、それを求めると、

$$\left((t_1-m)-(t_8-m)\right) \div {\rm SD}\times 10+50\times (1-1)=(4z)\div \left(z\right) \times 10 =40$$

である。最高点獲得者と最低点獲得者の偏差値の差は、$(t_1,t_2,\cdots ,t_8)=(m+2z,m,m,\cdots ,m,m-2z)$という非常に強い制約の下で、やっと最大値40をとるのだ。よって、Dの発言より、DとGは受験者最高点と受験者最低点を獲得したペアであることが示された(ただし、どちらが最高点獲得者かはわからない)。
　加えて、$t_2=t_3=\cdots =t_7=m$であったから、DとGを除く6人は全員$m$点だと導かれる。あとは$m$の値が分かればよいが、Cの発言に注目すると、Cはこのテストで72点を得ていた。ということは$m=72$であり、DとGを除く6人は全員72点だったのである。

　以上より、Hはこのテストで72点を得た。

あとがき　～お疲れ様でした、きっと脂肪燃焼もできましたよ～

　誰だっただろうか、解説にこれだけ手間暇かかる問題を「非常に単純な問題」などと妄言していたのは。HTMLコードも含めて7000文字以上書いたのだが。その人をファラリスの雄牛に閉じ込めて溶鉱炉で加熱消毒したいという気持ちが改めてふつふつと沸いてきたので、見かけた方は是非ご一報ねがいたい。本記事のコメント欄、もしくは Twitter で目撃情報を収集している。

　ともかく、本問を通じて、偏差値という単純明快なパラメータが様々な性質を有していることは伝わっただろうか。
　実際、本問は「受験者がA～Hの8人のみ」という点が有効な制約としてはたらいている。例えばEの発言に関して、受験者が10人以上であれば偏差値80以上の人も現れうる(1人が1点、その他全員が0点を得た場合を考えればよい)。最高点獲得者と最低点獲得者の偏差値の差の最大値についても、受験者数に応じて変化する(50人が受験したテストならば、差の最大値は100となる)。
　こういった考察を通じて、偏差値への読者の理解が深まれば幸いである。

投稿日：2021年1月26日