4

偏差値51を侮るべからず

376
0
 皆さんお待ちかね、 ( Twitter )の偏差値問題シリーズ第3弾である。今回の問題は解説が短いので、偏差値初心者にとっても易しく感じられることだろう。

問題

 国語と算数の2教科で構成されるH模試を50人が受験した。受験者のひとりであるPちゃんは、国語と算数の偏差値がともに51であった。2教科の合計点で算出される総合偏差値について、Pちゃんのそれは最大でいくらになるか。
 要するに、Pちゃんの総合偏差値の最大値を求める問題である。まずは直感で答えていただきたい。





解説

 Pちゃんの総合偏差値は120が最大である。実際、以下のような得点分布の場合に、Pちゃんの各教科ごとの偏差値が51となり、総合偏差値が120となることが計算で確かめられる。(以下の分布はあくまで一例であり、これ以外にも条件を満たす分布は存在する。)
国語の点数(点)算数の点数(点)その得点の組であった人数(人)
2102101(Pちゃん)
73933
9230811
20020021
3089211
39373



ちょっと待て

 突如として現れた謎の得点分布。確かにこの得点分布において、Pちゃんの国語の偏差値は51であり、算数の偏差値も51であり、総合偏差値は120である。
 だが、どのような考察によってこの得点分布を導出したのか。あまりにも天下りが過ぎないか。読者の多くは、そう感じられていることだろう(そう感じていない読者はここで記事を読み終えていただいて構わない)。
 これでは解説が解説として機能していない。説明責任を果たせ。逃げるな。そういった声が各所から聞こえてくる。
 よって、今から真の解説を書いていく。元の解説より遥かに分量が多くなるが、本問の理解のために読んでおくことを推奨する。

真の解説

 全員の得点に同一の点数を加えても、全員の得点から同一の点数を差し引いても、標準偏差や各々の偏差値といったものは変わらない。ゆえに、Pちゃん以外の49人における国語の平均点、算数の平均点が0点の場合を考えればよい(こうすることで計算がとても楽になる)。

 Pちゃん以外の49人における国語の点数の標準偏差をs49j、算数の標準偏差をs49mとおく。このとき実は、Pちゃんの国語の得点が504899s49j、算数の得点が504899s49mであるといえる。これを示そう。
 Pちゃん以外の国語の得点をj1j49点、Pちゃんの国語の得点をj50点とすると、Pちゃんを含めた50人における国語の平均点M50jj5050点になる(Pちゃん以外の49人における国語の平均点は0点である)。50人における国語の点数の標準偏差をs50jとおいて、これを計算しよう。
 標準偏差の定義より、
s50j=150k=150(jkM50j)2=150((j50M50j)2+k=149(jkM50j)2)=150((j50M50j)2+(k=149(jk)22M50jk=149jk+k=149(M50j)2))=150((j50M50j)2+(49(s49j)22M50j×0+49(M50j)2))=150(((j50)22j50M50j+(M50j)2)+49(s49j)2+49(M50j)2)=150((j50)22j50M50j+50(M50j)2+49(s49j)2)=150((j50)22j50(j5050)+50(j5050)2+49(s49j)2)=150((j50)2(j50)225+(j50)250+49(s49j)2)=150(4950(j50)2+49(s49j)2)=750(j50)2+50(s49j)2
が判明する(最初に仮定した「49人における国語の平均点が0点」がここで活きている)。Pちゃんの国語の偏差値は51なので、偏差値の定義より、
515010=j50M50js50j=j50(j5050)750(j50)2+50(s49j)2=7j50(j50)2+50(s49j)27j50(j50)2+50(s49j)2=11049(j50)2(j50)2+50(s49j)2=11004900(j50)2=(j50)2+50(s49j)2(j50)2=504899(s49j)2j50=504899s49j
と計算されて、Pちゃんの国語の得点が504899s49jであることが示された。
 算数の場合についても、Pちゃん以外の算数の得点をm1m49点、Pちゃんの算数の得点をm50点として、国語と同様に計算すれば504899s49mであると導ける。 (証明終)

 さて、ここから総合偏差値を求めていくので、そのための文字を定義しておこう。Pちゃん以外の合計点をt1t49、Pちゃんの合計点をt50点とすると、Pちゃんを含めた50人における合計点の平均M50t5050点になる(Pちゃん以外の49人における国語の平均点および算数の平均点は0点である)。Pちゃん以外の49人における合計点の標準偏差をs49、Pちゃんを含めた50人における合計点の標準偏差をs50とおいて、さらに49人における国語と算数の得点の共分散をcov49、50人における共分散をcov50とおく。
 大量に文字を定義したため、読者の中には混乱している人がいるかもしれない。念のため、簡単にまとめたものを以下の表に示す。
Pちゃん以外の49人におけるPちゃんを含めた50人における
国語の平均点(点)0M50j
国語の標準偏差(点)s49js50j
算数の平均点(点)0M50m
算数の標準偏差(点)s49ms50m
合計点の平均点(点)0M50
合計点の標準偏差(点)s49s50
国語と算数の共分散(点2)cov49cov50

 まず、s49およびs50がどのように表されるのかを考える。定義より、
s49=149k=149(tk)2=149k=149(jk+mk)2=149k=149((jk)2+(mk)2+2jkmk)=(s49j)2+(s49m)2+2cov49
である。同様にs50を計算すると、k=149jk=k=149mk=0より、
s50=150k=150(tkM50)2=150k=150(jk+mkM50)2=150k=150((jk)2+(mk)2+2jkmk2M50(jk+mk)+(M50)2)()=150k=150((jkM50j)2+(mkM50m)2+2(jkM50j)(mkM50m))=(s50j)2+(s50m)2+2cov50
である。ところで()より、M50=M50j+M50m=j50+m5050も考慮して、
(s50j)2+(s50m)2+2cov50=150k=150((jk)2+(mk)2+2jkmk2M50(jk+mk)+(M50)2)=150(k=150((jk)2+(mk)2+2jkmk))125M50(k=150(jk+mk))+(M50)2=150(k=150((jk)2+(mk)2+2jkmk))(j50+m5050)2=4950((s49j)2+(s49m)2+2cov49)+150(j50+m50)2(j50+m5050)2=4950(s49)2+150(j50+m50)212500(j50+m50)2=492500(50(s49)2+(j50+m50)2)
を得るので、先に得たj50=504899s49jおよびm50=504899s49mを代入すると、
s50=(s50j)2+(s50m)2+2cov50=492500(50(s49)2+(j50+m50)2)=492500(50(s49)2+(504899s49j+504899s49m)2)=4950((s49)2+14899(s49j+s49m)2)=4950((s49j)2+(s49m)2+2cov49+14899(s49j+s49m)2)=4950(49004899((s49j)2+(s49m)2)+2cov49+24899s49js49m)=49122475(2450((s49j)2+(s49m)2)+4899cov49+s49js49m)=7514899(2450((s49j)2+(s49m)2)+(1+4899corr49)s49js49m)
となる(ただし最後の変形で登場するcorr49は「Pちゃん以外の49人における国語と算数の得点の相関係数」であるとする)。

 この時点でかなりの体力を消耗していることだろうが、どうかもう少しお付き合いいただきたい。
 Pちゃんの総合偏差値を10D+50とおくと、標準偏差の定義から、
D=t50M50s50
が成立する。ここに、これまでの議論で判明したものをひとつずつ代入しよう。
t50M50s50=(j50+m50)(j50+m5050)7514899(2450((s49j)2+(s49m)2)+(1+4899corr49)s49js49m)=7(j50+m50)1014899(2450((s49j)2+(s49m)2)+(1+4899corr49)s49js49m)=7(504899s49j+504899s49m)1014899(2450((s49j)2+(s49m)2)+(1+4899corr49)s49js49m)=72(s49j+s49m)22450((s49j)2+(s49m)2)+(1+4899corr49)s49js49m=98((s49j)2+(s49m)2)+196s49js49m22450((s49j)2+(s49m)2)+(1+4899corr49)s49js49m=49((s49j)2+(s49m)2)+98s49js49m4900((s49j)2+(s49m)2)+2(1+4899corr49)s49js49m
 以上より、Pちゃんが各教科において偏差値51をとるとき、Pちゃんの総合偏差値はs49j,s49m,corr49のみに依存することが判る。1corr491であり(相関係数の定義)、s49m>0であるから( s49m=0のときm50=0であり、Pちゃんの得点が平均点を上回らない)、何らかの実数x,θを用いてs49js49m=x,corr49=cosθとおける。なお、s49m>0と同様にs49j>0でもあるため、x>0である。
t50M50s50=49((s49j)2+(s49m)2)+98s49js49m4900((s49j)2+(s49m)2)+2(1+4899corr49)s49js49m=49((s49js49m)2+1)+98(s49js49m)4900((s49js49m)2+1)+2(1+4899corr49)(s49js49m)=49(x2+1)+98x4900(x2+1)+2(1+4899cosθ)x=(4900(x2+1)+2(1+4899cosθ)x49(x2+1)+98x)12=(1002(48994899cosθ)x49(x2+1)+98x)12=(100(1cosθ)9798x49(x+1)2)12
 x>0において0<9798x49(x+1)29798x49((x+1)2(x1)2)=9798x49×4x=489998であり、かつ01cosθ2を考慮すると、
(100(0)×2x49(x+1)2)12(100(1cosθ)9798x49(x+1)2)12(100(2)×(489998))12()
(100(0)×2x49(x+1)2)12t50M50s50(100(2)×(489998))12
10012t50M50s50(149)12
110t50M50s507
110D7
が必要であるといえよう。

 逆に、D=110となる分布の例、D=7となる分布の例のそれぞれを挙げられれば、十分性も示せる。そして今回、そのような例を実際に挙げられる。あと一息である。
 D=110となる例、すなわちPちゃんの総合偏差値が51となる例については簡単に挙げられる。Pちゃんは国語と算数の偏差値がともに51であるため、各々が国語と算数で同点を獲得する場合において、Pちゃんの偏差値が51となる(ある分布における各々の得点を2倍しても偏差値は不変である)。得点を整数にしたければ、j50=504899s49jが整数となるようなs49jを考えて逆算すればよい。実際、s49j=9798となるような国語の得点の分布を考えれば、その分布において504899s49j=10は整数となる。簡単な計算により9798×49=22×1082+6×1932であるので、例えば以下のケースにおいて、Pちゃんの各教科の偏差値は51、総合偏差値も51となることが従う(Pちゃん以外の49人の平均点を0点と仮定しているために負の得点が生じているが、それが気になる人は全員の得点に同一の点数を加えてもよい)。
国語の点数(点)算数の点数(点)その得点の組であった人数(人)
10101(Pちゃん)
-193-1933
-108-10811
0021
10810811
1931933
 D=7となる例、すなわちPちゃんの総合偏差値が120となる例についても考えよう。D=7となるのは(つまり等号成立条件は)、()より、1cosθ=2のときである。このときcosθ=1であり、従ってcorr49=1である。ゆえに、Pちゃん以外の国語と算数の得点の相関係数が1である場合に、Pちゃんの総合偏差値が120となる。先程と同様に、j50m50が整数になる場合も計算できて、例えば以下のケースにおいて、Pちゃんの各教科の偏差値は51、総合偏差値は120となることが従う(全員の得点に200点を加えると、最初の解説に示した得点分布となる)。
国語の点数(点)算数の点数(点)その得点の組であった人数(人)
10101(Pちゃん)
-1931933
-10810811
0021
108-10811
193-1933

 ここまでの議論を統合して、Pちゃんの総合偏差値は51以上120以下であることが確定する。



あとがき

 上記の結果は直感に合致していただろうか。匿本人としては、比較的counterintuitiveな内容だったように思われる。なお、 Twitterにて開催したアンケート調査 では、123名中、正答を導けたのが39名であった(ただし、Twitterの住民は極端な選択肢を好んで選ぶ傾向があるので、実際の理解度と差異を生じている可能性も否定できない)。

 ところで、本問をより一般化して、『2教科で構成される模試をn人が受験した。受験者Xは、各教科の偏差値がともに50+εであった(ε>0)。このとき、Xの総合偏差値は最大でいくらになるか。』という問題を考えることもできる。この場合、εの値にかかわらず( テストと8人の受験者(解答編) で示したことと同様に、n人の集団における偏差値には上限50+10n1があるので当然ε10n1だが)、Xの総合偏差値の最大値は50+10n1となる。時間に余裕のある読者は、上の解説を参考にして証明してみよう。

 所謂「受験シーズン」が近くなってきたが、万一読者の中に受験生が居られるようであれば、模試の偏差値を恨みがましく睥睨するだけでなく、たまにはこうして「偏差値」そのものの性質を考察する時間を設けるのも風情があるように思う。というか受験生はこんな冗長な記事を読んでいる場合ではない。
投稿日:20211121
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。
バッチを贈って投稿者を応援しよう

バッチを贈ると投稿者に現金やAmazonのギフトカードが還元されます。

投稿者

匿(Tock)
匿(Tock)
201
29033
主に初等幾何・レムニスケート。時々偏差値・多重根号。 「たとえ作曲家が忘れ去られた日であっても、彼の旋律が街並みを縫って美しく流れていますように。」

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中
  1. 問題
  2. 解説
  3. ちょっと待て
  4. 真の解説
  5. あとがき