前回の記事
で紹介した問題の解答を記す。問題文の再掲はするが、前回を読まれていない方はそちらを先に読んでいただきたい。
問題 ~手紙では相手にとって分かりやすい伝え方を心がけましょう~
数学者Aからこのような手紙が送られてきた。
先日、僕はあるゲームに参加した。そのゲームの参加者は僕を含めて4人で、僕は2位だった。
ゲームにはスコアというものがあって、スコアが高ければ順位が上になる。
ゲーム終了後、僕自身のスコアの偏差値を計算してみたんだ。そのとき、ふと気づいた。
僕の偏差値を知るだけならば、3位と4位のスコアを完全に知る必要はなく、その積だけを知っていればよい、と。
1位と僕のスコア、それからの値がうまく噛み合った上に、同順位の参加者がいなかったからね。
Aの偏差値はいくらか。ただし、スコアは任意の実数値をとる。
方針 ~偏差値erって何? 経歴は? 年収は? 調べてみました!~
この問題は、以下の補題の考察を経て解くことができる(高校生以下が本記事を読むことも想定し、数理論理学的表記は用いていない)。
補題
ゲームに参加した4人のスコアがそれぞれ(ただし)であったと仮定する。
ある実数が存在し、を満たす任意のについて『スコアがの人の偏差値はである』が成り立つとき、の値を求めよ。
元の問題(原題)を一言で表すならば、「1位のスコア、2位のスコアおよび3位と4位のスコアの積のみから2位の偏差値が一意に定まる場合、その偏差値はいくらか」である。問題文が冗長すぎる。 このことを踏まえて補題に注目すると、これは原題と殆ど同じものだと言える。1位と2位のスコアを仮定しただけだ。 けれども、この補題はある点で原題よりも制約が弱くなっている。すなわち、の部分。これは「にを足したものとにを足したものの積がで一定である」ということを示している。の値は現時点で不明なので、その点において、補題は原題よりも少し強い主張を試みたものだと言える。
ということで、補題から考えていこう。言うまでもないが、偏差値は((素点)-(平均点))÷(標準偏差)×10+50で与えられる。
解説 ~日本のスマ補題は長すぎる~
上の補題において、を証明することができる。
補題の証明
クリックすると証明が現れます
スコアがの人(以下、この人を「N」と呼ぶ)の偏差値はになるそうだが、まずは偏差値の定義通りにNの偏差値を求めよう。つまり計算だ。
スコアの平均を、分散を、標準偏差を、それからNの偏差値をとおくと、これらは以下のように表せる。
ただし、表記を簡単にするため、分散の一般的な定義である「偏差の2乗の平均値」から派生した「素点の2乗平均から素点平均の2乗を減じたもの」をの定義に用いた(この2つが一致することは有名事実であり、もしご存知でなければ
Wikipedia
を参照されたい)。
と定めることで、以下の式が成り立つ。
、およびの定義をそのまま代入して、さらに式をゴリゴリと整理していく。
さて、を満たすの組を直交座標平面上にプロットすれば、明らかに2次曲線(2次曲線の基本的な性質は
Wikipedia
を参照)、もしくはそれが退化したものが描かれる。いま、の式に登場するはを満たす任意の数であったため、直交座標平面上のグラフはのグラフに完全に含まれていなければならない。
グラフを考えると、以下の考察からが判るので、これは2次曲線(特に、直角双曲線)の形状を呈する(反比例のグラフを思い出してほしい)。 と仮定する。この場合、との少なくとも一方は正でなければならない( がともに負であればを満たすの組が存在しなくなる)ので、と仮定できる(そう仮定しても一般性を失わない)。すると、はいずれもグラフ上の点となる。いずれのの値においても偏差値がで一定なので、
が必要である。しかしながら、において常にかつであるため、左辺は常により大きくなり、方程式は解をもたない。よっては補題に不適である。
したがって、2つの2次曲線には(どの3点も同一直線上に無い)共有点が少なくとも5点存在する。「5点を通る2次曲線は一意に定まる」という2次曲線の性質を思い出せば(こちらも有名事実なので、もしご存知なければ「2次曲線 5点」でGoogle検索していただきたい(日本語版Wikipediaには掲載されていなかった))、この2つの2次曲線は同一のものと導かれる。 同一の2次曲線を表す式では係数の比が一致するので、特におよびの係数はである必要がある。の当該係数に注目して、
と判る。このときは
と変形できるので、が判明する。
あとはの正負を考えればよい。Nの偏差値についてであったから、「Nのスコア(つまり)が平均を超えているか否か」が判れば、がより大きいか小さいか、すなわちの正負を求められる。がスコアの平均を超えていればcは正で、逆もまた然り。実は、これはすぐに判明する。の範囲におけるのグラフを考えることでが言えるからだ(お手元の紙にグラフを描いて確認してみよう)。ゆえに、
を得て、はスコアの平均を超えていることが従う。
よっては正、言い換えればであり、である。 (証明終)
補題に答えられたところで、以下に示す偏差値の性質を思い出しておきたい。
- すべてのデータに定数を加えても各データの偏差値は不変
- すべてのデータに正の定数を乗じても各データの偏差値は不変
偏差値の性質の証明
クリックすると証明が現れます
以下では本問への応用を考えて4人の場合を示すが、一般の場合も同様に示せる。
4人の素点をと文字でおいて集合をと定め、平均、標準偏差を計算すると以下のようになる。
ただし、今回は分散を「偏差の2乗の平均値」として計算した(そのほうが議論が簡単になるので)。このとき、素点がの人の偏差値は
になる。
すべてのデータに定数を加えた場合を考える。と表すと、およびは
である。したがって、は以下の通り。
ゆえに、すべてのデータに定数を加えても各データの偏差値は変わらない。
すべてのデータに正の定数を乗じた場合を考える。と表すと、およびは
である。したがって、は以下の通り。
ゆえに、すべてのデータに正の定数を乗じても各データの偏差値は変わらない。
は任意なので、これらの性質は正しい。 (証明終)
いよいよ仕上げである。上記に倣って、原題でゲームに参加した4人のスコアを~で表す。ただし、「位のスコアがである」という条件を加えておく。当然のことだが、数学者Aは2位だったので、Aのスコアはである。
仮に(ただしかつを定数として)という分布での偏差値が一定となる場合、偏差値の性質から
という分布(ただし、)におけるの偏差値も一定となる(すべてのデータにを加えてを乗じても各データの偏差値は不変)。さらにこのとき
が成り立つため、補題の結果を用いるとである。これを解くことでが得られて、よりが従う。
よって、そのときのスコアの分布は実数を用いて
と表せる( としてしまうとまたはが成り立ち、仮定した大小関係に矛盾する)。を思い出すと、ゆえにであるから、として
こそが、Aの参加したゲームにおける4人のスコアだったわけだ。要するに、このスコアの分布におけるの偏差値が、原題で問われている偏差値である。我々はそれを既に計算している。何故ならば、この分布におけるの偏差値というのは、
という分布におけるの偏差値と同一なのだから。補題より、その偏差値はである。
以上の議論より、ゲームにおけるAの偏差値は(約55.77)であった。
別解 ~補題に頼らなければこうなります~
上の解説で示した偏差値の性質より、の場合のみ考えればよい。1位と2位のスコアをそれぞれとする(当然ながら数学者Aのスコアはである)。
の場合クリックすると証明が現れます
3位と4位のいずれかのスコアがなので、が判る。ここで、4つの要素からなる集合
のいずれにおいても、の偏差値は一定であることを利用しよう。この偏差値をとおくと、偏差値の定義より
が必要である。これをに代入すればとなってを得るが、これは最初に確認したに矛盾。
よって、このは問題に不適である。
の場合クリックすると証明が現れます
と同様に考える。正直に言うとこの解法は大変なのでこれ以上書きたくない。4つの要素からなる集合
のいずれにおいても、の偏差値は一定であることを利用しよう。この偏差値をとおくと、偏差値の定義より
が必要である。これをに代入すればとなってを得るが、は集合の中で2番目に大きい要素なのでが判る。
このとき、集合
において(の場合はまたはが成り立つため除外できる)、の偏差値がであることを確かめられる(証明略)。よっては本問の解の1つである。
の場合クリックすると証明が現れます
と同様に考える。特に大変なのが式の展開。4つの要素からなる集合
のいずれにおいても、の偏差値は一定であることを利用しよう。この偏差値をとおくと、偏差値の定義より
が必要である。これをに代入すればとなるが、そのようなは存在しないため矛盾。
よって、このは問題に不適である。
以上3つのを考えた結果として、本問の解はに限られる。
あとがき ~この部分に入れる文章は朝4時のテンションで決めています~
Aはゲーム終了後、直ちにこの事実を見抜いたという。ゲームの会場で紙とペンを取り出し、場の空気も読まずに黙々と計算したのだろうか。それとも、この程度の事実は暗算で導けたのだろうか。謎は深まるばかりだが、いずれにせよ、いかにも数学者らしいエピソードであろう。勿論フィクションである。
本問を解く鍵はどこにあったか。それは、「Aが2位であったこと」、「3位と4位のスコア自体は不必要で、その積だけを用いてAの偏差値が算出されたこと」、それから「同順位の参加者がいなかったこと」の3つだ。
最後の1つは一見役に立っていないように思われるが、実際には補題を解く過程で強く貢献している。それを確認しよう。補題においてとすると、これはを満たし、かつNのスコアが2番目に大きい状況は覆らない。だが、このときNの偏差値を計算するとになってしまう( はスコアの平均であるよりも小さい)。補題の解が存在しなくなるのだ。補題が解けなければ原題も解けないので(原題においては4人のスコアがである場合が考えられる)、このケースを除外するために「同順位の参加者がいなかったこと」はどうしても必要だった。
最後に解説(もしくは別解)を検討すると、副次的な結果として「題意を満たす得点分布において、1位のスコアは2位のスコアの2倍である」という性質も得られている。こちらも興味深い性質だ。もしも読者がこのゲームに(読者含め4人で)参加して2位となり、1位が読者のスコアの2倍となっていれば、本問と同様の状況を迎えているかもしれない。超レアな体験の可能性に賭けて、直ちに3位と4位のスコアの積を訊いてみよう。ゲームの名前は知らないけれども。
本問を通じて、新たなる偏差値erが誕生することを微かに望む。
長かった。前回の「テストと8人の受験者」で「HTMLコードも含めて7000文字以上書いたのだが」などと甘えたことを言っていたのがもはや懐かしい。今回はなんと約29000文字(HTMLコードも含めて)。「別解を書こう」と思った時点で間違っていたのかもしれない。