2

箱ひげ図から全力で情報を読み取る

670
0

  Twitter で興味深い問題を観測したため、久々に記事を書きます。


 今回のテーマは『箱ひげ図』。数学Ⅰで登場して直ちに忘れられ、共通テストで再会して受験生に絶望をもたらす、あの図です。基本的に第1・第3四分位数を読めたら正解できる設問が多いので、共通テストではそこを意識しましょう。
 とはいえ、はたして箱ひげ図のパワーはそれだけなのでしょうか。もっと色々な情報を読み取れる場合もあるのではないでしょうか。数学を嗜む皆様としましては、そのように考えたくなりますね。えっ、ならない? 本当に? ……共通テストの作問者がそう考えている可能性は十分にありますので、皆様も少しは考えていたほうがよいと拝察いたします。お節介かもしれませんが。
 では、情報を読み取ってみましょう。以下の問題をご覧ください。


問題紹介

@suugaku_koukou様の問題を一部改変

 次の箱ひげ図は15人が受験した数学のテストの得点を表しています。このとき、箱ひげ図から読み取れる事実として、以下の①②③はそれぞれ正しいですか。
  ① 平均点は35点よりも高い。
  ② ちょうど20点をとった人がいる。
  ③ 最下位の偏差値は35よりも高い。
 ただし、四分位数の定義は文部科学省のそれに従うものとします。

▲非常にリアルな得点分布


 元ネタは 数学共通テスト自作問題・入試問題演習 様が作問された こちらの問題 です。「平均点」・「具体的な点数」・「偏差値」と、普段の箱ひげ図では滅多に見られない3要素が揃っています。箱ひげ図をじっくり見れば、こういった情報も浮かび上がってくるのでしょうか。
 すぐ下に解答が載っているため、熟考したい方はここでスクロールを止めてください。







解答発表

 ①②③はすべて正しい

解説

 15人の得点を昇順に並べた数列をaiとすると(1i15)、箱ひげ図より以下の事実が分かる。
a1=10,a4=20,a8=30,a12=70,a15=90
 よって②は正しい。また、aiの平均をmとおけば、aiは広義単調増加であるから、
103+204+304+703+9015m10+203+304+704+90315より1063m1483を得る。よって①も正しい



 残るは③であるが、その前に以下の補題を示しておく。

補題1

 N個の数からなる集合GNがあり、その平均はMである。いま、ここにxという数値を追加して(N+1)個の数からなる集合GN+1を作る。このとき、xMに近ければ近いほど、GN+1の分散は小さくなる

補題1の証明

 GNの分散をVNGN+1の分散をVN+1とおくと、(分散)=(2乗の平均)-(平均の2乗)であるから、以下の式が成立する(左辺・右辺ともにGN+1の要素の2乗和となる)。
(N+1)(VN+1+(NM+xN+1)2)=N(VN+M2)+x2VN+1=N(VN+M2)+x2N+1(NM+xN+1)2=NVNN+1+N(xM)2(N+1)2(i)
 xMに近づくと、(i)は明らかに小さくなる。これが示すべきことであった。



 さて、aiの分散をs2とする。2以上14以下の自然数kを任意にとり、数列aiのうちakの値だけを動かしてみよう。
 この操作でk項目以外のaiの値は不変であるから、補題1より、akが残り14項の平均mに近ければ近いほどs2は小さくなる1063m1483を考慮すると、
114(10631590)<m<114(14831510)
すなわち2207<m<3657と分かる。したがって、例えばk=7の場合、操作前は20ak30であり、ak=30と置き換えたときのaiの分散はs2以下といえる( m>30)。他の場合も同様に考えれば、
a2=a3=20,a5=a6=a7=30,a13=a14=70
のときにs2が最小となることが分かる( 30<m<70)。



 改めてaiの平均がmであるという事実に注目すると、このときa9+a10+a11=15m490である。この条件下では、mを固定したとき、aiの2乗和が小さければ小さいほどs2も小さくなる( 分散の定義)。
(a92+a102+a112)(12+12+12)(a91+a101+a111)2=(a9+a10+a11)2=(15m490)2となるので( コーシー・シュワルツの不等式)、a9=a10=a11=15m4903のとき、a92+a102+a112は最小値(15m490)23をとるといえる。以上より、平均がmという条件の下では、
ai={10,20,20,20,30,30,30,30,15m4903,15m4903,15m4903,70,70,70,90}
s2を最小にする得点分布であることが示される。なお、このときs2=(6m245)2+46159である。



 分散が小さければ標準偏差も小さくなり、1位の偏差値は高く、最下位の偏差値は低くなる。つまり、有り得るどのようなmについても、s2を最小化した場合に最下位の偏差値が35を超えているならば、③は正しいといえる。
 ここで、数列bi
bi={10,20,20,20,30,30,30,30,15m4903,15m4903,15m4903,70,70,70,90}
と新たに定義し、数列biにおけるb1(=10)の偏差値D(m)を考えよう。1063m1483の範囲でD(m)>35が成り立つことを確認したい。偏差値の定義より、u=(6m245)2+4615として
D(m)=b1ms10+50=5030(m10)uddmD(m)=30(m10)(ddmu)30uu=300(111m4994)uuであるから、この範囲におけるD(m)の増減表は以下の通り。

m106349941111483
ddmD(m)0+
D(m)5019027135010194292350295451

 ゆえに、D(m)50101942923>35が常に成立する。よって③も正しい



 結局、①②③はすべて正しいのである。



正答割合

 Twitterの投票機能で正答者の割合を調べてみました。 ①と②の結果 ③の結果

全問正解率(推定)
26.5%58.7%39.3%5.2%~7.1%

 あれだけ長々と解説した③よりも①のほうが難しいようですね。ただ、「正しい」「正しくない」の2択から選んでいることを踏まえれば、どの問題もかなり誤答は多いと感じます。もっと箱ひげ図を信じてあげましょう。



次回予告

 未定の一語に尽きます。プライベートがやや多忙になったもので……。
 



投稿日:2023915
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。
バッチを贈って投稿者を応援しよう

バッチを贈ると投稿者に現金やAmazonのギフトカードが還元されます。

投稿者

匿(Tock)
匿(Tock)
211
31585
主に初等幾何・レムニスケート。時々偏差値・多重根号。 「たとえ作曲家が忘れ去られた日であっても、彼の旋律が街並みを縫って美しく流れていますように。」

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中
  1. 問題紹介
  2. 解答発表
  3. 正答割合
  4. 次回予告