中身の見えない袋の中に、の文字のいずれか1つが書かれた4つの球がある。 「袋から無作為に球を取り出し、書かれた文字列が記録して袋に戻す」という操作を繰り返し、「」という文字列が記録されたら作業を終了する。 ちょうど回の操作で作業が終了する確率を求めよ。 (国際信州学院大学 H29)
解答
回で作業が終了する確率を、回の作業で「」の文字列が含まれている確率をとする。
である。
まずは具体的に考えてみよう。
のときは勿論。
となる。
(例えばのとき、
、、、、のパターンが考えられ、それぞれは独立である。)
の場合、が異なる場所に2つできるため、先ほどの「がある場所1つにできる場合全体」の中で重ねて数えてしまっているものがある。
が2つ出来る場所の総数が分かれば求められそうだ。
2つとその10文字を除いた他の文字との並べ替えになるので、通りとなる。
よってのとき、
といったことをが個あるときまで繰り返すだけです。
(はを超えない最大の整数のことです。)
個まで繰り返すのはいいのですがのときの議論があんまり自明じゃないので、少し深堀していきます。
個の集合の和集合の要素の個数
「」が2個のとき、重複した分を引いてあげるため、その確率を引き算していましたが、一般に「」が個ある場合はどう対応すればよいのでしょうか。
実は、以下のような公式があります。
個の和集合の要素の個数
個の和集合の和集合の要素の個数について、以下が成り立つ。
つまり今回の例でいうと「」がある場所に奇数個あるときは足して、偶数個あるときは引く、ということです。
任意のに対して、右辺の式を適用してが合計何回足されるかを確かめる。
(略記:)
かつである、(つまり、ある個の集合の中には入っているが、それ以外の集合には入っていない)と仮定すると、
の項では個の数字の中から1つ選ぶので回足され、
の項では個の数字の中から2つ選ぶので回引かれ、
の項では個の数字の中から3つ選ぶので回足され、
と繰り返していけば、
が足された回数は、回と分かり、に対する
二項定理より
であるから、である。
よって、任意のに対して右辺は1回足されるので、右辺の計算結果は和集合の要素の個数に等しい。
この証明は
こちらのもの
をほとんど引用させていただいております。
あとは「」が個あるときの場所のパターン数は、残りの個と文字を並び替えるので通りとなる。
よって、とすれば、
(この式にパスカルの法則:を上手く適用出来れば総和をまとめることが出来ることに注目する。)
ここで、シグマの上限が異なっているとまとめ上げることが出来ないので、の項のシグマの上限をに変更したものを考える。がの倍数でないときはどちらも同じである。
ではがの倍数、つまり整数を用いてと表せるとき、
上限はとなり、と表せるので、コンビネーションの定義外となる。これをと置けば、結果的にシグマの上限を変えたものも値が変わらないことになり、
のときにもパスカルの法則:
が成り立つことが分かる。よって、
と分かる。
一般化
同様の議論をすることにより、以下のような公式が得られます。
種類の文字が同様の確率で出力されて文字の文字列を生成する。また、その種類の文字の中から文字のキーワードを設定するとき、
先頭の文字と末尾文字がのいずれのに対しても等しくないときに限り、文字でそのキーワードが生成される確率は、
となる。
例外について:例えば「ア」「コ」「の」「ラ」という文字と「コアラのコア」というキーワードを設定したとします。すると、重複して数えてしまっている場合が多くなってしまいます。本来、この場合だと6文字周期で被りを考えるのですが、「コアラのコアラのコア」などというように、末尾と先頭が繋がってしまうとその部分の重複も除かなければならなくなります。これが存外面倒なので今回は考えてません。
(コアラのコアに関する先行研究をしておらず、同名のキャラクターがどうやら存在しているので、只今別の例を模索中です。)
おわりに
正直合っているかどうかは不明ですし、解答が級数のままなので、まだ解答をまとめられる可能性があります。間違い、この級数の計算方法や、先ほどの重複まで含めた一般化などが出来たという方は、教えて下さると非常に助かります。