下記ポストにおいて、本記事に対する指摘を頂きましたので、こちらもご覧ください。
またこれに伴って、記事の記載を全面的に見直しました。
ご指摘感謝いたします。この場を借りてお礼を申し上げます。
https://x.com/genkuroki/status/1858375336125423768
よく書籍には「十分に大きな
本記事では、中心極限定理の適用条件について厳密に考えてみることにする。ただ、初めに断っておくと、本記事で解説するのは、一つの考え方にすぎない。実際、どれくらいの大きさの
参考までに、本記事で取り扱う中心極限定理を掲示する。
と定義する。すると、次式が成り立つ。ここで、
これを、中心極限定理(central limit theorem:CLT)という。
一般の書籍において紹介されている中心極限定理は、
と定義し、さらに
が成り立つ。上記の定理をBerry-Esseenの定理という。ただし、
Berry-Esseenの定理は、文献によって表記方法にかなり揺らぎがある(本質的にはどれも似たようなことを言っている)。他文献も併せて読まれる方は、その点十分に留意して頂きたい。
さらに注意が必要なのは、累積分布関数の差の上限についてしか述べていないという点である。例えば、任意の値
以上の性質上、Berry-Esseenの定理を使用した、中心極限定理を適用可能な標本サイズの見積もりは困難だと考えられる。既に述べたように、あくまでもBerry-Esseenの定理は、中心極限定理の収束における、一つの大雑把な指標に過ぎない。
Berry-Esseenの定理を使って求められるのは「どれだけ最悪なケースでも、これくらい標本サイズを用意すれば、さすがに問題ないと思うよ?」という値である。そのため、実際には100程度で十分であるケースでも、Berry-Esseenの定理から1000,10000必要だと導かれる可能性は全く否定できない。標本サイズの見積もりは困難だ、というのはそういう意味である。
左辺は、コルモゴロフ-スミルノフ検定で登場する検定統計量と同じである。Berry-Esseenの定理は、中心極限定理によって近似した標準正規分布が、実際の標本平均の累積分布にどれくらい近いかを定量的に表している定理といえる。
Berry-Esseenの定理から次のことが言える。
「母集団の分布」と「中心極限定理の近似精度をどれくらい求めるか」によって異なり、一概には言えない。
よく「
「
統計学の専門書に「具体的にどれくらいの
中心極限定理に限った話ではないが、定理を適用する場合は、定理の適用条件についてよく考えなくてはならない。試験問題では問題文に「○○という定理を適用できる」と記載されている場合が多いが、現実世界ではそうはいかない。特に近似を行う際は、近似によって生ずる誤差について、検討しておかなければ、致命的な誤りを生む可能性がある。
中心極限定理を適用可能な標本サイズを求める手法として、次の二つが考えられる。
一番目の手法においては、下記ポストで詳細に取り上げられている。
https://x.com/genkuroki/status/1858376430226477558
任意の実数
が成り立つ。
証明の途中で三角不等式
三行目から四行目の式変形には、Berry-Esseenの定理を用いた。Berry-Esseenの定理は二つの累積分布関数の差の上限について述べている。したがって、任意の点を取ったときの差は、必ず