Wie kann man die Formel der Normalverteilung zur Approximation der Binomialverteilung für „große“ n begründen?

Warum passt die Funktion\[\varphi_{\mu,\sigma} (x)=\frac{1}{\sigma \sqrt{2\pi }}{{e}^{-\frac{1}{2}{{\left( \frac{x-\mu }{\sigma } \right)}^{2}}}}\]für große n so erstaunlich gut zur Binomialverteilung mit der Formel\[{{P}_{n,p}}(k)=\left(\begin{matrix}n\\k\\\end{matrix} \right){{p}^{k}}{{(1-p)}^{n-k}}\]an den Stellen x=k? Anschaulich:

Die Herleitung der Funktionsgleichung von \(\varphi (x)\) ist auf viele äußerst interessante Weisen möglich und jede Herleitung ist ein kleines mathematisches Kunstwerk!

 

Carl-Friedrich Gauß zu Ehren wurde diese Formel auf 10 DM Scheinen abgedruckt:

Die Herleitung der Gleichung wird im Folgenden nur für den Spezialfall\(p= \frac{1}{2}\)gezeigt. Denn in diesem Fall vereinfachen sich viele Terme stark.

Für \({{P}_{n,\,\frac{1}{2}}}(k)\) gilt z.B.:\[\mu =n\cdot p=n\cdot \frac{1}{2}=\frac{n}{2}\]und\[\sigma =\sqrt{n\cdot p\cdot (1-p)}=\sqrt{n\cdot\frac{1}{4}}=\frac{\sqrt{n}}{2}\]Der weitere Rechenaufwand für diesen "einfachen" Fall ist immer noch beachtlich trickreich!

Der allgemeine Fall ist deutlich aufwändiger als hier gezeigt. Wen es interessiert, der sollte Mathematik oder Statistik studieren, dort wird es erklärt!