Suche

Drucken Drucken

Binomialverteilung

Die Binomialverteilung gibt Aufschluss darüber, mit welcher Wahrscheinlichkeit bei einer Folge von n Bernoulli-Versuchen  das Ereignis A genau k-mal vorkommt. Die Wahrscheinlichkeiten der beiden Grundereignisse A und \overline{A} ergänzen sich zu 1 und werden mit q und 1-q bezeichnet. Dabei ändern sich die Wahrscheinlichkeiten durch die Wiederholungen nicht. Es handelt sich entweder um ein Experiment mit Zurücklegen oder die Grundgesamtheit ist so groß, dass die Wegnahme von einzelnen Elementen die Wahrscheinlichkeit nicht wesentlich beeinflusst. Es wird davon ausgegangen, dass eine Grundgesamtheit hinreichend groß ist, wenn sie zehnmal größer als die Stichprobe ist.

X beschreibt die Anzahl der Wiederholungen des Experiments, bei denen das Ereignis A eintritt. Die Ergebnismenge für X ist damit \left{0,1,2,3,4,\ldots, n; X\in\mathbb{N}\right} – das Ereignis A kann also mit einer (ganzzahligen) Häufigkeit zwischen 0 und n eintreten.

Die Wahrscheinlichkeit dafür, dass das Ereignis A genau k-mal eintritt bezeichnen wir mit P(X=k).

Nehmen wir ein Beispiel, um die Formel zu entwickeln. Aus einem Pool mit 1.000 Glühbirnen werden zehn Glühbirnen gezogen.{{1}}[[1]]Die Größenverhältnisse sind so gewählt, dass sich die Wahrscheinlichkeit durch das Ziehen der zehn Glühbirnen nicht wesentlich ändert.[[1]] Die Wahrscheinlichkeit, dass eine Glühbirne defekt ist, liege bei 5%. Wir können nun die Wahrscheinlichkeit dafür ermitteln, dass sich unter den zehn gezogenen Glühbirnen genau drei defekte befinden. Dazu betrachten wird das Problem in zwei Stufen:

  1. Auf der ersten Stufe fragen wir uns, wie wahrscheinlich eine – beliebige – Kombination aus drei defekten (D) und sieben heilen (ND) Glühbirnen ist. Stellen wir uns den dazu gehörigen Ereignisbaum mit 10 Stufen vor und wenden die Pfadmultiplikationsregel an, so erhalten wir z.B. für die Kombination D,D,D,ND,ND,ND,ND,ND,ND,ND: P (D,D,D,ND,ND,ND,ND,ND,ND,ND)=0,05^3*0,95^7.
  2. Auf der zweiten Stufe unserer Überlegung fragen wir uns, wie viele solcher Kombinationen aus drei defekten und sieben heilen Glühbirnen möglich sind. Die Fragestellung ist also, wie drei defekte Glühbirnen auf zehn Plätze verteilt werden können.{{1}}[[1]]Es sei hier schon angemerkt, dass die Frage, wie viele Möglichkeiten es gibt, sieben heile Glühbirnen auf zehn Plätze zu verteilen, zum gleichen Ergebnis führen muss, da bei zehn Glühbirnen drei defekte gleichbedeutend sind mit sieben heilen Glühbirnen.[[1]] Aus der Kombinatorik wissen wir, dass es dafür \binom{10}{3} Möglichkeiten gibt.

Damit haben wir die beiden Elemente der gesuchten Formel. Eine Kombination aus drei defekten und sieben heilen Glühbirnen hat die Wahrscheinlichkeit gemäß der ersten Gleichung und es gibt diese Kombination in einer Häufigkeit, die der zweiten Formel  entspricht. Insgesamt ergibt sich damit für diesen Fall

    \[P(X=3)=\binom{10}{3}*0,05^3*0,95^7\]

oder allgemein, wenn die Wahrscheinlichkeit für das Auftreten von A mit q bezeichnet wird:

    \[P(X=k)=\binom{n}{k}*q^n*(1-q)^{n-k},\ k=0, 1, 2,\ldots, n.\]

Rechnen mit Tabellen

 In Büchern sind oft Tabellen zur Binomialverteilung angegeben. Hier finden sich Tabellen für den Fall n=50. Es handelt sich dabei um eine Tabelle mit den Einzelergebnissen und eine mit kumulierten Wahrscheinlichkeiten, d.h. dass die Wahrscheinlichkeiten die addierten Werte von 0 bis zum dem jeweiligen Wert von n angeben. So ist z.B.

    \[P_{0,1} ( X\leq6 )= \sum_{i=0}^6 P_{0,1}( X=i )=0,7702.\]

Siehe dazu in der Tabelle der kumulierten Wahrscheinlichkeiten in der linken Spalte den siebten Wert von oben.

Die Wahrscheinlichkeit, dass – bei einer Einzelwahrscheinlichkeit von 0,1 – von 50 zufällig gezogenen Glühbirnen bis zu sechs Glühbirnen – also 0, 1, 2, 3, 4, 5 oder 6 Glühbirnen defekt sind -, beträgt 77,02%.

Einzelne Wahrscheinlichkeiten berechnen (Einzelwahrscheinlichkeit kleiner 0,5)

Soll jetzt die Wahrscheinlichkeit für genau sechs defekte Glühbirnen berechnet werden, gilt{{3}}[[3]]Bei diesem und den folgenden Beispielen gehen wir von q=0,1 , n=50 , 0\leq k\leq n und 0\leq k_1 < k_2 \leq n aus.[[3]]

    \[P(X=6)=P(X\leq 6)-P(X\leq 5)=0,7702-0,6161=0,1541.\]

Von der Ereignismenge \left{0,1,2,3,4,5,6\right} wird die Ereignismenge \left{0,1,2,3,4,5\right} subtrahiert, so dass nur die Ereignismenge \left{6\right} übrig bleibt. Allgemein:

    \[P(X=k)=P(X\leq k)-P(X\leq k-1)\]

.

Wahrscheinlichkeitsbereiche berechnen (Einzelwahrscheinlichkeit kleiner 0,5)

Die Wahrscheinlichkeitsbereiche lassen sich noch weiter unterteilen.

Nach oben beschränkte Bereiche

Die Wahrscheinlichkeit, dass sechs oder weniger Glühbirnen defekt sind, kann durch Ablesen gelöst werden:

P(X\leq 6)=0,7702.

Es muss nur auf die Formulierung geachtet werden. So ist die Formulierung “weniger als sieben Glühbirnen” äquivalent zu “Sechs Glühbirnen oder weniger” und hat entsprechend die gleiche Wahrscheinlichkeit. Allgemein gilt:

    \[P(X<k)=P(X\leq k-1),\]

weil alle Variablen ganzzahlig sind.

Nach unten beschränkte Bereiche

 Es soll die Wahrscheinlichkeit berechnet werden, dass mehr als sechs Glühbirnen defekt sind. Dazu berechnen wir zuerst das Gegenereignis und ziehen dieses Ergebnis von 1 ab. Das Gegenereignis zu “mehr als sechs Glühbirnen defekt” ist “sechs oder weniger Glühbirnen defekt”:

P(X>6)=1-P(X\leq 6)=1-0,7702=0,2298.

Allgemein gilt:

    \[P(X>k)=1-P(X\leq k) \text{ bzw. } P(X\geq k)=1-P(X\leq k-1).\]

Beidseitig beschränkte Bereiche

Es soll die Wahrscheinlichkeit dafür, dass zwischen zwei und fünf Glühbirnen defekt sind, ausgerechnet werden. Es ist also P(2<X<5) gesucht. Da die Tabelle 2  kumulierte Wahrscheinlichkeiten angibt, werden die “<”–Zeichen in “\leq”-Zeichen verwandelt: P(2<x<5)=P(3\leq X\leq 4). Damit wird nach der Wahrscheinlichkeit gefragt, dass drei oder vier Glühbirnen defekt sind: P(x\leq 4)-P(X\leq 2)=0,4312-0,1117=0,3195. Allgemein gilt:

    \[P(k_1\leq X\leq k_2)=P(X\leq k_2)-P(X\leq k1-1).\]

Einzelwahrscheinlichkeiten berechnen (Einzelwahrscheinlichkeit größer 0,5)

In den Tabellen der kumulierten Wahrscheinlichkeit für die Binomialverteilung – wie z.B. in der Tabelle 2 – sind die Werte nur für Einzelwahrscheinlichkeiten bis 0,5 angegeben. Will man die Wahrscheinlichkeiten für höhere Einzelwahrscheinlichkeiten berechnen, muss man einige Überlegungen anstellen. Betrachten wir wieder das Beispiel mit zehn gezogenen Glühbirnen. Die Wahrscheinlichkeit, dass genau sieben Glühbirnen nicht defekt sind, ist – bei einer Einzelwahrscheinlichkeit von q=0,05 für eine defekte Glühbirne

    \[P_{0,95}(X=7)=\binom{10}{7}*0,95^7*0,05^3.\]

In der Tabelle für die Wahrscheinlichkeiten gibt es aber keine Spalte mit der Wahrscheinlichkeit 0,95. In der beschriebenen Situation bedeuten sieben nicht defekte Glühbirnen im Umkehrschluss, dass es drei defekte Glühbirnen geben muss. Ob also sieben nicht defekte aus zehn Glühbirnen gezogen werden oder drei defekte aus zehn Glühbirnen ist egal: Die Wahrscheinlichkeit muss gleich groß sein, weil bei zehn Glühbirnen sieben nicht defekte das Gleiche bedeutet wie drei defekte. Es gilt also

    \[P_{0,95}(X=7)=\binom{10}{7}*0,95^7*0,05^3=P_{0,05}(X=3)=\binom{10}{3}*0,05^3*0,95^7\]

oder allgemein:

    \begin{eqnarray*}&&P_q(X=k)=P_{1-q}(X=n-k)\\& \Longleftrightarrow &\binom{n}{k}*q^k*(1-q)^{n-k}=\binom{n}{n-k}*(1-q)^{n-k}*q^k.\end{eqnarray*}

Beim Vergleich der beiden Seiten der Gleichung (4) sieht man, dass auf beiden Seiten das Produkt q^k*(1-q)^{n-k} vorkommt. Damit beide Seiten der Gleichung gleich groß sind, muss also \binom{n}{k}=\binom{n}{n-k} gelten. Ein Blick auf das Pascalsche Dreieck zeigt, dass es eine solche Symmetrie in der Tat gibt. Mit den Tabellen kann jetzt so weiter gerechnet werden, wie es im Abschnitt für Einzelwahrscheinlichkeiten unter 0,5 beschrieben wurde.

Wahrscheinlichkeitsbereiche berechnen (Einzelwahrscheinlichkeit größer 0,5)

Ähnlich wie bei im vorigen Abschnitt werden auch hier die Wahrscheinlichkeiten bei einer Einzelwahrscheinlichkeit q>0,5 in eine Wahrscheinlichkeit mit q<0,5 umgerechnet. Zur Verdeutlichung der Überlegungen wird ein Beispiel mit 50 Glühbirnen benutzt. Die Wahrscheinlichkeit, dass eine einzelne Glühbirne nicht defekt ist, beträgt q=0,9.

Nach oben beschränkte Bereiche

Es soll ausgerechnet werden, wie groß die Wahrscheinlichkeit ist, dass weniger als 45 Glühbirnen nicht defekt sind: 

    \[P_{0,9}(X<45)=P_{0,9}(X\leq 44).\]

Diese Wahrscheinlichkeit ist in der Tabelle nicht direkt ablesbar, daher müssen wir sie umrechnen. 44 oder weniger nicht defekte Glühbirnen bedeuten im Umkehrschluss sechs oder mehr defekte Glühbirnen. Gesucht wird also P_{0,1}(X \geq 6). In der Tabelle ist auch diese Wahrscheinlichkeit nicht direkt abzulesen. Daher müssen wir die Gegenwahrscheinlichkeit bilden:

    \[P_{0,1}(X\geq 6)=1-P_{0,1}(x\leq 5)=1-0,6161=0,3839. \]

Allgemein:

    \begin{eqnarray*}P_q(X\leq k)&=&1-P_{1-q}(X\leq n-k-1), q>0,5\\ P_q(X<k)&=&1-P_{1-q}(X\leq n-k), q>0,5.\end{eqnarray*}

Nach unten beschränkte Bereiche

Gesucht ist die Wahrscheinlichkeit, dass bei 50 gezogene Glühbirnen 40 oder mehr Glühbirnen nicht defekt sind: P_{0,9}(X\geq 40). In der Tabelle ist diese Wahrscheinlichkeit wegen q=0,9 nicht ablesbar. Daher muss die Bedingung umformuliert werden. 40 oder mehr nicht defekte Glühbirnen bei insgesamt 50 Glühbirnen bedeutet, dass es zehn oder weniger defekte Glühbirnen gibt. Die gesuchte Wahrscheinlichkeit ist damit P_{0,1}(x\leq 10)=0,9755. Allgemein:

    \begin{eqnarray*}P_q(X\geq k)&=&P_{1-q}(X\leq n-k), q>0,5\\P_q(X>k)&=&P_{1-q}(X\len-k-1), q>0,5.\end{eqnarray*}

Beidseitig beschränkte Bereiche

Gesucht ist die Wahrscheinlichkeit, dass bei 50 gezogenen Glühbirnen zwischen 30 und 40 Glühbirnen nicht defekt sind: P_{0,9}(31\leq X\leq 39). Es ergibt sich wieder das Problem, dass in der Tabelle die Wahrscheinlichkeit q=0,9 nicht ablesbar ist. Also muss auch hier eine Umrechnung auf die Wahrscheinlichkeit q=0,1 erfolgen. Wenn zwischen 30 und 40 Glühbirnen nicht defekt sind, bedeutet dies gleichzeitig, dass zwischen 10 und 20 Glühbirnen defekt sind:

    \[P_{0,9}(31\leq X\leq 39)=P_{0,1}(11\leq X\leq 19).\]

Dies kann nun wieder als P_{0,1}(X\leq 19)-P_{0,1}(X\leq 10) berechnet werden. Allgemein:

    \[P_q(k_1\leq X\leq k_2)&=&P_{1-q}(n-k_2\leq X\leq n-k_1)=P_{1-q}(n-k_2)-P_{1-q}(n-k_1), q>0,5.\]

 

Drucken Drucken

Schreibe einen Kommentar