Suche

Drucken Drucken

Hypothesentests

Beim Testen von Hypothesen geht es darum, unbekannte Tatsachen mit Hilfe statistischer Methoden abzuschätzen. Oftmals kann man eine aufgestellte Behauptung nicht direkt überprüfen, sondern sie nur testen. Nehmen wir an, wir erhalten eine Lieferung von 10.000 CDs von denen 2% defekt sein sollen. Die Kontrolle der gesamten Lieferung würde nicht unerhebliche Ressourcen verschlingen. Daher wird man eine Stichprobe nehmen, um von dieser Stichprobe auf die Grundgesamtheit zu schließen.

Grundsätzlich muss gesagt werden, dass man eine Hypothese mit einem Test nie beweisen kann. Man kann durch einen gelungenen Test nur vermuten, dass die Behauptung stimmt. Durch einen misslungenen Test kann man die Hypothese verwerfen.

Wir werden uns dabei anfangs auf Verteilungen konzentrieren, die wir mit Hilfe der Binomialverteilung darstellen können. Da wir ein unsicheres Ereignis betrachten, wird es auch immer einen Fehler geben. Die Ergebnisse werden immer eine Empfehlung enthalten, etwas zu tun oder zu lassen, das sich im Nachhinein als falsch heraus stellen kann. Am Anfang des Kapitels werden einige Begriffe geklärt, die für das weitere Verständnis wichtig sind.

Mit Hilfe des Erwartungswerts und der Standardabweichung können nun Wertebereiche für die Binomialverteilung definiert werden. Dabei gilt, dass ein Intervall \lbrack E-x*\sigma ;E+x*\sigma\rbrack eine bestimmte Menge an Daten enthält. Je höher das x gewählt wird, desto größer wird betrachtete Bereich und desto mehr Ergebnisse liegen innerhalb dieses Bereiches. Drei Werte sind von Interesse:

  • Bei einer Abweichung von 1,64\sigma erhält man 90% aller erwarteten Ergebnisse,
  • bei einer Abweichung von 1,96\sigma erhält man 95% aller erwarteten Ergebnisse und
  • bei einer Abweichung von 2,58\sigma erhält man 99% aller erwarteten Ergebnisse.

Verdeutlichen wir uns dies an einem Beispiel. Für ein Fußballspiel werden 200 Freikarten vergeben. Erfahrungsgemäß kommen 75% der Freikarteninhaber zu einem Spiel. Mit wie vielen Zuschauen kann man in 95% der Fälle rechnen?

Der Erwartungswert der Verteilung ist 0,75*200=150. Die Standardabweichung ist \sigma =\sqrt{200*0,75*,025}=6,123724356. Um das Intervall zum Sicherheitsniveau 95% zu berechnen, muss vom Erwartungswert das 1,96-fache der Standardabweichung addiert bzw. subtrahiert werden:

    \begin{eqnarray*}150+1,96*6,12&=&161,9952\approx 162\\150-1,96*6,12&=&138,0048\approx 138.\end{eqnarray*}

Mit 95%-er Wahrscheinlichkeit kommen zwischen 138 und 162 Freikartenbesitzer ins Stadion. Wenn allen Freikartenbesitzern in diesem Bereich ein Platz garantiert werden soll, müssen 160 Plätze reserviert werden. Die restlichen 5% der Fälle, die durch die Bereiche unter 140 und über 160 Plätzen abgedeckt werden, nennt man Siginifikanzniveau – hier beträgt es 5%.

Abbildung 1: 95%-Sicherheitsintervall

Dieses Beispiel ist in der Abbildung 1 dargestellt. Die beiden senkrechten Geraden b und c geben dabei die Ränder des Konfidenzintervalls zum Niveau 95% an – dies bedeutet, dass innerhalb dieser beiden Grenzen 95% aller möglichen Ergebnisse liegen. Rechts von Gerade c und links von Gerade b liegen jeweils 2,5% der Ergebnisse, die als signifikant abweichend bezeichnet werden. Ihr Auftreten ist so unwahrscheinlich, dass sie vernachlässigt werden. Wenn im gewählten Beispiel danach gefragt wird, mit wie vielen Zuschauern mit einer Sicherheit von 97,5% maximal zu rechnen ist, dann sind Zuschauerzahlen unter 140 sind für die Betrachtung nicht interessant. Wenn 160 Plätze frei gehalten werden, passiert es in 2,5% der Fälle, dass mehr als 160 Zuschauer kommen. Das heißt, dass man in 2,5% der Fälle den Fehler begeht, zu wenig Plätze zu reservieren, wenn 160 Plätze zur Verfügung gestellt werden.

Das Vorgehen bei Hypothesentests

Ein Hypothesentest besteht insgesamt vier Schritten:

  1. Es wird eine Hypothese H_0 aufgestellt. Zeitgleich stellt man eine Gegenhypothese H_1 auf, die H_0 widerspricht. Die Gegenhypothese ist insbesondere bei einseitigen Hypothesentests wichtig.
  2. Aus dem Signifikanzniveau leitet man den Ablehnungs- und den Annahmebereich und damit eine Entscheidungsregel her.
  3. Die Stichprobe wird gezogen.
  4. Anhand der aufgestellten Entscheidungsregeln wird die Hypothese verworfen oder angenommen.

Zweiseitige Hypothesentests

Bei einem zweiseitigen Hypothesentest wird geprüft, ob die angegebene Wahrscheinlichkeit plausibel ist, oder ob es Abweichungen nach unten oder oben gibt. Nehmen wir ein Beispiel. Wir haben einen sechsseitigen Würfel und wollen prüfen, ob die 6 mit der Wahrscheinlichkeit p=\frac{1}{6} bei n=720 Würfen fällt. Es ist also

  • H_0 : Die 6 fällt in einem Sechstel aller Würfe p=\frac{1}{6}.
  • Die Gegenhypothese H_1 ist, dass die 6 nicht in einem Sechstel aller Würfe fällt.

Als Sicherheitsbereich nehmen wir 95%, so dass ein Signifikanzniveau bzw. eine Irrtumswahrscheinlichkeit von 5% bleibt. Die Irrtumswahrscheinlichkeit ist die Restwahrscheinlichkeit des Sicherheitsniveaus zu 100%. Nun stellen wir die Entscheidungsregel auf. Wir berechnen den 95%-Bereich um den Erwartungswert

    \[\mu=np=720*\frac{1}{6}=120.\]

Die Standardabweichung ist

    \[\sigma =\sqrt{np(1-p)}=\sqrt{720*\frac{5}{6}\frac{1}{6}}=10.\]

Als Annahmebereich – das sind die Werte, bei denen die Hypothese beim gegebenen Signifikanzniveau angenommen werden sollte – ergibt sich

    \begin{eqnarray*}\lbrack\mu -1,96\sigma &;&\mu +1,96\sigma\rbrack\\\lbrack 120-1,96*10&;&120+1,96*10\rbrack\\\lbrack100,4&;&139,6\rbrack\end{eqnarray*}

Da es nur ganzzahlige Ergebnisse gibt, wird immer „nach innen gerundet“ Dies bedeutet, dass untere Zahl immer auf- und die obere Zahl immer abgerundet wird. Somit lautet die Entscheidungsregel: Verwerfe Hypothese H_0, wenn in der Stichprobe mehr als 139 oder weniger als 101 Ergebnisse mit dem Wert 6 sind. Die ist der sogenannte Ablehnungsbereich. Mit dieser Regel liegt man in 95% der Fälle richtig – aber auch in 5% der Fälle falsch.

Einseitige Hypothesentests

Bei einem zweiseitigen Hypothesentest wird gefragt, ob eine Wahrscheinlichkeit p_1 plausibel ist oder nicht. Die Hypothese H_0 lautet in einem solchen Fall p=p_1. Bei einem einseitigen Hypothesentest wird geprüft, ob eine Wahrscheinlichkeit als zu hoch oder zu niedrig angegeben ist.

Abbildung 2: Fehlerbereiche beim zweiseitigen Test

Das bedeutet, es wird entweder p>p_1 oder p<p_1 geprüft.

Bevor wir den Ablehnungs- und Annahmebereich berechnen, folgt eine Überlegung zum Signifikanzniveau in diesem Beispiel. Das Signifikanzniveau ist 5%. Da der Baumarkt mit einer Defektrate unter 7% zufrieden ist, wird er beispielsweise ein Ergebnis von 2% defekten Glühbirnen nicht als Ablehnungsgrund für die Lieferung ansehen. Der Ablehnungsbereich kann damit komplett auf einer Seite des Erwartungswertes liegen – anders als bei zweiseitigen Tests, bei denen der Ablehnungsbereich sowhohl links als auch rechts vom Erwartungswert liegt. Ein Signifikanzniveau von 5% bei einem einseitigen Test stimmt also mit einem Signifikanzniveau von 10% bei einem zweiseitigen Test überein, weil man beim einseitigen Test 5% Ablehnungsbereich auf einer Seite hat und die entsprechenden 5% auf der anderen Seite des Mittelwertes nicht zum Ablehnungsbereich zählen. Dies wird anhand einer Abbildung verdeutlicht.

Schauen wir uns dies in der Abbildung 2 an. Hier sind neben der Wahrscheinlichkeitsverteilung die Prozentwerte des Annahme- und der Ablehnungsberreiche eingetragen. Es ist zu sehen, dass sich der Ablehnungsbereich zu je 2,5% auf den Bereich unterhalb von 140 und oberhalb von 160 Plätzen erstreckt. Sollte jetzt nur geprüft werden, ob zu viele Besucher kommen könnten, dann haben wir bei einem Signifikanzniveau von 5% nur noch einen Ablehnungsbereich von 5% oberhalb von 160 Plätzen, da Zahlen unter 140 nicht mehr interessant sind.

Da man durch einen Test eine Hypothese nie beweisen kann, sondern sie bei einer großen Abweichung höchstens verwerfen kann, wird der Baumarkt für den Test davon ausgehen, dass mehr als 7% der Glühbirnen defekt sind. Muss er diese Hypothese ablehnen, sollte er das Geschäft annehmen. Die Hypothese H_0 lautet: Die Glühbirnen sind zu 7% oder mehr defekt p\geq 0,07). Die Gegenhypothese H_1 ist dann, dass die Glühbirnen zu weniger als 7% defekt sind p<0,07). Es handelt sich hiermit um einen linksseitigen Test, da der Ablehnungsbereich links vom Erwartungswert liegt.

Betrachten wir nach dieser Vorarbeit nun die Entscheidungsregel für den Baumarkt. Wir berechnen die den Wert

    \[a=\mu -1,64\sigma =28-1,64*5,103=19,63.\]

Der Baumarkt sollte die Lieferung also annehmen, wenn 19 oder weniger Glühbirnen defekt sind – dann kann er begründet annehmen, dass HypotheseH0falsch ist und die Defektrate geringer als 7% ist – und sie ablehnen, wenn 20 oder mehr defekt sind.

Sehen wir uns die Überlegung des Großhändlers an. Ihm wird eine Entscheidungsregel reichen, bei der in 95% der Fälle eine Defektrate von 7% plausibel ist. Er wird daher als Hypothese H_0 testen, ob die Defektrate geringer als 7% ist p\leq 0,07). Entsprechend ist die Gegenhypothese, dass die Glühbirnen mit einer Rate von mehr als 7% defekt sind p>0,07). Wir sprechen hier von einem rechtsseitigen Test, da der Ablehnungsbereich rechts vom Erwartungswert liegt. Die Berechnung der rechten Seite des Annahmeintervalls ist dann

    \[b=\mu+1,64\sigma=28+1,64*5,103=36,37.\]

Der Großhändler kann mit 95%-iger Sicherheit behaupten, dass die Defektrate nicht höher als 7% ist, wenn in einer Lieferung von 400 Glühbirnen 36 defekt sind. Sind mehr als 36 Glühbirnen defekt, dann ist die Hypothese H_0 abzulehnen und es scheint wahrscheinlich, dass die Defektrate größer als 7% ist.

Halten wir fest: Bei einem einseitigen Hypothesentest wird entweder ein rechtsseitiger H_0\(: \(p\leq p_1) oder ein linksseitiger Test H_0\(: \(p\geq p_1) ausgeführt. Welcher Test ausgeführt wird, hängt von der Fragestellung ab. Im obigen Beispiel ist der Großhändler als Verkäufer mit einer höheren Fehleranzahl zufrieden als der Baumarkt als Käufer.

Signifikanzniveaus

In diesem Abschnitt soll wichtige Signifikanzniveaus und dieσ-Umgebungen für einseitige und zweiseitige Hypothesentests aufgeführt werden. Das Signifikanzniveau ist die Wahrscheinlichkeit innerhalb des Ablehnungsbereichs zu liegen.

Signifikanzniveau Einseitiger Test Zweiseitiger Test
10% \mu\pm 1,28\sigma \mu\pm 1,64\sigma
5% \mu\pm 1,64\sigma \mu\pm 1,96\sigma
1% \mu\pm 2,33\sigma

Fehler 1. und 2. Art

Beim Testen von Hypothesen kann man Fehler machen. Dies hängt davon ab, ob die Hypothese der Realität entspricht oder nicht und wie die Empfehlung lautet. Nehmen wir das Beispiel des Würfels aus Abschnitt über zweiseitige Hypothesentests. Dort wurde auf die Hypothese p=\frac{1}{6} getestet. Wenn bei diesem Würfel die 6 wirklich mit der Wahrscheinlichkeit \frac{1}{6} fällt und sie abgelehnt wird, begeht man einen Fehler 1. Art: Eine zutreffende Hypothese wird fälschlicherweise abgelehnt. Der Fehler 1. Art ist so groß wie die Irrtumswahrscheinlichkeit – im gewählten Beispiel 5%. Will man den Fehler 1. Art in diesem Beispiel genau berechnen, so muss man die Wahrscheinlichkeiten dafür berechnen, dass der in der Stichprobe ermittelte Wert im Ablehnungsbereich liegt, also P(X<100)+P(x>119) bei einer Wahrscheinlichkeit von p=\frac{1}{6} und n=720 Würfen.

Nehmen wir an, dass die wirkliche Wahrscheinlichkeit für das Würfeln einer 6 bei \frac{1}{5} liegt. Wenn die Hypothese – p=\frac{1}{6} – angenommen wird, begehen wir einen Fehler 2. Art: Eine falsche Hypothese wird irrtümlicherweise angenommen. Die Wahrscheinlichkeit für diesen Fehler beträgt nun

    \[P_{\frac{1}{5}}(100\leq x \leq 119),\]

also die Wahrscheinlichkeit, dass man im Annahmebereich landet, berechnet zur wirklichen Wahrscheinlichkeit \frac{1}{5}. Schätzen wir diesen Fehler mit Hilfe der Normalverteilung ab. Nach dem Satz von Moivre-Laplace ist die Wahrscheinlichkeit für den Bereich zwischen 100 und 119 bei \mu=\frac{720}{5}=144 und \sigma=720*0,2*0,8=19,733

    \begin{eqnarray*}P_{\frac{1}{5}}(100 \leq X\leq 119)&=&\varphi \left(\frac{119+0,5-144}{19,733}\right)-\varphi \left(\frac{100-0,5-144}{19,733}\right)\\ &=& \varphi (-2,2827)- \varphi (-4,1460).\end{eqnarray*}

Ablesen aus der Tabelle für die Standardnormalverteilung ergibt für{{1}}[[1]]Der Wert für \varphi ( -4,1460 ) ist in der Tabelle nicht mehr enthalten und daher Null. \varphi ( -2,2827 ) berechnet sich aus 1-\varphi ( 2,2827).[[1]] \varphi (-4,1460) einen Wert von nahe Null und für \varphi (-2827)=1-\varphi (2827) ein Wert von 1,13%. Die Wahrscheinlichkeit für einen Fehler 2. Art liegt also bei 1,13%, wenn die wirkliche Wahrscheinlichkeit \frac{1}{5} ist.

Die folgende Tabelle fasst die möglichen Kombinationen für dieses Beispiel zusammen:

Hypothese p=\frac{1}{6}
angenommen abgelehnt
Reali- p=\frac{1}{6} kein Fehler: Annahme der richtigen Hypothese Fehler 1. Art: Ablehnung der richtigen Hypothese (\alpha-Fehler)
tät p=\frac{1}{5} Fehler 2. Art: Annahme der falschen Hypothese (\beta-Fehler) kein Fehler: Ablehnung der falschen Hypothese
Drucken Drucken

Schreibe einen Kommentar