Testen von Hypothesen

In den vorangehenden Abschnitten haben wir die Grundzüge der Wahrscheinlichkeitstheorie entwickelt. In der Wahrscheinlichkeitstheorie gehen wir davon aus, dass zur Beschreibung eines Zufallsexperiments ein sinnvolles Wahrscheinlichkeitsmaß bekannt ist. Aus bekannten Wahrscheinlichkeiten berechnen wir dann die Wahrscheinlichkeiten Weiterer Ereignisse.


Bei vielen praktischen Problemen ist die Ausgangslage jedoch eine ganz andere. Oft sind uns die Wahrscheinlichkeiten nicht bekannt und wir greifen dann auf statistische Verfahren zurück. So ist es beispielsweise vor einer Wahl für eine politische Partei im Hinblick auf die weitere Wahlkampfplanung äußerst wichtig zu wissen, wie sie derzeit in der Wählergunst abschneidet. Meinungsumfragen sind in dieser Zeit die Regel.


Das Wesensmerkmal solcher Meinungsumfragen besteht darin, dass wir aus praktischen und ökonomischen Gründen nur eine repräsentative Stichprobe aus der Gesamtheit aller Wahlberechtigten nach ihrem beabsichtigten Wahlverhalten befragen. Hierbei stellt sich die Frage, inwiefern sich das Ergebnis der Befragung nur weniger Personen auf die Gesamtheit aller Wahlberechtigten übertragen lasst. Eine besondere Bedeutung kommt dabei einer Angabe der Unsicherheit zu, mit denen derartige Verallgemeinerungen immer behaftet sind.


Diese statistischen Fragestellungen teilen wir Schätzprobleme und Testprobleme ein.

Bei Schätzproblemen versuchen wir aus dem Ergebnis einer Stichprobe Informationen über eine gesuchte Wahrscheinlichkeit zu entnehmen. Hier handelt es sich um eine Hochrechnung. Sehr wichtig ist es, dass wir in diesem Zusammenhang auch Angaben darüber machen, welches Maß an Unsicherheit den Schätzwerten zukommt.

Bei Testproblemen haben wir bereits eine bestimmte Vermutung über eine interessierende Wahrscheinlichkeit. Aufgrund des Ergebnisses einer Stichprobe entscheiden wir dann, ob die vorgegebene Hypothese zutrifft oder aber abgelehnt werden muss. Auch hierbei ist es unerlässlich, eine Angabe der Sicherheit zu machen, mit der die jeweilige Entscheidung getroffen wird.

Wir wollen uns im Folgenden auf das Testen von Hypothesen beschränken.


Beispiel

Bei der Tombola eines Sportvereins wird versprochen, dass höchstens ein Drittel der Lose Nieten sind. Ein Besucher vermutet, dass der Anteil der Nieten bedeutend (signifikant) größer ist. Um die Aussage des Sportvereins zu testen, kauft der Besucher \(100\) Lose. Sind unter den \(100\) Losen höchstens \(40\) Nieten, so gibt der Besucher dem Sportverein recht. Sind unter den \(100\) Losen mehr als \(40\) Nieten, so gibt der Besucher dem Sportverein nicht recht. Das Ergebnis der Stichprobe ist zufallsbedingt, also sind falsche Entscheidungen möglich.


Tests dieser Art heißen Hypothesentests oder Signifikanztests.

Berechnungen zu solchen Testes bauen wir systematisch auf.

  • Formulierung der Testgröße

    Die Testgröße \(X\) ist die Anzahl der Nieten unter den \(100\) gekauften Losen.

    Die Testgröße \(X\) ist binomialverteilt nach \(B(100;p)\)

  • Formulierung der Nullhypothese \(H_{0}\)

    Der Anteil der Nieten unter allen Losen ist höchstens \(\frac{1}{3}\) .

    \(H_{0}:p\leq \frac{1}{3}\) (kurze Schreibweise)

  • Formulierung der Gegenhypothese \(H_{1}\)

    Der Anteil der Nieten unter allen Losen ist signifikant höher als \(\frac{1}{3}\) .

    \(H_{1}:p>\frac{1}{3}\) (kurze Schreibweise)

  • Formulierung der Entscheidungsregel

    Falls unter den \(100\) Losen höchstens \(40\) Nieten sind, so nehmen wir die Nullhypothese \(H_{0}\) an.

    Annahmebereich: \(A=\left\{ 0,1,2,3,\ldots ,40\right\}\)

    Falls unter den \(100\) Losen mehr als \(40\) Nieten sind, so lehnen wir die Nullhypothese \(H_{0}\) ab.

    Ablehnungsbereich: \(\overline{A}=\left\{41,42,43,\ldots,100\right\}\)


Da das Ergebnis zufallsbedingt ist, kann man auf Grund des Testergebnisses eine richtige oder falsche Entscheidung treffen. Wir unterscheiden vier Fälle.

Nun berechnen wir die Irrtumswahrscheinlichkeit \(\alpha\) auf Grund der vorliegenden Entscheidungsregel.

\(H_{0}:p\leq \frac{1}{3}\) ; \(H_{1}:p>\frac{1}{3}\)

\(\alpha =P(X\in \overline{A})=P(41\leq X\leq 100)\)

\(\alpha =P(X\leq 100)-P(X\leq 40)\)

\(\qquad =1-P(X\leq 40)\)

\(\alpha =1-0.93413=0.06587\) (TW)

Die Wahrscheinlichkeit für einen \(\alpha\)-Fehler liegt bei \(6.59~\%\) .


Der Wert für den \(\alpha\)-Fehler ist etwas zu hoch, er sollte am besten bei etwa \(3~\%\) liegen. Deshalb ändern wir die Entscheidungregel nun so, dass die Irrtumswahrscheinlichkeit \(\alpha\) bei höchstens \(3~\%\) liegt.

Es soll also ein Signifikantest auf dem \(3~\%\)-Niveau (\(3~\%\)-Signifikanzniveau) vorliegen.

Wir geben die Entscheidungsregel in allgemeiner Form an.

\(A=\left\{0,1,2,3,\ldots ,c\right\}\) ; \(\overline{A}=\left\{c+1,\ldots ,100\right\}\) ; \(c\in\mathbb{Z}\)


\(\alpha =P(X\in \overline{A})\leq 0.03\) mit \(c\) möglichst klein

\(\alpha =P(c+1\leq X\leq 100)\)

\(1-P(X\leq c)\leq 0.03\)

\(-P(X\leq c)\leq -0.97\)

\(P(X\leq c)\geq 0.97\)

TW: \(c\geq 42\) und \(c\) möglichst klein, also \(c=42\)


\(A=\left\{0,1,2,3,\ldots ,42\right\}\) ; \(\overline{A}=\left\{43,44,\ldots ,100\right\}\)

Bei dieser Entscheidungsregel liegt ein Test mit einem \(3~\%\)-Signifikanzniveau vor.


In einer letzten Betrachtung zu diesem Beispiel schaffen wir eine Situation herbei, aus der wir einen Fehler 2. Art betrachten. Damit das gelingt, machen wir eine Angabe zur tatsächlichen Verteilung der Nieten und Gewinne in der Lostrommel.


In Wirklichkeit sind nicht \(\frac{1}{3}\), sondern \(\frac{1}{2}\) alle Lose Nieten.

Berechnen Sie mit der \(3~\%\)-Entscheidungsregel die Irrtumswahrscheinlichkeit \(\beta\).

\(A=\left\{0,1,2,3,\ldots ,42\right\}\) ; \(\overline{A}=\left\{43,44,\ldots ,100\right\}\)


Ein \(\beta\)-Fehler liegt vor, wenn \(H_{0}\) in Wirklichkeit falsch ist und wir \(H_{0}\) auf Grund des Testergebnisses trotzdem annehmen.

\(\beta =P(X\in A)=P(0\leq X\leq 42)\)

\(\beta =P(X\leq 42)\)

\(\beta =0.06661\) TW

Die Wahrscheinlichkeit für einen \(\beta\)-Fehler liegt bei \(6.67~\%\) .