Beurteilende Statistik setzt quantitatives Beschreiben von Grundgesamtheiten bzw. Stichproben voraus.
Beispiel:
Ein Elektronikunternehmen stellt multifunktionale Fahrradcomputer her.
Aus langjährigen Erfahrungen ist bekannt, dass aufgrund des komplizierten
Fertigungsprozesses 30 % der Fahrradcomputer nicht zuverlässig arbeiten.
Durch eine verbesserte Fertigungstechnologie will man die Zuverlässigkeit
der Fahrradcomputer erhöhen. Um den Effekt der neuen Technologie
zu überprüfen, werden der Produktion über einen längeren
Zeitraum Stichproben von jeweils 20 nach verbesserter Technologie gefertigten
Fahrradcomputern entnommen. In sämtlichen Stichproben stellt man
jeweils höchstens zwei nicht zuverlässig arbeitende Fahrradcomputer
fest. Man vermutet deshalb, dass jetzt nur noch 10 % der Fahrradcomputer
nicht zuverlässig arbeiten.
Es interessiert, mit welcher Sicherheit aus dem Prüfergebnis (Stichprobenuntersuchungen)
tatsächlich auf eine Erhöhung der Zuverlässigkeit der Fahrradcomputer
geschlossen werden darf.
Zur mathematischen Veranschaulichung und Untersuchung des Problems soll
ein Urnenmodell dienen. Das
Erzeugen einer (Zufalls-)Stichprobe ist durch die Urnenmodelle Ziehen
mit Zurücklegen bzw. Ziehen ohne Zurücklegen
mathematisch beschreibbar.
In einer Urne mögen sich sehr viele, ausschließlich weiße
und schwarze Kugeln befinden. Bezogen auf obiges Beispiel sollen die weißen
Kugeln die zuverlässig arbeitenden Fahrradcomputer, die schwarzen
Kugeln die nicht zuverlässig arbeitenden Fahrradcomputer symbolisieren.
Vom Anteil p der schwarzen Kugeln ist bekannt, dass er entweder 30 % oder
10 % beträgt. Es werden 20 Kugeln als Stichprobe gezogen. Die Anzahl
der schwarzen Kugeln unter den gezogenen Kugeln interessiert.
Im vorliegenden Beispiel ist es praktisch unbedeutend, ob die Stichprobe
durch Ziehen mit Zurücklegen oder ohne
Zurücklegen erzeugt wird: Durch das Ziehen einer (sehr) kleinen Stichprobe
aus einer (sehr) großen Grundgesamtheit bleiben die Einzelziehungen
im Zufallsexperiment (praktisch) unabhängig voneinander. Das Zufallsexperiment
ist ein BERNOULLI-Experiment;
die Zufallsgröße X beschreibe die Anzahl der schwarzen Kugeln
unter allen Kugeln in der Urne.
Die Zufallsgröße X kann dann folgendermaßen definiert
werden:
Das entsprechende BERNOULLI-Experiment werde n-mal (im Beispiel n = 20)
durchgeführt. Weil die einzelnen Ziehungen unabhängig voneinander
sind, weisen die zugehörigen Zufallsgrößen
dieselbe Wahrscheinlichkeitsverteilung wie die Zufallsgröße
X auf. Jede Stichprobe vom Umfang n (BERNOULLI-Kette der Länge n)
kann somit als ein n-Tupel
mit
für
i = 1; 2;
; n aufgefasst werden. Die obige Stichprobe (Umfang n
= 20) ließe sich also beispielsweise durch nachstehende 20-Tupel
beschreiben:
(0; 0; 1; 0; 0; 0; 0; 0; 0; 0; 0; 1; 0; 0; 0; 0; 0; 0; 0; 0),
(1; 0; 0; 0; 0; 0; 0; 0; 0; 0; 0; 0; 0; 0; 0; 0; 0; 0; 1; 0)
usw.
Entscheidend ist: Unter den 20 gezogenen Kugeln sind in beiden Fällen
genau 18 weiße ("0") und zwei schwarze ("1").
Da nicht interessiert, an welcher Stelle die schwarzen Kugeln gezogen
worden sind, ist die Untersuchung als 20-elementige Menge (mit 18-mal
"0" und zweimal "1")
{0; 0; 1; 0; 0; 0; 0; 0; 0; 0; 0; 1; 0; 0; 0; 0; 0; 0; 0; 0}
für die weitere Analysetätigkeit ausreichend.
Die praktische Fragestellung lässt sich folgendermaßen "übersetzen":
Aus der Anzahl der schwarzen Kugeln in der Stichprobe soll auf den unbekannten
Anteil der schwarzen Kugeln in der Urne geschlossen werden. Dieser Anteil
wird durch die (unbekannte) Wahrscheinlichkeit p beschrieben. Ob es möglich
ist, eine Qualitätsverbesserung zu schlussfolgern, hängt davon
ab, mit welcher Sicherheit (Signifikanz)
dieser Anteil unter oder ggf. über dem bisherigen (Ausschuss
bzw.
) liegt.
Das Signifikanzniveau
kann entweder vorgegeben werden oder es ist zu ermitteln.
Unter den gegebenen Voraussetzungen ist die Anzahl der schwarzen Kugeln
in der Stichprobe binomialverteilt.
Für die unbekannte Wahrscheinlichkeit p, dass bei einmaligem Ziehen
aus der Urne eine schwarze Kugel gezogen wird, lassen sich – unter Beachtung
der Stichprobe – begründete Vermutungen
oder Hypothesen ableiten. Wegen
der Werte der Stichprobe (2 von 20, also
),
wäre im vorliegenden Fall
eine solche Hypothese. (Übrigens nennt man Hypothesen, die durch
genau einen Wert
festgelegt sind, einfache
Hypothesen – im Unterschied zu
Hypothesen der Form
,
die als zusammengesetzte
Hypothesen bezeichnet werden.)
Mit Blick auf den früheren Anteil schwarzer Kugeln (
)
könnte ebenso die Hypothese "
"
formuliert werden. Für den vorliegenden konkreten Fall wäre
eine Vermutung
im Allgemeinen
nicht begründet (Widerspruch zu verbesserter Fertigungstechnologie)
und würde daher als "normale" Hypothese ausscheiden.
Definition:
Die zu überprüfende Hypothese heißt Nullhypothese
. Das Gegenteil
(die Negation, die Verneinung) der Nullhypothese wird Alternativhypothese
oder Gegenhypothese genannt
und mit
oder
auch
bezeichnet.
Nullhypothese und Alternativ- bzw. Gegenhypothese sind einander ausschließende
Hypothesen.
(Die üblich gewordene Begriffsbildung "Nullhypothese" soll
verdeutlichen: Die Nullhypothese geht im Allgemeinen davon aus, dass die unbekannte
Wahrscheinlichkeitsverteilung [in der Grundgesamtheit] mit der auf der
Grundlage der Stichprobe vermuteten Verteilung tatsächlich übereinstimmt;
zwischen Vermutung und Tatsache besteht dann "die Differenz null".)
Auf der Grundlage statistischer Tests
wird entschieden, ob die Nullhypothese abzulehnen (zu verwerfen) ist oder
nicht. Im Allgemeinen versucht man (aus historisch gewachsenem "Sicherheitsdenken"
heraus), die Nullhypothese abzulehnen. Die Entscheidung, ob eine Hypothese
abzulehnen ist, bleibt stets kompliziert, weil auf der Basis einer Stichprobenuntersuchung
entschieden wird, während die Hypothese die Verhältnisse in
der Grundgesamtheit beschreibt.
Offenbaren die Untersuchungsergebnisse der Stichprobe extreme Abweichungen
von der Nullhypothese, so spricht man von einem signifikanten
Unterschied zwischen der Nullhypothese und (den Untersuchungsergebnissen)
der Stichprobe. Die Nullhypothese ist abzulehnen
(zu verwerfen).
Lassen sich hingegen aus der Stichprobe keine signifikanten Abweichungen
nachweisen, darf nicht geschlussfolgert werden, dass die Nullhypothese
richtig sei. Sie steht lediglich nicht im (offensichtlichen) Widerspruch
zu den Untersuchungsergebnissen und kann daher
nicht abgelehnt werden.
Die Entscheidung bleibt also stets mit einem gewissen Risiko behaftet.
Deshalb ist es wichtig, die Wahrscheinlichkeiten
für Fehlentscheidungen zu kennen, sie sinnvoll festzulegen, zu
berechnen oder sie abschätzen zu können.
Definition:
Die Wahrscheinlichkeit, mit der man das Risiko eingeht, eine in
Wirklichkeit wahre Nullhypothese irrtümlich als falsch abzulehnen,
nennt man Irrtumswahrscheinlichkeit
(auch Signifikanzniveau
,
-Fehler
bzw. Fehler 1. Art oder Risiko
1. Art).
Die Wahrscheinlichkeit, mit der man das Risiko eingeht, eine in
Wirklichkeit falsche Nullhypothese irrtümlich nicht abzulehnen,
nennt man
-Fehler
bzw. Fehler 2. Art oder
Risiko 2. Art.
Statistische Tests gestatten das Berechnen
der Werte der Zufallsgröße X, für die die Nullhypothese
abgelehnt wird. Die Menge dieser Werte aus dem Wertebereich der Zufallsgröße
X heißt Ablehnungsbereich
(Verwerfungsbereich
oder kritischer Bereich). Die Menge der verbliebenen X-Werte bildet den
Annahmebereich A.
Zusammenfasssung:
ist in Wirklichkeit |
||
|
wahr
|
falsch
|
|
wird abgelehnt |
Entscheidung falsch
Fehler 1. Art |
Entscheidung richtig
|
wird nicht abgelehnt |
Entscheidung richtig
|
Entscheidung falsch |