In der Statistik werden statistische (Daten-)Mengen untersucht und dabei ein interessierender statistischer Zusammenhang durch eine Zufallsgröße, z.B. die Zufallsgröße X, beschrieben.
Definition:
Statistische Mengen
sind Gesamtheiten von Ereignissen, Objekten oder Individuen.
Die Menge aller Ereignisse bzw. Objekte oder Individuen, die zu einem
klar gekennzeichneten Merkmal (oder einer Merkmalsgruppe) gebildet werden
kann, bezeichnet man als Grundgesamtheit,
bei Individuen auch als Population.
Beispiele für Grundgesamtheiten (und sich darauf beziehende Zufallsgrößen) wären so die Menge
Bei statistischen Untersuchungen ist es im Allgemeinen aus praktisch-organisatorischen Gründen nicht möglich oder aus Kostengründen nicht erwünscht, eine interessierende Grundgesamtheit vollständig zu untersuchen. Man denke beispielsweise an
Aufgabe der Beurteilenden Statistik ist es deshalb vielmehr, aus Eigenschaften von Teilmengen einer Grundgesamtheit (wobei die Wahrscheinlichkeitsverteilung des statistisch interessierenden Merkmals in der Grundgesamtheit unbekannt ist) die Wahrscheinlichkeit für das Auftreten eines bestimmten statistisch interessierenden Merkmals in der Grundgesamtheit zu schätzen und die Signifikanz des Schätzwertes zu beurteilen.
Defínition:
Eine aus einer Grundgesamtheit (im Allgemeinen zufällig – "auf gut
Glück") ausgewählte (Teil-)Menge mit n Elementen heißt
Stichprobe.
Die Elemente
der Stichprobe sind Zahlenwerte der Zufallsgröße X. Die Anzahl
n der Elemente gibt den Umfang der Stichprobe (kurz als Stichprobenumfang
bezeichnet) an.
Jedes einzelne Element der Stichprobe heißt Stichprobenwert.
Um aus Eigenschaften der Stichprobe mit einer gewissen Sicherheit auf
Eigenschaften der Grundgesamtheit schließen zu können, muss
die Stichprobe charakteristisch – man sagt repräsentativ
– für die Grundgesamtheit sein.
Eine Stichprobe gilt als repräsentativ,
wenn sie annähernd so wie die Grundgesamtheit zusammengesetzt und ihr Umfang hinreichend groß ist. Darüber hinaus
müssen die interessierenden Eigenschaften der Elemente der Stichprobe
quantifizierbar, also zahlenmäßig erfassbar und beschreibbar
sein.
Das Erfassen und Beschreiben der Grundgesamtheit bzw. der Stichprobe übernimmt die Beschreibende Statistik. Die Untersuchung der Stichprobe mithilfe von Schätz- und Testverfahren (einschließlich Entscheidungen und Angaben zu deren Zuverlässigkeit) leistet die Beurteilende Statistik.
Der erste wichtige Schritt einer Untersuchung ist die genaue Festlegung
bzw. Kennzeichnung der Grundgesamtheit.
Der zweite Schritt besteht in der Planung der Zusammensetzung der Stichprobe.
Um Repräsentativität
zu erreichen, dürfen Zusammensetzung und Umfang der Stichprobe nicht
dem Zufall überlassen bleiben; das Ermitteln ihrer einzelnen Elemente
dagegen erfolgt zufällig. Für einen hinreichend großen
Stichprobenumfang gibt der sogenannte Auswahlsatz
a eine Orientierung. Es gilt:
Auswahlsatz a =
· 100 %
(Der Umfang der Grundgesamtheit N muss ggf. geschätzt werden.
Für den Auswahlsatz a existieren empirisch gewonnene Erfahrungswerte.
Diese Werte variieren z.B. in Abhängigkeit von der Zusammensetzung
einer Stichprobe sowie der Art des Sachgebietes der Grundgesamtheit. Als
ein grober Richtwert kann a = 10 % angesehen werden.
In der statistischen
Praxis sind allerdings sowohl erheblich kleinere a-Werte (z.B.
bei Wahlprognosen) als auch
erheblich größere Werte (z.B.
bei Qualitätskontrollen) zu finden.
Dies hat seinen Grund in entsprechenden jahrzehntelangen Erfahrungen (Wahlprognosen)
oder ständig wechselnder Spezifik und daher fehlender Erfahrung (Qualitätskontrollen)
bei der Zusammensetzung von Stichproben aus dem jeweiligen Sachgebiet.
Bei einer geeigneten Zusammensetzung der Stichprobe gilt: Je größer
der Auswahlsatz, desto sicherer die Repräsentativität der Stichprobe.