Basis einer statistischen
Erhebung ist eine Menge von Objekten, von denen ein Merkmal oder mehrere
Merkmale (Merkmalskombinationen) untersucht werden.
Beispiele für solche Grundgesamtheiten wären etwa folgende:
* die Menge
aller Schüler der Klasse 8 einer bestimmten Schule;
* die Menge
aller Mädchen der betreffenden Klasse;
* die Menge
aller Körpergrößen der Mädchen aus
;
* die Menge
der Noten, die von den einzelnen Schülern aus
bei der letzten Mathearbeit erzielt wurden
Die bei der Untersuchung der Grundgesamtheit gewonnenen Ergebnisse werden
Merkmalsausprägungen
(Merkmalswerte, Daten) genannt.
Erhält man die Ergebnisse durch Auszählen oder Messen, so handelt
es sich um ein quantitatives
Merkmal; lassen sich die Ergebnisse
lediglich bezüglich ihrer Art erfassen und beschreiben, so liegt
ein qualitatives Merkmal
vor.
Die Menge
wurde so auf der Grundlage des quantitativen Merkmals "Körpergröße"
gebildet, das in diesem Falle speziell ein stetiges
quantitatives Merkmal ist, da das Merkmal innerhalb eines bestimmten
Intervalls jeden beliebigen Wert (natürlich unter Berücksichtigung
der Messgenauigkeit) annahmen kann. Die Ausprägung eines diskreten
quantitativen Merkmals wäre demgegenüber z. B. durch
Zählen festzustellen (Einschätzung des Beliebtheitsgrades von
Fernsehsendungen anhand der Einschaltzahlen, Einwohnerzahlen von Städten).
Bestimmend für die Bildung von
war das qualitative Merkmal "Geschlecht". Speziell handelt es
sich hier um ein qualitativ-nominales (nominalskaliertes)
Merkmal, das sich lediglich auf Gleichheit oder Verschiedenheit
von Ausprägungen gründet. Qualitativ-ordinale
(ordinalskalierte) Merkmale lassen sich auf der Basis einer Höher-Tiefer-Relation
(z.B. militärische Dienstgrade) oder einer Größer-Kleiner-Relation
(z.B. Windstärken von "still" und "leichte Brise"
bis "Orkan", Konfektionsgrößen S, M, L, XL) beschreiben.
Schreibt man die Untersuchungsergebnisse in der Reihenfolge ihrer Ermittlung
(ansonsten aber ungeordnet) auf, so erhält man eine Urliste.
Diese Urliste kann nun für die spätere Verwendung weiter aufbereitet
werden, indem man die Daten durch einen Strichliste
sortiert und daran tabellarisch oder grafische Darstellungen anschließt.
Die Strichliste gibt die Anzahl der Mess- oder Beobachtungswerte an, mit
der jede Merkmalsausprägung in der Grundgesamtheit oder einer Stichprobe
hieraus auftritt.
Um verschiedene Messreihen zum gleichen Merkmal auch bei unterschiedlicher
Anzahl von Messwerten gut miteinander vergleichen zu können, wird
die sich auf der absoluten Häufigkeit des Auftretens einer Merkmalsausprägung
gründende relative Häufigkeit verwendet.
einer Merkmalsausprägung
bezeichnet
man die Anzahl der Mess- oder Beobachtungswerte, in der diese Merkmalsausprägung
innerhalb der Grundgesamtheit bzw. der jeweiligen Stichprobe vom Umfang
n auftritt.
einer Merkmalsausprägung
bezeichnet
man den Quotienten
aus der absoluten Häufigkeit
und dem Umfang n der Grundgesamtheit bzw. der jeweiligen Stichprobe:
Beispiel:
In einem Betrieb wird die Maßhaltigkeit der an einer bestimmten
Maschine von ein und derselben Person hergestellten Bauteile anhand von
n = 50 zufällig ausgewählten Exemplaren untersucht und dabei
die Abweichungen
(in
) von einem
bestimmten Nennwert ermittelt.
Man erhält folgende Urliste:
|
k |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
![]() |
2 |
4 |
4 |
0 |
8 |
9 |
4 |
7 |
8 |
11 |
8 |
3 |
5 |
9 |
2 |
2 |
10 |
|
k |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
26 |
27 |
28 |
![]() |
3 |
2 |
4 |
7 |
6 |
4 |
1 |
8 |
7 |
11 |
11 |
|
k |
29 |
30 |
31 |
32 |
33 |
34 |
35 |
36 |
37 |
38 |
39 |
![]() |
8 |
3 |
6 |
2 |
4 |
11 |
5 |
6 |
7 |
9 |
1 |
|
k |
40 |
41 |
42 |
43 |
44 |
45 |
46 |
47 |
48 |
49 |
50 |
![]() |
0 |
3 |
11 |
0 |
5 |
2 |
11 |
5 |
2 |
4 |
6 |
Aus dieser Urliste ist ersichtlich, dass die Abweichungswerte im Bereich
von 0 bis 11 lagen.
Es ergibt sich folgende Liste der absoluten Häufigkeiten
:
![]() |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
![]() |
3 |
2 |
7 |
4 |
7 |
4 |
5 |
3 |
5 |
3 |
1 |
6 |
Daraus ergeben sich als relative Häufigkeiten (die Summe der relativen Häufigkeiten in der zweiten Zeile ist gleich 1):
![]() |
0 |
1 |
2 |
3 |
4 |
5 |
![]() |
0,06 |
0,04 |
0,14 |
0,08 |
0,14 |
0,08 |
![]() |
6 |
7 |
8 |
9 |
10 |
11 |
![]() |
0,10 |
0,06 |
0,10 |
0,06 |
0,02 |
0,12 |
Die absolute Häufigkeit der einzelnen Merkmalsausprägungen ist
sehr gering. Günstig ist es daher, durch Klassenbildung eine Verdichtung vorzunehmen. Wenn möglich, werden dabei meist Klassen
gleicher Breite genutzt.
Für jede Klasseneinteilung muss außerdem
gelten:
* Die Vereinigungsmenge
enthält alle Elemente der Urliste.
* Je zwei beliebiger Klassen sind elementfremd
,
d. h., jede Merkmalsausprägung gehört in genau eine Klasse.
Wir wählen die Klassenbreite 2. Dann ergibt sich (die relativen Häufigkeiten sind in Klammern angegeben):
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
12 (0,24) |
15 (0,30) |
13 (0,26) |
10 (0,10) |