Daten ermöglichen Wissen und Wissen bedeutet bekanntlich Macht. Daher spielen gerade Daten für Unternehmen eine große Rolle, da sie dadurch wichtige Informationen über Vorlieben und Neigungen verschiedenster Menschen erhalten. Durch dieses Wissen können sie dann schließlich gezielt ihre Unternehmensausrichtung optimieren – und somit größer und mächtiger werden. Aber auch für Staaten sind Daten über ihre Bürger von großer Wichtigkeit. Hierdurch können Staaten ihr Staatswesen kontinuierlich verbessern – und dadurch volkswirtschaftlich gesehen ebenfalls mächtiger werden. Daten von Bürgern haben also eine große Wichtigkeit. Jedoch hat man als Bürger stets das Recht selbst zu entscheiden, welche Daten man preisgeben möchte und welche nicht. Schließlich unterliegen bei uns private Daten dem Datenschutz und somit dem Schutz der Privatsphäre. Leider missachten oftmals Unternehmen und auch unser Staat dieses wichtige Gesetz – denn an Daten zu gelangen, ist manchmal wichtiger als die Einhaltung eines sehr bedeutsamen Gesetzes.
Daten zu einem bestimmten Aspekt und dazu gehörendem/gehörenden Merkmal(en) werden hierbei durch statistische Erhebungen wie zum Beispiel Umfragen, Zählungen und Beobachtungen zusammengetragen und anschließend nach bestimmten Analysemethoden ausgewertet. Hierfür gibt es in der Statistik klar definierte Grundbegriffe und Verfahren, die eindeutig darlegen, wie man Daten korrekt erfasst, korrekt untersucht und schließlich korrekt auswertet. Durch das Auftreten oder Nichtauftreten einer Merkmalausprägung, das heißt einer konkret machen könnenden Angabe zu einem Merkmal, und deren Analyse können schließlich mittels der Statistik förderliche Erkenntnisse gewonnen werden.
1. Die Analyse von Daten mittels statistischer Grundbegriffe
a) Grundgesamtheit (n): Durch die Grundgesamtheit (n) wird die Menge der gesamten ermittelnden Daten angeben.
Beispiele:
An einem Weitsprungwettbewerb nahmen 15 Schüler teil. n (die Grundgesamtheit) = 15;
28 Lehrlinge nahmen an der Abschlussprüfung teil, n (die Grundgesamtheit) = 28;
51 Autos wurden heute geblitzt. n (die Grundgesamtheit) = 51.
b) Absolute Häufigkeit (H): Durch die absolute Häufigkeit (H) wird aufgezeigt, wie oft ein bestimmtes Merkmal/eine Merkmalausprägung bei der Grundgesamtheit (n) zum Vorschein kommt.
Beispiele:
a)
1.
Bei einem Weitsprungwettbewerb wird das Merkmal Weite ausgewertet, von 15 daran teilgenommenen Schülern sprangen 3 genau 3,52 m, 2 genau 3,68 m, 2 genau 3,47 m, 1 genau 3,77 m, 1 genau 3,55 m, 1 genau 3,51 m, 1 genau 3,50 m, 1 genau 3,48 m, 1 genau 3,42 m, 1 genau 3,12 m und 1 genau 3,03 m.
H (die absolute Häufigkeit) für die Weite 3,77 m = 1,
für die Weite 3,68 m ist H = 2,
für die Weite 3,55 m ist H = 1,
für die Weite 3,52 m ist H = 3,
für die Weite 3,51 m ist H = 1,
für die Weite 3,50 m ist H = 1,
für die Weite 3,48 m ist H = 1,
für die Weite 3,47 m ist H = 2,
für die Weite 3,42 m ist H = 1,
für die Weite 3,12 m ist H = 1,
für die Weite 3,03 m ist H =1.
Die Merkmalausprägung ist hier jeweils die konkret gesprungene Weite (3,03 m, 3,12 m, 3,42 m, 3,47 m, 3,48 m, 3,50 m, 3,51 m, 3,52 m, 3,55 m, 3,68 m, 3,77 m).
2.
Bei einer Abschlussprüfung für eine Lehre wird bei den daran teilgenommenen Lehrlingen das Merkmal Note untersucht, von 28 Lehrlingen hatten hierbei 5 die Note 1, 8 die Note 2, 10 die Note 3, 4 die Note 4 und 1 die Note 5.
H (die absolute Häufigkeit) für die Note 1 = 5, für die Note 2 ist H = 8, für die Note 3 ist H = 10, für die Note 4 ist H = 4 und für die Note 5 ist H = 1.
Die Merkmalausprägung ist hier jeweils die konkrete Note (Note 1, Note 2, Note 3, Note 4, Note 5).
3.
Bei einer Geschwindigkeitsüberprüfung wird bei den geblitzten Autos das Merkmal zu schnell gefahrene Geschwindigkeit ausgewertet. Von 51 geblitzten Autos fuhren 30 über 10 km/h zu schnell, 13 über 15 km/h, 4 über 20 km/h, 3 über 25 km/h und 1 über 30 km/h zu schnell.
H (die absolute Häufigkeit) für die Geschwindigkeitsüberschreitung > 10 km/h = 30,
für die Geschwindigkeitsüberschreitung > 15 km/h ist H = 13,
für die Geschwindigkeitsüberschreitung > 20 km/h ist H = 4,
für die Geschwindigkeitsüberschreitung > 25 km/h ist H = 3,
für die Geschwindigkeitsüberschreitung > 30 km/h ist H = 1.
Die Merkmalausprägung ist hier jeweils die konkrete Geschwindigkeitsüberschreitung (Geschwindigkeitsüberschreitung > 10 km/h, Geschwindigkeitsüberschreitung > 15 km/h, Geschwindigkeitsüberschreitung > 20 km/h, Geschwindigkeitsüberschreitung > 25 km/h, Geschwindigkeitsüberschreitung > 30 km/h).
c) Relative Häufigkeit (h): Durch die relative Häufigkeit (h) wird angegeben, wie groß der jeweilige Anteil eines bestimmten Merkmals/einer Merkmalausprägung in Bezug auf die Grundgesamtheit ist. Daher gilt hier folgende Definition:
Oder in Worte gefasst: die relative Häufigkeit (h) = der Quotient aus der absoluten Häufigkeit (H) und der Grundgesamtheit (n).
b)
Bei einem Weitsprungwettbewerb wurde jeweils die relative Wahrscheinlichkeit aller 15 gesprungenen Weiten ausgewertet.
1.
Daher ist h = 0,2 bzw. 20 %.
2.
. Daher ist h = 0,13 (gerundet auf zwei Nachkommastellen) bzw. 13 %.
3.
. Daher ist h = 0,13 (gerundet auf zwei Nachkommastellen) bzw. 13 %.
. Daher ist h = 0,07 (gerundet auf zwei Nachkommastellen) bzw. 7 %. Da 3,55 m, 3,51 m, 3,50 m, 3,48 m, 3,42 m, 3,12 m und 3,03 m auch nur stets 1-mal gesprungen wurden, ist hier auch jeweils h = 0,07 bzw. 7 %.
Bei einer Abschlussprüfung einer Lehre wurde jeweils die relative Wahrscheinlichkeit aller erreichten 28 Noten ausgewertet.
1.
. Daher ist h = 0,18 (gerundet auf zwei Nachkommastellen) bzw. 18 %.
2.
. Daher ist h = 0,29 (gerundet auf zwei Nachkommastellen) bzw. 29 %.
3.
. Daher ist h = 0,36 (gerundet auf zwei Nachkommastellen) bzw. 36 %.
4.
. Daher ist h = 0,14 (gerundet auf zwei Nachkommastellen) bzw. 14 %.
5.
. Daher ist h = 0,04 (gerundet auf zwei Nachkommastellen) bzw. 4 %.
c)
Bei einer Geschwindigkeitsprüfung wurde jeweils die relative Wahrscheinlichkeit aller 51 zu schnell gefahrenen Geschwindigkeiten ausgewertet.
1.
. Daher ist h = 0,59 (gerundet auf zwei Nachkommastellen) bzw. 59 %.
2.
. Daher ist h = 0,25 (gerundet auf zwei Nachkommastellen) bzw. 25 %.
. Daher ist h = 0,08 (gerundet auf zwei Nachkommastellen) bzw. 8 %.
. Daher ist h = 0,06 (gerundet auf zwei Nachkommastellen) bzw. 6 %.
. Daher ist h = 0,02 (gerundet auf zwei Nachkommastellen) bzw. 2 %.
d) Mittelwert (M): Durch den Mittelwert oder das arithmetische Mittel wird angegeben, wie groß der Durchschnittswert aller ermittelnder Werte ist. Der Mittelwert M setzt sich daher aus dem Quotienten aller Werte und der Grundgesamtheit zusammen. Deshalb gilt für den Mittelwert folgende Definition:
beziehungsweise der
.
Beispiele:
Bei einem Weitsprungwettbewerb wird der Mittelwert/das arithmetische Mittel aller 15 gesprungener Weiten bestimmt. Hierbei setzt sich der Mittelwert wie folgt zusammen:
.
Die Werte im Zähler sind Meterangaben. Daher ergibt sich als Mittelwert aller gesprungener Weiten:
(gerundet auf zwei Nachkommastellen).
Bei einer Abschlussprüfung einer Lehre wird der Mittelwert/das arithmetisches Mittel aller vergebener 28 Noten ermittelt. Hierbei setzt sich der Mittelwert wie folgt zusammen:
. Daher ergibt sich als Mittelwert aller vergebener Noten:
(gerundet auf zwei Nachkommastellen).
Bei einer Geschwindigkeitsüberprüfung wird der Mittelwert/das arithmetisches Mittel aller 51 erfasster Geschwindigkeitsüberschreitungen ermittelt. Hierbei setzt sich der Mittelwert wie folgt zusammen: (zur übersichtlicheren Darstellung wurden bereits folgende Zwischenrechnungen bei den Geschwindigkeitsüberscheitungen > 10 km/h: 10 · 30 = 300 km/h, > 15 km/h: 15 · 13 = 195 km/h, > 20 km/h:20 · 4 = 80 km/h, > 25 km/h: 25 · 3 = 75 km/h, > 30 km/h: 30 km/h · 1 = 30 km/h vorgenommen).
. Daher ergibt sich als Mittelwert aller erfassten Geschwindigkeitsüberschreitungen:
(gerundet auf zwei Nachkommastellen).
e) Zentralwert (Z): Durch den Zentralwert oder Median wird angegeben, welcher Wert genau in der Mitte einer Datenmenge steht. Um den Zentralwert genau ermitteln zu können, muss die Datenmenge aber immer vom kleinsten Wert bis zum größten Wert hin geordnet aufgelistet sein. Ist die Anzahl der Werte (Grundgesamtheit) gerade, so ist der in der Mitte stehende Wert der Zentralwert. Ist die Anzahl der Werte (Grundgesamtheit) ungerade, so ergibt sich aus den beiden in der Mitte stehenden Werten der Zentralwert, indem man aus diesen beiden den Mittelwert/das arithmetische Mittel bildet.
Beispiele:
Bei einem Weitsprungwettbewerb wird aus 15 ermittelnden Weiten der Zentralwert/Median bestimmt. Zuerst ordnet man hierbei die Weiten von der kleinsten Größe beginnend hin zur größten: 3,03 m, 3,12 m, 3,42 m, 3,47 m, 3,47 m, 3,48 m, 3,50 m, 3,51 m, 3,52 m, 3,52 m, 3,52 m, 3,55 m, 3,68 m, 3,68 m, 3,77 m. Bei 15 Weiten ist der in der Mitte stehende Wert der 8., da jeweils 7 links und jeweils 7 rechts stehen. Daher ist der Zentralwert bei allen 15 ermittelnden Weiten: Z = 3,51 m.
Bei einer Abschlussprüfung einer Lehre wird aus 28 ermittelnden Noten der Zentralwert/Median bestimmt. Zuerst ordnet man hierbei die Noten von der besten beginnend hin zur schlechtesten: Note 1, Note 1, Note 1, Note 1, Note 1, Note 2, Note 2, Note 2, Note 2, Note 2, Note 2, Note 2, Note 2, Note 3, Note 3, Note 3, Note 3, Note 3, Note 3, Note 3, Note 3, Note 3, Note 3, Note 4, Note 4, Note 4, Note 4, Note 5. Bei 28 Noten sind die in der Mitte stehenden Noten die 14. und die 15., da jeweils 13 links und 13 rechts stehen. Hierbei ist die 14. Note eine 3 und die 15. Note ebenso eine 3. Aus dem noch zu bildenden arithmetischen Mittel ergibt sich nun der Zentralwert:
.
Bei einem Geschwindigkeitsüberprüfung wird aus 51 ermittelnden Geschwindigkeitsüberschreitungen der Zentralwert/Median bestimmt. Zuerst ordnet man hierbei die Geschwindigkeitsüberschreitungen von der kleinsten beginnend hin zur größten: 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 10 km/h, 15 km/h, 15 km/h, 15 km/h, 15 km/h, 15 km/h, 15 km/h, 15 km/h, 15 km/h, 15 km/h, 15 km/h, 15 km/h, 15 km/h, 15 km/h, 20 km/h, 20 km/h, 20 km/h, 20 km/h, 25 km/h, 25 km/h, 25 km/h, 30 km/h. Bei 51 Geschwindigkeitsüberschreitungen ist der in der Mitte stehende Wert der 26., da jeweils 25 links und jeweils 25 rechts stehen. Daher ist der Zentralwert bei allen ermittelnden 51 Geschwindigkeitsüberschreitungen: Z = 10 km/h.
f) Modalwert (m): Der Modalwert ist innerhalb einer erfassten Datenmenge immer der am häufigsten vorkommende Wert.
Beispiele:
Bei einem Weitsprungwettbewerb wurde die Weite 3,52 m am häufigsten (3-mal) gesprungen. Bei dem durchgeführten Weitsprungwettbewerb ist daher der Modalwert (m) = 3,52 m.
Bei einer absolvierten Abschlussprüfung einer Lehre wurde die Note 3 am häufigsten (10-mal) vergeben. Bei der absolvierten Abschlussprüfung einer Lehre ist deshalb der Modalwert die Note 3.
Bei einer durchgeführten Geschwindigkeitsüberprüfung wurde die Geschwindigkeitsüberschreitung > 10 km/h am häufigsten (30-mal) ermittelt. Bei der gemachten Geschwindigkeitsüberprüfung ist daher der Modalwert die Geschwindikgeitsüberschreitung > 10 km/h.
g) Spannweite (w): Die Spannweite ist innerhalb einer erfassten Datenmenge die Differenz aus dem größten ermittelten Wert minus dem kleinsten ermittelten Wert. Deshalb gilt für die Spannweite folgende Definition: w = Wertmax – Wertmin
Beispiele:
Bei einem Weitsprungwettbewerb wurden als größte Weite 3,77 m ermittelt und als kleinste Weite 3,03 m. Bei dem Weitsprungwettbewerb ist die Spannweite (w) = 3,77 m – 3,03 m = 0,74 m. Die Spannweite zwischen der besten Weite und der schlechtesten Weite ist also 0,74 m.
Bei einer Abschlussprüfung einer Lehre wurde als beste Note eine 1 vergeben und als schlechteste eine 5. Bei der Abschlussprüfung einer Lehre ist die Spannweite (w) = Note 5 – Note 1 = Note 4. Die Spannweite zwischen der besten und der schlechten Note umfasst also vier Noten.
Bei einer Geschwindigkeitsüberprüfung wurde als höchste Geschwindigkeitsüberschreitung 30 km/h ermittelt und als niedrigste 10 km/h. Bei der Geschwindigkeitsüberprüfung ist die Spannweite (w) = 30 km/h – 10 km/h = 20 km/h. Die Spannweite zwischen der höchsten und der niedrigsten Geschwindigkeitsüberschreitung beträgt also 20 km/h.
Siehe hierzu auch die Strichlisten weiter unten, von woher die Ergebnisse rühren.
2 Die Analyse von Daten mittels grafischen Darstellungen
Die bei einer statistischen Erhebung ermittelnden Daten können jeweils grafisch dargestellt werden. Dadurch kann man sich sofort einen Überblick verschaffen, über beispielsweise die Grundgesamtheit, die absolute oder relative Wahrscheinlichkeit einer bestimmten Statistik.
Grafiken, durch die statistische Daten dargestellt werden können, sind
- Strichlisten
- Tabellen
und
- Diagramme
a) Strichlisten
Strichlisten zeigen – Strich für Strich – an, wie häufig jeweils ein bestimmtes Merkmal/eine Merkmalsausprägung bei einer statistischen Erhebung auftritt. Tritt hierbei des Öfteren das absolut identische Merkmal bzw. die identische Merkmalausprägung auf, so macht man dahinter jeweils so oft ein Strich, wie das der Fall ist. Bei einer Anzahl von 5 Übereinstimmungen wird der 5. Strich jeweils diagonal über die 4 anderen senkrechten Striche gezogen.
Beispiele von Strichlisten zu dem Merkmal Weite bei einem Weitsprungwettbewerb, zu dem Merkmal Note bei einer Abschlussprüfung und dem Merkmal Geschwindigkeitsüberschreitung bei einer Geschwindigkeitsüberprüfung sind auf dem unteren Bild aufgelistet. Die Merkmalausprägung ist hierbei jeweils die gesprungene Weite (3,03 m, 3,12 m, 3,42 m, 3,47 m, 3,48 m, 3,50 m, 3,51 m, 3,52 m, 3,55 m, 3,68 m, 3,77 m), die jeweils ermittelnde Note (Note 1, Note 2, Note 3, Note 4, Note 5, Note 6)und die jeweils erfasste Geschwindigkeitsüberschreitung (Geschwindigkeitsüberschreitung > 10 km/h, Geschwindigkeitsüberschreitung > 15 km/h, Geschwindigkeitsüberschreitung > 20 km/h, Geschwindigkeitsüberschreitung > 25 km/h, Geschwindigkeitsüberschreitung > 30 km/h).
Bei der Strichliste zu dem Merkmal Weite eines Weitsprungwettbewerbs sieht man, dass die Weiten 3,03 m, 3,12 m, 3,42 m, 3,48 m, 3,50 m, 3,51 m, 3,55 m und 3,77 m jeweils 1-mal gesprungen wurden, da hinter diesen Weiten stets nur ein Strich vermerkt wurde. Die Weite 3,47 m und die Weite 3,68 m wurde hingegen 2-mal gesprungen, da hinter diesen Weiten zwei Striche vermerkt wurden, und die Weite 3,52 m 3-mal, da hinter dieser Weite drei Striche gemacht wurden; bei der Strichliste zu dem Merkmal Note einer Abschlussprüfung von einer Lehre wurden folgende Noten erzielt: 5-mal die Note 1, da hinter dieser Note 5 Striche gemacht wurden, 8-mal die Note 2, da hinter dieser Note 8 Striche gemacht wurden, 10-mal die Note 3, da hinter dieser Note 10 Striche gemacht wurden, 4-mal die Note 4, da hinter dieser Note 4 Striche gemacht wurden, 1-mal die Note 5, da hinter dieser Note 1 Strich gemacht wurde – und 0-Mal die Note 6, da hinter dieser Note ein Längsstrich bzw. Nicht-Vorkommend-Vermerk gemacht wurde; bei der Strichliste zu dem Merkmal Geschwindigkeitsüberschreitung bei einer Geschwindigkeitsüberprüfung fuhren 30 Fahrzeuge über 10 km/h, da hinter dem „> 10-km/h“-Zeichen 30 Striche gemacht wurden, 13 Fahrzeuge fuhren über 15 km/h, da hinter dem „> 15 km/h“-Zeichen 13 Striche gemacht wurden, 4 Fahrzeuge fuhren über 20 km/h, da hinter dem „> 20 km/h“-Zeichen 4 Striche gemacht wurden, 3 Fahrzeuge fuhren über 25 km/h, da hinter dem „> 25 km/h“-Zeichen 3 Striche gemacht wurden und 1 Fahrzeug fuhr über 30 km/h, da hinter dem „> 30 km/h“Zeichen 1 Strich gemacht wurde.