Home
 Kontakt  |  Sitemap  |  Suchen  |  Impressum  |  Login 
 Home Über uns Aktivitäten Beispielsammlung Lehrmaterial Links Glossar

 >Glossar







SUCHEN  Suchen 

Absolute Häufigkeit
Aggregation
Anteil
Balkendiagramm
Bedingter Anteil
Bevölkerungsdichte
Demographie
Diagramme
Durchschnitt
Ereignis
Erhebung
Erhebungsplan
Fragebogen
Gesetz der großen Zahlen
Informationsverlust
Kreisdiagramm (auch Tortendiagramm)
Liniendiagramm
Median
Mehrfeldertafel
Merkmal (Merkmalsausprägungen, Merkmalsträger, Merkmalswerte)
Repräsentativität
Skala
Skalierung
Statistik
Streudiagramm
Wahrscheinlichkeit
Zeitreihe
Zufallsexperiment
Seitenanfang   Absolute Häufigkeit


Gibt die Anzahl aller Merkmalsträger mit einer bestimmten Merkmalsausprägung an. Die relative Häufigkeit gibt den Anteil der Anzahl der Merkmalsträger mit einer bestimmten Ausprägung an der Anzahl der Gesamtheit der Merkmalsträger an.

Beispiel: Angenommen, es gibt 10 blonde Kinder in einer Klasse von insgesamt 30 Schülern. Die Merkmalsträger sind in diesem Fall die Schüler, das Merkmal ist die Haarfarbe und eine mögliche Merkmalsausprägung ist blond.
Die absolute Häufigkeit an Schülern mit blonder Haarfarbe beträgt 10, die relative Häufigkeit ist gleich 10/30, also ein Drittel.

  
Seitenanfang   Aggregation

Bezeichnet die Zusammenfassung einzelner Merkmalsträger in Gruppen bzw. die Reduzierung vieler Gruppen auf wenige.
  
Seitenanfang   Anteil
Der Anteil (auch: die Quote) gehört zur Familie der Verhältniszahlen und gibt den Quotient einer Teilgröße bezogen auf die zugehörige Gesamtgröße an.
  
Seitenanfang   Balkendiagramm

Diagramm, das die absoluten (bzw. relativen) Häufigkeiten an Beobachtungen bezüglich eines Merkmals durch die Höhe von Balken aufzeigt.

Beispiel: Wetter

Seitenanfang   Bedingter Anteil

Gibt den Quotient einer Teilgröße auf jenen Teil der Gesamtgröße an, der eine bestimmte Bedingung erfüllt.

 

  
Seitenanfang   Bevölkerungsdichte
Die durchschnittliche Zahl der Einwohner eines geografischen Gebiets pro Flächeneinheit. (Bei Staaten meist in Einwohner/km² angegeben.)
  
Seitenanfang   Demographie
Wissenschaft von der Bevölkerung, ihrer Struktur, Verteilung und Veränderung
  
Seitenanfang   Diagramme

Möglichkeit zur Präsentation von Daten in übersichtlicher, einprägsamer und aussagekräftiger Form.

Beispiele: Liniendiagramm, Balkendiagramm, Streudiagramm, Kreisdiagramm

 

  
Seitenanfang   Durchschnitt

(hier:) arithmetisches Mittel (Mittelwert, durchschnittlicher Wert)

Gegeben durch die Summe der Merkmalsausprägungen dividiert durch die Anzahl der Merkmalsträger. Man beachte, dass für manche Sachverhalte andere Prinzipien zur Durchschnittsbildung heranzuziehen sind (z.B. geometrisches Mittel bei Zinseszinsrechnung oder Wachstumsprozessen).

 

  
Seitenanfang   Ereignis

Wenn die Ergebnismenge aus allen möglichen Ergebnissen eines Zufallsexperiments besteht, so ist ein Ereignis eine Teilmenge dieser Ergebnismenge.

Beispiel: Das Werfen eines Würfels kann man als Zufallsexperiment bezeichnen. Die Ergebnismenge besteht aus allen möglichen Ausgängen, also vom Ergebnis "1" bis zum Ergebnis "6", oder anders geschrieben: Ergebnismenge = {"1", "2", "3", "4", "5", "6"}. Ein Ereignis besteht nun aus einer Teilmenge dieser Ergebnismenge, z.B. das Ereignis, eine "2" oder eine "4" zu würfeln.
Unterarten von Ereignissen sind das sichere Ereignis (im Beispiel würde das bedeuten, das man irgendein Ergebnis von "1" bis "6" würfelt) oder das unmögliche Ereignis (eine "7" zu würfeln).

 

  
Seitenanfang   Erhebung

Als Erhebung bezeichnet man die Gewinnung von statistischen Informationen über den Zustand oder das Geschehen in Bereichen unserer Umwelt (s.a. Erhebungsplan)

 

  
Seitenanfang   Erhebungsplan

Vor Beginn jeder Erhebung sollte ein ausführlicher Erhebungsplan erstellt werden, in dem unter Berücksichtigung der angepeilten Ziele vor allem die organisatorischen Modalitäten der Erhebung, d.h. auch der Datengewinnung festgelegt sind.
Vereinfachend gesagt muss also definiert werden, welche Frage(n) beantwortet werden soll(en) und welche Wege man zur Beantwortung der Frage beschreiten will.
Dies ist bei den vorgegebenen Beispielen zwar meist recht einfach, sollte aber dennoch immer wieder betont werden, da die Aufstellung und Einhaltung eines Erhebungsplanes zu den wichtigsten Elementen (praktischer) statistischer Auswertungen zählt.

Beispiel: Im Beispiel Wetter soll das Ziel erreicht werden, die Häufigkeit des Auftretens der verschiedenen Wetterlagen im Laufe eines Monats darzustellen. Dazu muss zunächst eine geeignete Klassifikation der verschiedenen Wetterlagen definiert werden. In der Basisversion wird die Wetterlage täglich einmal, jeweils zu einem bestimmten Zeitpunkt beobachtet und in einem Kalender eingetragen. Am Monatsende wird aus den gewonnenen Daten ein übersichtliches Diagramm gefertigt.

 

  
Seitenanfang   Fragebogen

Bei der Erstellung eines Fragebogens muss zunächst überlegt werden, welche Arten von Fragen gestellt werden sollen. Während offene Fragen beliebige (auch längere) Antworten ermöglichen, erleichtern geschlossene Fragen durch die Vorschreibung bestimmter Antworten, aus denen nur mehr eine Auswahlmöglichkeit besteht, die spätere Auswertung des Fragebogens. Allerdings steigt hier auch die Gefahr der Nichtbeantwortung einer Frage. Geklärt werden muss auch, ob die Antwortmöglichkeiten disjunkt sind (d.h. eine Möglichkeit schließt jeweils alle anderen Möglichkeiten aus), andernfalls müssten Mehrfachantworten erlaubt sein, was wieder eine deutliche Erschwerung der Auswertung darstellt.
Die Auswertung der Antworten kann je nach Fragestellung auf unterschiedlichste Art erfolgen. Einzelne Fragen können mit einfachen Diagrammen dargestellt werden. Einen ersten Eindruck von Zusammenhängen zwischen zwei Merkmalen der Befragung bieten Mehrfeldertafeln, bei entsprechendem Skalenniveau können auch Streudiagramme verwendet werden.

 

  
Seitenanfang   Gesetz der großen Zahlen

(vereinfacht, nach Bernoulli) Das Gesetz der großen Zahlen besagt, dass die relative Häufigkeit gegen die Wahrscheinlichkeit konvergiert.

Beispiel: Wirft man eine Münze, so ist die Wahrscheinlichkeit für jede Seite ("Kopf" und "Zahl") jeweils 50%. Je öfter man wirft, desto näher wird der Anteil von "Kopf" bzw. "Zahl" bei 50% liegen. 

 

  
Seitenanfang   Informationsverlust

Verlust von Aussagemöglichkeiten, die meist aufgrund einer verbesserten Darstellung von anderen, interessanteren Daten in Kauf genommen wird. Oft tritt ein Informationsverlust in Zusammenhang mit der Aggregation von Daten auf, in folgendem Beispiel aber auch ohne Aggregation.

Beispiel: Wetter. Sobald aus dem Kalender ein Balkendiagramm gefertigt wird, geht die Information, welches Wetter an einem ganz bestimmten Tag geherrscht hat, verloren. Allerdings erhält man ein übersichtlicheres Bild über die Häufigkeit des Auftretens der verschiedenen Wetterlagen. Für die klare Darstellung der Hauptinformation wird der Verlust anderer nicht so bedeutender Informationen akzeptiert.

  
Seitenanfang   Kreisdiagramm (auch Tortendiagramm)

Stellt die Anteile der Merkmalswerte der verschiedenen Ausprägungen in einem Kreis durch unterschiedlich markierte Sektoren entsprechender Größe dar. 

 

  
Seitenanfang   Liniendiagramm

Auf einer Linie werden die Ausprägungen eines Versuchs oder einer Erhebung dargestellt, wobei jede Ausprägung (oder zumindest die Mehrzahl der Ausprägungen) zur Wahrung der Übersichtlichkeit nur einmal vorkommen sollte.

 

  
Seitenanfang   Median

Der Median bezeichnet jene Merkmalsausprägung, die von allen Merkmalsausprägungen "in der Mitte" liegt. D.h., dass jeweils die Hälfte aller übrigen Merkmalsträger darüber liegt und die andere Hälfte darunter. Zu beachten ist dabei, dass die Merkmalsausprägungen der Größe nach geordnet sein müssen, bevor man den mittleren Wert herausnimmt.

Beispiel: Tageshöchsttemperaturen

 

MO 15°
DI 14°
MI 10°
DO 16°
FR 16°

Der Median der Temperaturen liegt bei 15°. (10° und 14° liegen darunter, 16° und 16° darüber)

Zum Vergleich: Der Durchschnitt würde bei (10+14+15+16+16)/5 = 14,2° liegen.

  
Seitenanfang   Mehrfeldertafel

In einer Vierfelder- oder Mehrfeldertafel können die absoluten Häufigkeiten der Ausprägungen nominalskalierter Merkmale übersichtlich dargestellt werden.

Beispiel: Will man herausfinden, ob ein Zusammenhang zwischen Haarfarbe und Augenfarbe besteht, kann man die Anzahl der jeweiligen Kombinationen in einer Mehrfeldertafel eintragen und erste Zusammenhänge erkennen.

 

Haarfarbe/
Augenfarbe
blond brünett schwarz rot
blau 10 2 4 2
grün 2 4 5 1
grau 3 4 2 0
braun 4 1 3 0

  
Seitenanfang   Merkmal (Merkmalsausprägungen, Merkmalsträger, Merkmalswerte)

Ein Merkmal ist eine messbare Eigenschaft der Merkmalsträger. Die verschiedenen Unterteilungen des Merkmals werden als Merkmalsausprägungen bezeichnet, die Anzahl des Vorkommens der jeweiligen Ausprägungen in der Grundgesamtheit als Merkmalswerte.

Beispiel: Betrachtet man die Haarfarbe aller Kinder in einer Klasse, so sind die Schüler die Merkmalsträger, die Haarfarbe ist das Merkmal, die Merkmalsausprägungen sind "blond", "rot", "brünett", etc. Die Anzahl der Kinder mit der jeweiligen Haarfarbe bildet den Merkmalswert dieser Haarfarbe.

  
Seitenanfang   Repräsentativität

Ein Teil einer Gesamtheit wird dann als repräsentativ bezeichnet, wenn von dem Teil ein Schluss auf die Gesamtheit möglich ist. Der Teil fungiert sozusagen als "verkleinertes Abbild" (Modell) der Gesamtheit.

 

  
Seitenanfang   Skala

Eine Skala ist eine relationstreue Abbildung empirischer Objekte in ein System von reellen Zahlen.
Um mit dem Ergebnis einer Beobachtung, einer Messung oder eines Tests arbeiten zu können, muss zunächst eine Skala festgelegt werden, die alle möglichen Ausprägungen eines Merkmals beinhaltet

Ein Beispiel und eine anschließende Übersicht sollen dies verdeutlichen:

Gegeben sei wieder eine Schulklasse und wieder geht es zunächst um die Haarfarbe der Kinder.
Die verschiedenen Haarfarben seien "schwarz", "brünett", "blond" und "rot". Wenn man den einzelnen Haarfarben nun Zahlen zuordnet (z.B. 1 für "blond", 2 für "brünett", 3 für "schwarz", 4 für "rot") erhält man eine "relationstreue Abbildung", von der im ersten Satz die Rede ist. Das bedeutet nämlich nichts anderes, als dass zwei blonden Schülern auch jeweils eine 1, zwei brünetten Schülern jeweils eine 2 usw. zugeordnet werden muss. Da 1, 2, 3 und 4 auch reelle Zahlen sind, kann man die "Übersetzung" der Haarfarben in reelle Zahlen als Skala bezeichnen.

Von zentraler Bedeutung bei der Arbeit mit Skalen ist deren Niveau. Vom Skalenniveau hängt es ab, welche Berechnungen sinnvoller weise angestellt werden können.

Im Beispiel der Haarfarbe befindet man sich auf der sogenannten Nominalskala. Das bedeutet, dass man die Kinder mit Hilfe der Zahlen zwar eindeutig nach ihrer Haarfarbe unterscheiden kann (1 steht immer für eine Haarfarbe, 2 immer für eine andere usw.), man kann aber nicht sinnvoll sortieren ("Haarfarbe 1 ist besser oder größer als Haarfarbe 2"), auch Rechenoperationen sind nur sehr eingeschränkt durchführbar. So ist es zum Beispiel sinnlos, einen Durchschnitt auszurechnen (Mittelwert zwischen "schwarz" und "blond"?).

Etwas anders verhält sich die Ordinalskala. Ein Paradebeispiel dafür sind die Schulnoten. Hier wird bereits ganz automatisch einem "Sehr gut" die 1, einem "Gut" die 2 usw. zugeordnet. Man kann auch bereits sinnvoll sortieren (1 besser als 2), gleiche Differenzen haben aber inhaltlich noch nicht den gleichen Sinn (Bsp. die Differenz zwischen 2 und 3 hat eine andere inhaltliche Bedeutung als die Differenz zwischen 4 und 5).
Aus diesem Grund ist es auch nicht sinnvoll (!), Durchschnitte zu berechnen.

Die nächsten beiden Skalenniveaus werden als Differenzen- bzw. Verhältnisskala bezeichnet. Praktische Beispiele für diese beiden Skalen sind die Temperaturen (einmal in °C und einmal in °K gemessen). Sowohl bei Celsius als auch bei Kelvin kann man sagen, dass 100° wärmer als 10° sind, auch Durchschnitte können sinnvoll berechnet werden. Der Unterschied zwischen den beiden Skalen liegt im Nullpunkt. Währen man bei °C nicht davon sprechen kann, dass 60° "doppelt so warm ist" wie 30° (wie würde dann der Vergleich -10° mit 10° ausfallen?), ist dies auf der Kelvin-Skala sehr wohl möglich.

Schließlich gibt es noch die Absolutskala, auf der keine Zuordnungs- oder Umrechnungsmöglichkeiten gibt, da es sich eben um absolute Zahlen handelt (z.B. Einkommen, Unfallzahlen, ...)

Skala Beispiele Informationsqualität zulässige Transformationen
Nominalskala Geschlecht, Haarfarbe Unterscheidung jede injektive Transformation (eindeutige Umbenennung)
Ordinalskala Schulnoten Rangfolge jede rangerhaltende (streng monotone Transformation)
Differenzenskala Temperatur in °C Abstand lineare Transformationen (Verschiebung und Streckung/Stauchung)
Verhältnisskala Einkommen in EURO Verhältnis Ähnlichkeitstransformationen (Streckung/Stauchung)
Absolutskala Unfallzahlen absolute Einheit keine

 

  
Seitenanfang   Skalierung

Im Rahmen von grafischen Abbildungen kommt der Skalierung (Festlegung der Eigenschaften einer Skala) eine große Bedeutung zu, da unterschiedliche Skalierungen eine unterschiedliche Wahrnehmung des Sachverhalts auslösen können. Die Skalierungsproblematik soll anhand zweier Diagramme, die beide den selben Sachverhalt zeigen, illustriert werden.

Seitenanfang   Statistik

Für den Begriff "Statistik" gibt es eine Reihe von Definitionen. Ursprünglich geht das Wort vermutlich auf das lateinische "Status" zurück, was so viel bedeutet wie "Zustand" oder "Staat". Unter "Statistik" verstand man im 18.Jahrhundert noch eine Vollerhebung zur Zustandsbeschreibung des Staates.

Heutzutage findet sich in beinahe jedem Lehr-, Hand- und Taschenbuch eine etwas abgewandelte Definition des Begriffs "Statistik". Aus diesem Grund seien hier exemplarisch zwei Definitionen aufgelistet:

Rinne: Statistik als wissenschaftliche Disziplin ist die Lehre von den Methoden zum Umgang mit quantitativen Informationen. Letztere heißen Daten. Statistik ist eine der Möglichkeiten, eine systematische Verbindung zwischen Erfahrung (Empirie) und Theorie herzustellen.

Wald: Statistik ist eine Zusammenfassung von Methoden, die uns erlauben, vernünftige optimale Entscheidungen im Falle von Ungewissheit zu treffen.

 

  
Seitenanfang   Streudiagramm

Mit einem Streudiagramm können in einem zweidimensionalen Koordinatensystem die Ausprägungen zweier zumindest intervallskalierter Merkmale der Merkmalsträger gleichzeitig beschrieben werden, wobei ein Merkmal auf der x-Achse und das andere auf der y-Achse aufgetragen wird.

Im Beispiel Größenvergleich sind die Schüler die Merkmalsträger und die beiden Merkmale sind Spannweite der Arme und Körpergröße.

 

Seitenanfang   Wahrscheinlichkeit

(hier, nach Laplace): Wahrscheinlichkeit bei endlich vielen gleichmöglichen Elementarereignissen:

P(E) = Anzahl der für E günstigen Elementarereignisse / Anzahl der gleichmöglichen Elementarereignisse

kurz: Günstige durch Mögliche

Die Bedeutung diese Formulierung soll wieder an einem einfachen Beispiel demonstriert werden:

Wirft man einen Würfel, so gibt es sechs gleichmögliche Ergebnisse, die sogenannten Elementarereignisse. Will man die Wahrscheinlichkeit des Ergebnisses "5 oder 6" berechnen, so besteht die Menge "E" aus den beiden Elementen "5" und "6". Die Wahrscheinlichkeit, dass ein Element der Menge E gewürfelt wird (kurz: P(E)) ist somit 2 (Anzahl der für E günstigen Elementarereignisse) durch 6 (Anzahl der gleichmöglichen Elementarereignisse), also ein Drittel.

 

  
Seitenanfang   Zeitreihe

Im Gegensatz zum Balkendiagramm werden nicht die Merkmalsausprägungen vieler Merkmalsträger betrachtet, sondern die Ausprägungen eines einzelnen Merkmalsträgers über längere Zeit immer wieder überprüft.

 

Oft werden die Beobachtungspunkte auch verbunden, was zwar grafisch eindrucksvoller aussieht, aber inhaltlich nicht immer zu rechtfertigen ist.

Seitenanfang   Zufallsexperiment

Wiederholbarer Vorgang, für den bei vorgegebenen Bedingungen die Menge aller möglicher Ergebnisse bekannt ist, dessen Ergebnis im Einzelfall jedoch nicht mit Sicherheit vorhergesagt werden kann.