Mathematische Statistik

Aus AnthroWiki

Als mathematische Statistik bezeichnet man das Teilgebiet der Statistik, das die Methoden und Verfahren der Statistik mit mathematischen Mitteln analysiert beziehungsweise mit ihrer Hilfe erst begründet. Gemeinsam mit der Wahrscheinlichkeitstheorie bildet die mathematische Statistik das als Stochastik bezeichnete Teilgebiet der Mathematik. Meist weitgehend synonym werden die Begriffe induktive Statistik und Inferenzstatistik (schließende Statistik) gebraucht, die den zur beschreibenden Statistik komplementären Teil der Statistik charakterisieren.

Die mathematische Grundlage der mathematischen Statistik ist die Wahrscheinlichkeitstheorie.

Womit beschäftigt sich Statistik?

Gegenstand der Statistik sind Grundgesamtheiten, deren Mitglieder allesamt ein bestimmtes Merkmal aufweisen. Gesucht ist die Häufigkeitsverteilung, die Auskunft darüber gibt, wie häufig dieses Merkmal innerhalb der Grundgesamtheit seine möglichen Werte annimmt. Oft beschränken sich die Aussagen auf abgeleitete Größen wie zum Beispiel den Durchschnitt der Merkmalswerte, die die Mitglieder der Grundgesamtheit besitzen.

Alterspyramide: Verteilung der Merkmale Geschlecht und Alter in der deutschen Bevölkerung (2010)

Ein Beispiel ist die häufig als Alterspyramide grafisch dargestellte Altersverteilung, wobei es sich bei der Grundgesamtheit beispielsweise um die deutsche Bevölkerung handeln kann. Da eine präzise Bestimmung der Altersverteilung der Deutschen eine aufwändige Vollerhebung wie eine Volkszählung voraussetzt, sucht man nach Methoden, mit denen weitgehend zuverlässige Aussagen bereits auf Basis von Teilerhebungen möglich sind. Wie im Beispiel des Politbarometers werden dazu nur die Mitglieder zufällig ausgewählter Teilmengen der Grundgesamtheit, sogenannte Stichproben, auf das interessierende Merkmal untersucht.

Methodik der mathematischen Statistik

Wäre die Altersverteilung in der Grundgesamtheit bekannt, könnten mit Formeln der Wahrscheinlichkeitstheorie Wahrscheinlichkeiten für die innerhalb von Stichproben beobachtbaren Altersverteilungen berechnet werden, die aufgrund der Zufallsauswahl der Stichproben zufälligen Schwankungen unterworfen sind. In der mathematischen Statistik nutzt man solche Berechnungen, um umgekehrt vom Stichprobenergebnis auf die Grundgesamtheit schlussfolgern zu können: Dabei werden auf Basis der konkret für eine Stichprobe beobachteten Merkmalswerte jene Häufigkeitsverteilungen innerhalb der Grundgesamtheit charakterisiert, mit denen das gemachte Beobachtungsergebnis in plausibler Weise erklärbar wird. Im Blickpunkt theoretischer Untersuchungen stehen nicht nur die getroffenen Schlussfolgerungen selbst, sondern auch Abschätzungen darüber, wie numerisch genau und wie sicher solche Prognosen sind.

Die einen Anwender interessierenden Häufigkeitsverteilungen sind nur indirekt Gegenstand der Methoden der mathematischen Statistik. Stattdessen beziehen sich diese Methoden auf Zufallsvariablen. Dabei werden insbesondere solche Zufallsvariablen betrachtet, deren Wahrscheinlichkeitsverteilung den relativen Häufigkeiten der Merkmalswerte entspricht. Speziell für das angeführte Beispiel der Altersverteilung ist ein realisierter Wert der Zufallsvariablen gleich dem Alter eines zufällig ausgewählten Deutschen. Auf diese Weise können die einer Stichprobe ermittelten Beobachtungswerte als sogenannte Realisierungen stochastisch unabhängiger und identisch verteilter Zufallsvariablen aufgefasst werden. Das Vorwissen wird in diesem Fall durch eine Familie von Wahrscheinlichkeitsverteilungen beziehungsweise durch eine entsprechende Familie von Wahrscheinlichkeitsmaßen repräsentiert. Man spricht von einer Verteilungsannahme. Diese kann sowohl Aussagen über mögliche Merkmalswerte, etwa in Bezug auf deren Ganzzahligkeit, als auch über den Typ der Verteilung, zum Beispiel „die Werte sind normalverteilt“, beinhalten.

Das zentrale Gebiet der mathematischen Statistik ist die Schätztheorie, innerhalb der geeignete Schätzverfahren entwickelt werden. Methodisch wird dabei so vorgegangen, dass man ausgehend von der Verteilungsannahme bestimmte Klassen von Schätzfunktionen untersucht und hinsichtlich verschiedener Qualitätskriterien (etwa Suffizienz oder Effizienz) vergleicht. Bei einer solchen Schätzfunktion kann es sich sowohl um eine einwertige Näherung eines gesuchten Parameters der Grundgesamtheit handeln als auch um eine Bereichsschätzung in Form eines sogenannten Konfidenzintervalls. Konkrete Vermutungen über die Grundgesamtheit können durch geeignete statistische Tests überprüft werden. Dabei wird ausgehend von einer Hypothese auf Basis des Stichprobenergebnisses eine 0-1-Entscheidung über die Verwerfung beziehungsweise Beibehaltung der Hypothese herbeigeführt.

Zur mathematischen Statistik gehören auch die Theorien statistischer Auswahlverfahren sowie der optimalen Versuchs- und Erhebungsplanung.

Statistische Modelle

Eine gänzliche Formalisierung auf Basis mathematischer Objekte wird mit dem Begriff des statistischen Modells erzielt, oft auch als statistischer Raum bezeichnet. Abweichend vom bisher beschriebenen, eher anwendungsorientierten Szenario kann dabei auf die Festlegung einer Grundgesamtheit verzichtet werden:

Die möglichen Stichprobenergebnisse werden zu einer Menge , dem Stichprobenraum, zusammengefasst. Die darin beobachtbaren Ereignisse werden formal durch eine zum Stichprobenraum definierte σ-Algebra charakterisiert. Die Verteilungsannahme, das heißt die in Frage kommenden Wahrscheinlichkeitsverteilungen, entsprechen einer Familie von Wahrscheinlichkeitsmaßen auf . Ein statistisches Modell ist damit formal ein Tripel . Ist ein reeller Parametervektor, also , so spricht man von einem parametrischen Modell mit Parameterraum . Den Fall eines reellen Parameters nennt man einparametriges Modell.

Eine messbare Funktion von in einem weiteren Messraum heißt Stichprobenfunktion oder Statistik. Eine Schätzfunktion oder kurz ein Schätzer für eine Kenngröße des Parameters ist eine Stichprobenfunktion .

Siehe auch

Literatur

  • Jörg Bewersdorff: Statistik – wie und warum sie funktioniert. Ein mathematisches Lesebuch. Vieweg+Teubner Verlag 2011, ISBN 978-3-8348-1753-2
  • Hans-Otto Georgii: Stochastik: Einführung in die Wahrscheinlichkeitstheorie und Statistik, 4. Auflage, de Gruyter, 2009, ISBN 978-3-11-021526-7
  • Norbert Henze: Stochastik für Einsteiger: Eine Einführung in die faszinierende Welt des Zufalls. Vieweg+Teubner Verlag 2010, ISBN 978-3-8348-0815-8
  • Hermann Witting: Mathematische Statistik, Band 1, Parametrische Verfahren bei festem Stichprobenumfang, Teubner Verlag 1985, ISBN 3-519-02026-2
  • Herrmann Witting, Ulrich Müller-Funk: Mathematische Statistik, Band 2, Asymptotische Statistik: Parametrische Modelle und nichtparametrische Funktionale, Teubner Verlag 1995, ISBN 3-322-90153-X
  • Dieter Rasch und Dieter Schott: Mathematische Statistik, Für Mathematiker, Natur- und Ingenieurwissenschaftler. 1. Auflage November 2015, 648 Seiten, Hardcover, 150 Abbildungen, Lehrbuch ISBN 978-3-527-33884-9, Wiley-VCH, Weinheim
  • Günter Bamberg/Franz Baur/Michael Krapp: Statistik, 17. Auflage, Oldenbourg Wissenschaftsverlag, München 2012

Weblinks


Dieser Artikel basiert (teilweise) auf dem Artikel Mathematische Statistik aus der freien Enzyklopädie Wikipedia und steht unter der Lizenz Creative Commons Attribution/Share Alike. In Wikipedia ist eine Liste der Autoren verfügbar.