Zufallsvariable
Teil einer Serie über Statistik ⓘ |
Wahrscheinlichkeitsrechnung |
---|
|
|
|
|
|
Eine Zufallsvariable (auch Zufallsgröße, aleatorische Variable oder stochastische Variable genannt) ist eine mathematische Formalisierung einer Größe oder eines Objekts, das von zufälligen Ereignissen abhängt. Sie ist eine Abbildung oder eine Funktion von möglichen Ereignissen in einem Stichprobenraum auf einen messbaren Raum, häufig die reellen Zahlen. ⓘ
Inoffiziell steht die Zufallsvariable typischerweise für ein grundlegendes Zufallselement, z. B. beim Würfeln; sie kann auch für Unsicherheit stehen, z. B. für Messfehler. Die Interpretation der Wahrscheinlichkeit ist jedoch philosophisch kompliziert und selbst in bestimmten Fällen nicht immer eindeutig. Die rein mathematische Analyse von Zufallsvariablen ist unabhängig von solchen Interpretationsschwierigkeiten und kann auf einem strengen axiomatischen Aufbau beruhen. ⓘ
In der formalen mathematischen Sprache der Maßtheorie wird eine Zufallsvariable als eine messbare Funktion von einem Wahrscheinlichkeitsmaßraum (dem sogenannten Stichprobenraum) zu einem messbaren Raum definiert. Dies ermöglicht die Betrachtung des Pushforward-Maßes, das als Verteilung der Zufallsvariablen bezeichnet wird; die Verteilung ist also ein Wahrscheinlichkeitsmaß auf der Menge aller möglichen Werte der Zufallsvariablen. Es ist möglich, dass zwei Zufallsvariablen identische Verteilungen haben, sich aber in wesentlichen Punkten unterscheiden; sie können zum Beispiel unabhängig sein. ⓘ
Es ist üblich, die Sonderfälle der diskreten Zufallsvariablen und der absolut kontinuierlichen Zufallsvariablen zu betrachten, je nachdem, ob eine Zufallsvariable in einer diskreten Menge (z. B. einer endlichen Menge) oder in einem Intervall von reellen Zahlen bewertet wird. Es gibt noch weitere wichtige Möglichkeiten, insbesondere in der Theorie der stochastischen Prozesse, bei denen es natürlich ist, Zufallsfolgen oder Zufallsfunktionen zu betrachten. Manchmal wird eine Zufallsvariable als automatisch in den reellen Zahlen bewertet angesehen, wobei allgemeinere Zufallsgrößen stattdessen als Zufallselemente bezeichnet werden. ⓘ
George Mackey zufolge war Pafnuty Tschebyschow der erste, der systematisch in Begriffen von Zufallsvariablen dachte". ⓘ
Über verschiedene Zuordnungsvorschriften können einem Zufallsexperiment auch verschiedene Zufallsvariablen zugeordnet werden. Den einzelnen Wert, den eine Zufallsvariable bei der Durchführung eines Zufallsexperiments annimmt, nennt man Realisierung oder im Falle eines stochastischen Prozesses einen Pfad. ⓘ
Während früher der von A. N. Kolmogorow eingeführte Begriff zufällige Größe der übliche deutsche Begriff war, hat sich heute (ausgehend vom englischen random variable) der etwas irreführende Begriff Zufallsvariable durchgesetzt. ⓘ
Definition
Eine Zufallsvariable ist eine messbare Funktion von einer Menge möglicher Ergebnisse zu einem messbaren Raum . Die technische axiomatische Definition erfordert ein Stichprobenraum eines Wahrscheinlichkeitstripels sein muss (siehe die maßtheoretische Definition). Eine Zufallsvariable wird häufig mit römischen Großbuchstaben bezeichnet, z. B. , , , . ⓘ
Die Wahrscheinlichkeit, dass einen Wert in einer messbaren Menge annimmt wird geschrieben als ⓘ
Standardfall
In vielen Fällen, reell-wertig, d.h. . In manchen Kontexten wird der Begriff Zufallselement (siehe Erweiterungen) verwendet, um eine Zufallsvariable zu bezeichnen, die nicht diese Form hat. ⓘ
Wenn das Bild (oder der Bereich) von abzählbar ist, wird die Zufallsvariable als diskrete Zufallsvariable bezeichnet und ihre Verteilung ist eine diskrete Wahrscheinlichkeitsverteilung, d. h. sie kann durch eine Wahrscheinlichkeitsmassenfunktion beschrieben werden, die jedem Wert im Bild von . Wenn das Bild unendlich groß ist (normalerweise ein Intervall), dann als kontinuierliche Zufallsvariable bezeichnet. In dem speziellen Fall, dass sie absolut kontinuierlich ist, kann ihre Verteilung durch eine Wahrscheinlichkeitsdichtefunktion beschrieben werden, die den Intervallen Wahrscheinlichkeiten zuweist; insbesondere muss bei einer absolut kontinuierlichen Zufallsvariablen jeder einzelne Punkt notwendigerweise die Wahrscheinlichkeit Null haben. Nicht alle kontinuierlichen Zufallsvariablen sind absolut kontinuierlich, eine Mischverteilung ist ein solches Gegenbeispiel; solche Zufallsvariablen können nicht durch eine Wahrscheinlichkeitsdichte oder eine Wahrscheinlichkeitsmassenfunktion beschrieben werden. ⓘ
Jede Zufallsvariable kann durch ihre kumulative Verteilungsfunktion beschrieben werden, die die Wahrscheinlichkeit beschreibt, dass die Zufallsvariable kleiner oder gleich einem bestimmten Wert sein wird. ⓘ
Erweiterungen
Der Begriff "Zufallsvariable" ist in der Statistik traditionell auf den reellwertigen Fall beschränkt (). In diesem Fall ist es aufgrund der Struktur der reellen Zahlen möglich, Größen wie den Erwartungswert und die Varianz einer Zufallsvariablen, ihre kumulative Verteilungsfunktion und die Momente ihrer Verteilung zu definieren. ⓘ
Die obige Definition gilt jedoch für jeden messbaren Raum von Werten. Man kann also auch Zufallselemente anderer Mengen betrachten wie boolesche Zufallswerte, kategoriale Werte, komplexe Zahlen, Vektoren, Matrizen, Sequenzen, Bäume, Mengen, Formen, Mannigfaltigkeiten und Funktionen. Man kann sich dann speziell auf eine Zufallsvariable des Typs oder eine -bewertete Zufallsvariable. ⓘ
Dieses allgemeinere Konzept eines Zufallselements ist besonders nützlich in Disziplinen wie der Graphentheorie, dem maschinellen Lernen, der Verarbeitung natürlicher Sprache und anderen Bereichen der diskreten Mathematik und der Informatik, wo man oft an der Modellierung der zufälligen Variation nichtnumerischer Datenstrukturen interessiert ist. In einigen Fällen ist es jedoch sinnvoll, jedes Element von durch eine oder mehrere reelle Zahlen darzustellen. In diesem Fall kann ein Zufallselement optional als Vektor von reellen Zufallsvariablen dargestellt werden (die alle auf demselben zugrunde liegenden Wahrscheinlichkeitsraum definiert sind definiert sind, so dass die verschiedenen Zufallsvariablen kovariieren können). Ein Beispiel:
- Ein zufälliges Wort kann als zufällige ganze Zahl dargestellt werden, die als Index für das Vokabular der möglichen Wörter dient. Alternativ kann es als ein zufälliger Indikatorvektor dargestellt werden, dessen Länge der Größe des Vokabulars entspricht, wobei die einzigen Werte mit positiver Wahrscheinlichkeit sind , , und die Position der 1 das Wort angibt.
- Ein zufälliger Satz mit gegebener Länge kann als ein Vektor von zufälligen Wörtern dargestellt werden.
- Ein Zufallsgraph mit gegebenen Scheitelpunkten kann dargestellt werden als eine Matrix von Zufallsvariablen dargestellt werden, deren Werte die Adjazenzmatrix des Zufallsgraphen angeben.
- Eine Zufallsfunktion kann als eine Sammlung von Zufallsvariablen dargestellt werden dargestellt werden, die die Werte der Funktion an den verschiedenen Punkten im Bereich der Funktion. Die sind gewöhnliche reellwertige Zufallsvariablen, vorausgesetzt, die Funktion ist reellwertig. Ein stochastischer Prozess ist beispielsweise eine Zufallsfunktion der Zeit, ein Zufallsvektor ist eine Zufallsfunktion einer Indexmenge wie und ein Zufallsfeld ist eine Zufallsfunktion auf einer beliebigen Menge (typischerweise Zeit, Raum oder eine diskrete Menge). ⓘ
Bemerkungen
In der Regel wird auf die konkrete Angabe der zugehörigen Räume verzichtet; es wird angenommen, dass aus dem Kontext klar ist, welcher Wahrscheinlichkeitsraum auf und welcher Messraum auf gemeint ist. ⓘ
Bei einer endlichen Ergebnismenge wird meistens als die Potenzmenge von gewählt. Die Forderung, dass die verwendete Funktion messbar ist, ist dann immer erfüllt. Messbarkeit wird erst wirklich bedeutsam, wenn die Ergebnismenge überabzählbar viele Elemente enthält. ⓘ
Einige Klassen von Zufallsvariablen mit bestimmten Wahrscheinlichkeits- und Messräumen werden besonders häufig verwendet. Diese werden teilweise mit Hilfe alternativer Definitionen eingeführt, die keine Kenntnisse der Maßtheorie voraussetzen: ⓘ
Mehrdimensionale Zufallsvariable
Eine mehrdimensionale Zufallsvariable ist eine messbare Abbildung für eine Dimension . Sie wird auch als Zufallsvektor bezeichnet. Damit ist gleichzeitig ein Vektor von einzelnen reellen Zufallsvariablen , die alle auf dem gleichen Wahrscheinlichkeitsraum definiert sind. Die Verteilung von wird als multivariat bezeichnet, die Verteilungen der Komponenten nennt man auch Randverteilungen. Die mehrdimensionalen Entsprechungen von Erwartungswert und Varianz sind der Erwartungswertvektor und die Kovarianzmatrix. ⓘ
Im Beispiel des zweimaligen Würfelns ist eine zweidimensionale Zufallsvariable. ⓘ
Zufallsvektoren sollten nicht mit Wahrscheinlichkeitsvektoren (auch stochastische Vektoren genannt) verwechselt werden. Diese sind Elemente des , deren Komponenten positiv sind und deren Summe 1 ergibt. Sie beschreiben die Wahrscheinlichkeitsmaße auf Mengen mit Elementen. ⓘ
Komplexe Zufallsvariable
Bei komplexen Zufallsvariablen ist der Bildraum die Menge der komplexen Zahlen versehen mit der durch die kanonische Vektorraumisomorphie zwischen und „geerbten“ borelschen σ-Algebra. ist genau dann eine Zufallsvariable, wenn Realteil und Imaginärteil jeweils reelle Zufallsvariablen sind. ⓘ
Verteilungsfunktionen
Wenn eine Zufallsvariable definiert auf dem Wahrscheinlichkeitsraum definiert ist, können wir Fragen stellen wie "Wie wahrscheinlich ist es, dass der Wert von gleich 2 ist?". Dies ist dasselbe wie die Wahrscheinlichkeit des Ereignisses die oft geschrieben wird als oder abgekürzt wird. ⓘ
Die Aufzeichnung all dieser Wahrscheinlichkeiten von Ausgabebereichen einer reellwertigen Zufallsvariablen ergibt die Wahrscheinlichkeitsverteilung von . Die Wahrscheinlichkeitsverteilung "vergisst" den speziellen Wahrscheinlichkeitsraum, der zur Definition von verwendet wurde, und erfasst nur die Wahrscheinlichkeiten verschiedener Werte von . Eine solche Wahrscheinlichkeitsverteilung kann immer durch ihre kumulative Verteilungsfunktion erfasst werden ⓘ
und manchmal auch durch eine Wahrscheinlichkeitsdichtefunktion, . In maßtheoretischer Hinsicht verwenden wir die Zufallsvariable zum "Vorwärtsschieben" des Maßes auf auf ein Maß auf . Der zugrunde liegende Wahrscheinlichkeitsraum ist ein technisches Hilfsmittel, das verwendet wird, um die Existenz von Zufallsvariablen zu garantieren, manchmal auch, um sie zu konstruieren, und um Begriffe wie Korrelation und Abhängigkeit oder Unabhängigkeit zu definieren, die auf einer gemeinsamen Verteilung von zwei oder mehr Zufallsvariablen auf demselben Wahrscheinlichkeitsraum beruhen. In der Praxis verzichtet man oft auf den Raum ganz weg und setzt einfach ein Maß auf das der gesamten reellen Linie das Maß 1 zuweist, d. h. man arbeitet mit Wahrscheinlichkeitsverteilungen statt mit Zufallsvariablen. Siehe den Artikel über Quantilsfunktionen für eine ausführlichere Entwicklung. ⓘ
Beispiele
Diskrete Zufallsvariable
In einem Experiment kann eine Person zufällig ausgewählt werden, und eine Zufallsvariable kann die Körpergröße der Person sein. Mathematisch gesehen wird die Zufallsvariable als eine Funktion interpretiert, die die Person auf die Größe der Person abbildet. Der Zufallsvariablen ist eine Wahrscheinlichkeitsverteilung zugeordnet, die die Berechnung der Wahrscheinlichkeit ermöglicht, dass die Körpergröße in einer beliebigen Teilmenge möglicher Werte liegt, z. B. die Wahrscheinlichkeit, dass die Körpergröße zwischen 180 und 190 cm liegt, oder die Wahrscheinlichkeit, dass die Körpergröße entweder kleiner als 150 oder größer als 200 cm ist. ⓘ
Eine weitere Zufallsvariable kann die Anzahl der Kinder einer Person sein; dies ist eine diskrete Zufallsvariable mit nicht-negativen ganzzahligen Werten. Sie ermöglicht die Berechnung von Wahrscheinlichkeiten für einzelne ganzzahlige Werte - die Wahrscheinlichkeitsmassenfunktion (PMF) - oder für Gruppen von Werten, einschließlich unendlicher Gruppen. Das Ereignis von Interesse kann zum Beispiel "eine gerade Anzahl von Kindern" sein. Sowohl für endliche als auch für unendliche Ereignismengen können die Wahrscheinlichkeiten durch Addition der PMFs der Elemente ermittelt werden, d. h. die Wahrscheinlichkeit einer geraden Anzahl von Kindern ist die unendliche Summe . ⓘ
In Beispielen wie diesen wird der Stichprobenraum oft unterdrückt, da er mathematisch schwer zu beschreiben ist, und die möglichen Werte der Zufallsvariablen werden dann als Stichprobenraum behandelt. Wenn aber zwei Zufallsvariablen auf demselben Stichprobenraum von Ergebnissen gemessen werden, wie z. B. die Größe und die Anzahl der Kinder, die auf denselben Zufallspersonen berechnet werden, ist es einfacher, ihre Beziehung zu verfolgen, wenn anerkannt wird, dass sowohl die Größe als auch die Anzahl der Kinder von derselben Zufallsperson stammen, so dass z. B. die Frage gestellt werden kann, ob solche Zufallsvariablen korreliert sind oder nicht. ⓘ
Wenn abzählbare Mengen von reellen Zahlen sind, und , dann eine diskrete Verteilungsfunktion ist. Hier für , für . Nimmt man zum Beispiel eine Aufzählung aller rationalen Zahlen als erhält man eine diskrete Funktion, die nicht unbedingt eine Stufenfunktion (stückweise konstant) ist. ⓘ
Münzwurf
Die möglichen Ergebnisse eines Münzwurfs können durch den Stichprobenraum beschrieben werden . Wir können eine reell-wertige Zufallsvariable einführen einführen, die eine Auszahlung von 1 $ für eine erfolgreiche Wette auf Kopf wie folgt modelliert:
Wenn die Münze eine faire Münze ist, hat Y eine Wahrscheinlichkeitsmassenfunktion gegeben durch:
Würfelwurf
Eine Zufallsvariable kann auch verwendet werden, um den Prozess des Würfelns und die möglichen Ergebnisse zu beschreiben. Die naheliegendste Darstellung für den Fall des Würfelns mit zwei Würfeln besteht darin, die Menge der Zahlenpaare n1 und n2 aus {1, 2, 3, 4, 5, 6} (die die Zahlen auf den beiden Würfeln darstellen) als den Stichprobenraum zu betrachten. Die gewürfelte Gesamtzahl (die Summe der Zahlen in jedem Paar) ist dann eine Zufallsvariable X, die durch die Funktion gegeben ist, die das Paar auf die Summe abbildet:
Kontinuierliche Zufallsvariable
Formal gesehen ist eine kontinuierliche Zufallsvariable eine Zufallsvariable, deren kumulative Verteilungsfunktion überall kontinuierlich ist. Es gibt keine "Lücken", die Zahlen entsprechen würden, die eine endliche Eintrittswahrscheinlichkeit haben. Stattdessen nehmen kontinuierliche Zufallsvariablen fast nie einen genau vorgeschriebenen Wert c an (formell, ), sondern es besteht eine positive Wahrscheinlichkeit, dass ihr Wert in bestimmten Intervallen liegt, die beliebig klein sein können. Kontinuierliche Zufallsvariablen lassen in der Regel Wahrscheinlichkeitsdichtefunktionen (PDF) zu, die ihre CDF und Wahrscheinlichkeitsmaße charakterisieren; Solche Verteilungen werden auch als absolut kontinuierlich bezeichnet; einige kontinuierliche Verteilungen sind jedoch singulär oder eine Mischung aus einem absolut kontinuierlichen Teil und einem singulären Teil. ⓘ
Ein Beispiel für eine kontinuierliche Zufallsvariable wäre eine Zufallsvariable, die auf einem Spinner basiert, der eine horizontale Richtung wählen kann. Die von der Zufallsvariablen eingenommenen Werte sind dann Richtungen. Wir könnten diese Richtungen durch Norden, Westen, Osten, Süden, Südosten usw. darstellen. In der Regel ist es jedoch bequemer, den Stichprobenraum auf eine Zufallsvariable abzubilden, die Werte annimmt, die reelle Zahlen sind. Dies kann z. B. durch die Abbildung einer Richtung auf eine Peilung in Grad im Uhrzeigersinn von Norden aus geschehen. Die Zufallsvariable nimmt dann Werte an, die reelle Zahlen aus dem Intervall [0, 360) sind, wobei alle Teile des Bereichs "gleich wahrscheinlich" sind. In diesem Fall ist X = der gedrehte Winkel. Jede reelle Zahl hat eine Wahrscheinlichkeit von Null, ausgewählt zu werden, aber jedem Wertebereich kann eine positive Wahrscheinlichkeit zugewiesen werden. Die Wahrscheinlichkeit, eine Zahl im Bereich [0, 180] zu wählen, beträgt beispielsweise 1⁄2. Anstatt von einer Wahrscheinlichkeitsmassenfunktion zu sprechen, sagen wir, dass die Wahrscheinlichkeitsdichte von X 1/360 ist. Die Wahrscheinlichkeit einer Teilmenge von [0, 360] lässt sich berechnen, indem man das Maß der Menge mit 1/360 multipliziert. Im Allgemeinen kann die Wahrscheinlichkeit einer Menge für eine gegebene kontinuierliche Zufallsvariable berechnet werden, indem die Dichte über die gegebene Menge integriert wird. ⓘ
Formaler ausgedrückt: Bei einem beliebigen Intervall eine Zufallsvariable als "kontinuierliche gleichförmige Zufallsvariable" (CURV) bezeichnet, wenn die Wahrscheinlichkeit, dass sie einen Wert in einem Teilintervall annimmt, nur von der Länge des Teilintervalls abhängt. Dies bedeutet, dass die Wahrscheinlichkeit, dass in ein beliebiges Teilintervall fällt proportional zur Länge des Teilintervalls ist, d. h. wenn a ≤ c ≤ d ≤ b, gilt ⓘ
wobei sich die letzte Gleichheit aus dem Einheitlichkeitsaxiom der Wahrscheinlichkeit ergibt. Die Wahrscheinlichkeitsdichtefunktion eines CURV ist gegeben durch die Indikatorfunktion ihres Stützintervalls, normiert durch die Länge des Intervalls:
Gemischter Typ
Eine gemischte Zufallsvariable ist eine Zufallsvariable, deren kumulative Verteilungsfunktion weder diskret noch überall stetig ist. Sie kann als eine Mischung aus einer diskreten Zufallsvariablen und einer kontinuierlichen Zufallsvariablen realisiert werden; in diesem Fall ist die CDF das gewichtete Mittel der CDFs der Komponentenvariablen. ⓘ
Ein Beispiel für eine Zufallsvariable gemischten Typs wäre ein Experiment, bei dem eine Münze geworfen wird und der Spinner nur dann gedreht wird, wenn das Ergebnis des Münzwurfs Kopf ist. Ist das Ergebnis "Zahl", ist X = -1; andernfalls ist X = der Wert der Drehscheibe wie im vorangegangenen Beispiel. Es besteht eine Wahrscheinlichkeit von 1⁄2, dass diese Zufallsvariable den Wert -1 hat. Andere Wertebereiche hätten die Hälfte der Wahrscheinlichkeiten des letzten Beispiels. ⓘ
Ganz allgemein ist jede Wahrscheinlichkeitsverteilung auf der reellen Linie eine Mischung aus einem diskreten Teil, einem singulären Teil und einem absolut stetigen Teil; siehe Lebesgue's decomposition theorem § Refinement. Der diskrete Teil ist auf eine abzählbare Menge konzentriert, aber diese Menge kann dicht sein (wie die Menge aller rationalen Zahlen). ⓘ
Maßtheoretische Definition
Die formalste, axiomatische Definition einer Zufallsvariablen beinhaltet die Maßtheorie. Kontinuierliche Zufallsvariablen werden in Form von Zahlenmengen und Funktionen definiert, die diese Mengen auf Wahrscheinlichkeiten abbilden. Aufgrund verschiedener Schwierigkeiten (z. B. das Banach-Tarski-Paradoxon), die auftreten, wenn solche Mengen nicht ausreichend eingeschränkt sind, ist es notwendig, eine so genannte Sigma-Algebra einzuführen, um die möglichen Mengen, über die Wahrscheinlichkeiten definiert werden können, einzuschränken. Normalerweise wird eine bestimmte Sigma-Algebra verwendet, die Borel-σ-Algebra, die es ermöglicht, Wahrscheinlichkeiten über beliebige Mengen zu definieren, die entweder direkt aus kontinuierlichen Zahlenintervallen oder aus einer endlichen oder abzählbar unendlichen Anzahl von Vereinigungen und/oder Schnittmengen solcher Intervalle abgeleitet werden können. ⓘ
Die maßtheoretische Definition lautet wie folgt. ⓘ
Sei sei ein Wahrscheinlichkeitsraum und ein messbarer Raum. Dann ist eine -bewertete Zufallsvariable eine messbare Funktion , was bedeutet, dass für jede Teilmenge ihr Vorbild ist -messbar ist; , wobei . Diese Definition ermöglicht es uns, jede Teilmenge im Zielraum zu messen, indem man ihr Vorabbild betrachtet, das unter der Annahme messbar ist. ⓘ
Intuitiver ausgedrückt, ist ein Mitglied von ist ein mögliches Ergebnis, ein Mitglied von ist eine messbare Teilmenge der möglichen Ergebnisse, die Funktion gibt die Wahrscheinlichkeit für jede dieser messbaren Teilmengen an, stellt die Menge der Werte dar, die die Zufallsvariable annehmen kann (z. B. die Menge der reellen Zahlen), und ein Mitglied von ist eine "wohlbehütete" (messbare) Teilmenge von (für die die Wahrscheinlichkeit bestimmt werden kann). Die Zufallsvariable ist dann eine Funktion von einem beliebigen Ergebnis zu einer Menge, so dass die Ergebnisse, die zu einer beliebigen sinnvollen Teilmenge von Mengen für die Zufallsvariable führen, eine wohldefinierte Wahrscheinlichkeit haben. ⓘ
Wenn ein topologischer Raum ist, dann ist die häufigste Wahl für die σ-Algebra die Borel-σ-Algebra das ist die σ-Algebra, die durch die Sammlung aller offenen Mengen in . In diesem Fall wird die -bewertete Zufallsvariable als eine -bewertete Zufallsvariable. Außerdem, wenn der Raum die reelle Linie ist ist, dann wird eine solche reell-wertige Zufallsvariable einfach Zufallsvariable genannt. ⓘ
Realwertige Zufallsvariablen
In diesem Fall ist der Beobachtungsraum die Menge der reellen Zahlen. Wir erinnern uns, ist der Wahrscheinlichkeitsraum. Für einen reellen Beobachtungsraum ist die Funktion eine reell-wertige Zufallsvariable, wenn
Diese Definition ist ein Spezialfall der obigen, da die Menge die Borel-σ-Algebra auf der Menge der reellen Zahlen erzeugt, und es reicht aus, die Messbarkeit auf jeder erzeugenden Menge zu prüfen. Hier können wir die Messbarkeit auf dieser erzeugenden Menge beweisen, indem wir die Tatsache nutzen, dass . ⓘ
Momente
Die Wahrscheinlichkeitsverteilung einer Zufallsvariablen wird häufig durch eine kleine Anzahl von Parametern charakterisiert, die auch eine praktische Bedeutung haben. Zum Beispiel reicht es oft aus zu wissen, was ihr "Durchschnittswert" ist. Dies wird durch das mathematische Konzept des Erwartungswertes einer Zufallsvariablen erfasst, der mit bezeichnet und auch als erstes Moment bezeichnet. Im Allgemeinen, ist nicht gleich . Sobald der "Durchschnittswert" bekannt ist, kann man sich fragen, wie weit die Werte der Zufallsvariablen von diesem Durchschnittswert abweichen. von diesem Durchschnittswert entfernt sind, eine Frage, die durch die Varianz und Standardabweichung einer Zufallsvariablen beantwortet wird. Diese Frage wird durch die Varianz und die Standardabweichung einer Zufallsvariablen beantwortet. Man kann die Zufallsvariable intuitiv als einen Mittelwert betrachten, der aus einer unendlichen Grundgesamtheit gewonnen wird, deren Mitglieder bestimmte Bewertungen von . ⓘ
Mathematisch gesehen ist dies als das (verallgemeinerte) Problem der Momente bekannt: Für eine gegebene Klasse von Zufallsvariablen findet man eine Sammlung von Funktionen, so dass die Erwartungswerte die Verteilung der Zufallsvariablen vollständig charakterisieren . ⓘ
Momente können nur für reellwertige Funktionen von Zufallsvariablen (oder komplexwertig usw.) definiert werden. Wenn die Zufallsvariable selbst reellwertig ist, dann können Momente der Variablen selbst genommen werden, die äquivalent sind zu Momenten der Identitätsfunktion der Zufallsvariablen entsprechen. Aber auch bei nicht reellwertigen Zufallsvariablen können Momente von reellwertigen Funktionen dieser Variablen genommen werden. Zum Beispiel kann für eine kategoriale Zufallsvariable X, die die nominalen Werte "rot", "blau" oder "grün" annehmen kann, die reell-wertige Funktion konstruiert werden; diese verwendet die Iverson-Klammer und hat den Wert 1, wenn den Wert "grün" hat, andernfalls 0. Dann können der Erwartungswert und andere Momente dieser Funktion bestimmt werden. ⓘ
Funktionen von Zufallsvariablen
Eine neue Zufallsvariable Y kann definiert werden, indem man eine reelle messbare Borel-Funktion auf die Ergebnisse einer reellwertigen Zufallsvariablen . Das heißt, . Die kumulative Verteilungsfunktion von ist dann ⓘ
Wenn die Funktion invertierbar ist (d.h., existiert, wobei ist die Umkehrfunktion der Funktion ist) und entweder steigend oder fallend ist, dann kann die vorherige Beziehung erweitert werden und man erhält ⓘ
Mit den gleichen Hypothesen der Invertierbarkeit von und unter der Annahme der Differenzierbarkeit kann die Beziehung zwischen den Wahrscheinlichkeitsdichtefunktionen durch Differenzieren beider Seiten des obigen Ausdrucks nach , um zu erhalten ⓘ
Wenn es keine Invertierbarkeit von aber jede höchstens eine abzählbare Anzahl von Wurzeln zulässt (d. h. eine endliche oder abzählbar unendliche Anzahl von derart, dass ), dann kann die vorherige Beziehung zwischen den Wahrscheinlichkeitsdichtefunktionen verallgemeinert werden mit ⓘ
wobei gemäß dem Satz von der inversen Funktion. Die Formeln für Dichten verlangen nicht, dass steigend sein muss. ⓘ
Im maßtheoretischen, axiomatischen Ansatz der Wahrscheinlichkeitsrechnung, wenn eine Zufallsvariable auf und eine messbare Borel-Funktion , dann ist auch eine Zufallsvariable auf eine Zufallsvariable, da die Komposition von messbaren Funktionen auch messbar ist. (Dies ist jedoch nicht unbedingt der Fall, wenn Lebesgue-messbar ist.) Das gleiche Verfahren, mit dem man von einem Wahrscheinlichkeitsraum zu zu gelangen, kann verwendet werden, um die Verteilung von . ⓘ
Beispiel 1
Sei Sei eine reellwertige, stetige Zufallsvariable und sei . ⓘ
Wenn , dann , so ⓘ
Wenn , dann ⓘ
also ⓘ
Beispiel 2
Angenommen, sei eine Zufallsvariable mit einer kumulativen Verteilung ⓘ
wobei ist ein fester Parameter. Betrachten Sie die Zufallsvariable dann, ⓘ
Der letzte Ausdruck kann in Form der kumulativen Verteilung von also ⓘ
die die kumulative Verteilungsfunktion (CDF) einer Exponentialverteilung ist. ⓘ
Beispiel 3
Angenommen, ist eine Zufallsvariable mit einer Standardnormalverteilung, deren Dichte ist ⓘ
Betrachten wir die Zufallsvariable Die Dichte lässt sich mit Hilfe der obigen Formel für eine Variablenänderung ermitteln:
In diesem Fall ist die Änderung nicht monoton, da jeder Wert von hat zwei entsprechende Werte von hat (einen positiven und einen negativen). Aufgrund der Symmetrie werden jedoch beide Hälften identisch transformiert, d.h., ⓘ
Die inverse Transformation ist
und ihre Ableitung ist
dann, ⓘ
Dies ist eine Chi-Quadrat-Verteilung mit einem Freiheitsgrad. ⓘ
Beispiel 4
Angenommen, ist eine Zufallsvariable mit einer Normalverteilung, deren Dichte ⓘ
Betrachten wir die Zufallsvariable Die Dichte lässt sich mit Hilfe der obigen Formel für eine Variablenänderung ermitteln:
In diesem Fall ist die Änderung nicht monoton, da jeder Wert von hat zwei entsprechende Werte von (einmal positiv und einmal negativ). Anders als im vorherigen Beispiel gibt es in diesem Fall jedoch keine Symmetrie und wir müssen die beiden unterschiedlichen Terme berechnen:
Die inverse Transformation ist
und ihre Ableitung ist
dann, ⓘ
Es handelt sich um eine nicht zentrale Chi-Quadrat-Verteilung mit einem Freiheitsgrad. ⓘ
Einige Eigenschaften
- Die Wahrscheinlichkeitsverteilung der Summe zweier unabhängiger Zufallsvariablen ist die Faltung jeder ihrer Verteilungen.
- Wahrscheinlichkeitsverteilungen sind kein Vektorraum - sie sind nicht geschlossen unter linearen Kombinationen, da diese die Nichtnegativität oder das Gesamtintegral nicht bewahren -, aber sie sind geschlossen unter konvexer Kombination und bilden somit eine konvexe Teilmenge des Raums der Funktionen (oder Maße). ⓘ
Äquivalenz von Zufallsvariablen
Es gibt mehrere Möglichkeiten, Zufallsvariablen als äquivalent zu betrachten. Zwei Zufallsvariablen können gleich, fast sicher gleich oder in der Verteilung gleich sein. ⓘ
Die genaue Definition dieser Äquivalenzbegriffe wird im Folgenden in aufsteigender Reihenfolge ihrer Stärke angegeben. ⓘ
Gleichheit in der Verteilung
Wenn der Stichprobenraum eine Teilmenge der reellen Linie ist, sind die Zufallsvariablen X und Y gleichverteilt (bezeichnet als ), wenn sie die gleichen Verteilungsfunktionen haben:
Um gleichverteilt zu sein, müssen die Zufallsvariablen nicht auf demselben Wahrscheinlichkeitsraum definiert sein. Zwei Zufallsvariablen mit gleichen Momentenerzeugungsfunktionen haben die gleiche Verteilung. Dies ist beispielsweise eine nützliche Methode, um die Gleichheit bestimmter Funktionen unabhängiger, identisch verteilter (IID) Zufallsvariablen zu überprüfen. Die momenterzeugende Funktion existiert jedoch nur für Verteilungen, die eine definierte Laplace-Transformation haben. ⓘ
Fast sichere Gleichheit
Zwei Zufallsvariablen X und Y sind mit ziemlicher Sicherheit gleich (bezeichnet als ), wenn, und nur wenn, die Wahrscheinlichkeit, dass sie verschieden sind, Null ist:
Für alle praktischen Zwecke der Wahrscheinlichkeitstheorie ist dieser Begriff der Äquivalenz so stark wie die tatsächliche Gleichheit. Er ist mit dem folgenden Abstand verbunden:
wobei "ess sup" das wesentliche Supremum im Sinne der Maßtheorie darstellt. ⓘ
Gleichheit
Schließlich sind die beiden Zufallsvariablen X und Y gleich, wenn sie als Funktionen auf ihrem messbaren Raum gleich sind:
Dieser Begriff ist typischerweise der am wenigsten nützliche in der Wahrscheinlichkeitstheorie, da in der Praxis und in der Theorie der dem Experiment zugrunde liegende Messraum selten explizit charakterisiert oder gar charakterisierbar ist. ⓘ
Konvergenz
Ein wichtiges Thema in der mathematischen Statistik ist die Erlangung von Konvergenzergebnissen für bestimmte Folgen von Zufallsvariablen, z. B. das Gesetz der großen Zahlen und der zentrale Grenzwertsatz. ⓘ
Es gibt verschiedene Möglichkeiten, wie eine Folge von Zufallsvariablen zu einer Zufallsvariablen konvergieren kann . Diese werden in dem Artikel über die Konvergenz von Zufallsvariablen erläutert. ⓘ
Mathematische Attribute für Zufallsvariablen
Verschiedene mathematische Attribute, die in der Regel denen für allgemeine Funktionen entlehnt sind, finden bei Zufallsvariablen Anwendung. Die häufigsten werden in der folgenden Zusammenstellung kurz erklärt: ⓘ
Unabhängig
Zwei reelle Zufallsvariablen heißen unabhängig, wenn für je zwei Intervalle und die Ereignisse und stochastisch unabhängig sind. Das sind sie, wenn gilt: . ⓘ
In obigem Beispiel sind und unabhängig voneinander; die Zufallsvariablen und hingegen nicht. ⓘ
Unabhängigkeit mehrerer Zufallsvariablen bedeutet, dass das Wahrscheinlichkeitsmaß des Zufallsvektors dem Produktmaß der Wahrscheinlichkeitsmaße der Komponenten, also dem Produktmaß von entspricht. So lässt sich beispielsweise dreimaliges unabhängiges Würfeln durch den Wahrscheinlichkeitsraum mit
- ,
- der Potenzmenge von und
modellieren; die Zufallsvariable "Ergebnis des -ten Wurfes" ist dann
- für .
Die Konstruktion eines entsprechenden Wahrscheinlichkeitsraums für eine beliebige Familie unabhängiger Zufallsvariable mit gegebenen Verteilungen ist ebenfalls möglich. ⓘ
Identisch verteilt
Zwei oder mehr Zufallsvariablen heißen identisch verteilt (bzw. i.d. für identically distributed), wenn ihre induzierten Wahrscheinlichkeitsverteilungen gleich sind. In Beispiel des zweimaligen Würfelns sind , identisch verteilt; die Zufallsvariablen und hingegen nicht. ⓘ
Unabhängig und identisch verteilt
Häufig werden Folgen von Zufallsvariablen untersucht, die sowohl unabhängig als auch identisch verteilt sind; demnach spricht man von unabhängig identisch verteilten Zufallsvariablen, üblicherweise mit u.i.v. bzw. i.i.d. (für independent and identically distributed) abgekürzt. ⓘ
In obigem Beispiel des dreimaligen Würfelns sind , und i.i.d. Die Summe der ersten beiden Würfe und die Summe des zweiten und dritten Wurfs sind zwar identisch verteilt, aber nicht unabhängig. Dagegen sind und unabhängig, aber nicht identisch verteilt. ⓘ
Austauschbar
Austauschbare Familien von Zufallsvariablen sind Familien, deren Verteilung sich nicht ändert, wenn man endlich viele Zufallsvariablen in der Familie vertauscht. Austauschbare Familien sind stets identisch verteilt, aber nicht notwendigerweise unabhängig. ⓘ
Mathematische Attribute für reelle Zufallsvariablen
Integrierbar und quasi-integrierbar
Eine Zufallsvariable heißt integrierbar, wenn der Erwartungswert der Zufallsvariable existiert und endlich ist. Die Zufallsvariable heißt quasi-integrierbar, wenn der Erwartungswert existiert, möglicherweise aber unendlich ist. Jede integrierbare Zufallsvariable ist folglich auch quasi-integrierbar. ⓘ