Exponentialverteilung

Aus besserwiki.de
Dichte der Exponentialverteilung mit verschiedenen Werten für λ

Die Exponentialverteilung (auch negative Exponentialverteilung) ist eine stetige Wahrscheinlichkeitsverteilung über der Menge der nicht-negativen reellen Zahlen, die durch eine Exponentialfunktion gegeben ist. Sie wird als Modell vorrangig bei der Beantwortung der Frage nach der Länge von zufälligen Zeitintervallen benutzt, wie z. B.

  • Zeit zwischen zwei Anrufen
  • Lebensdauer von Atomen beim radioaktiven Zerfall
  • Lebensdauer von Bauteilen, Maschinen und Geräten, wenn Alterungserscheinungen nicht betrachtet werden müssen.
  • als grobes Modell für kleine und mittlere Schäden in Hausrat, Kraftfahrzeug-Haftpflicht, Kasko in der Versicherungsmathematik

steht für die Zahl der erwarteten Ereignisse pro Einheitsintervall. Wie aus dem Diagramm ersichtlich, sind kürzere Intervalle zwischen Ereignissen (Intervalllänge ) wahrscheinlicher. Seltener treten aber auch sehr lange Intervalle auf. Die Wahrscheinlichkeitsdichte kann durchaus Werte >1 annehmen (z. B. für ), da die Fläche unter der Kurve auf 1 normiert ist (Normierungseigenschaft). Konkrete Wahrscheinlichkeitsangaben über das Eintreten des nächsten Ereignisses gewinnt man hier am ehesten aus der Verteilungsfunktion.

Oft ist die tatsächliche Verteilung keine Exponentialverteilung, jedoch ist die Exponentialverteilung einfach zu handhaben und wird zur Vereinfachung unterstellt. Sie ist anwendbar, wenn ein Poisson-Prozess vorliegt, also die poissonschen Annahmen erfüllt sind.

Die Exponentialverteilung ist ein Teil der viel größeren und allgemeineren Exponentialfamilie, einer Klasse von Wahrscheinlichkeitsmaßen, die sich durch eine leichte Handhabbarkeit auszeichnen.

Exponential
Wahrscheinlichkeitsdichtefunktion
Darstellung der Wahrscheinlichkeitsdichtefunktion der Exponentialverteilung
Kumulative Verteilungsfunktion
Kumulative Verteilungsfunktion
Parameter Rate, oder inverse Skala
Unterstützung
PDF
CDF
Quantil
Mittelwert
Median
Modus
Varianz
Schiefe
Bsp. Kurtosis
Entropie
MGF
CF
Fisher-Information
Kullback-Leibler-Divergenz

In der Wahrscheinlichkeitstheorie und Statistik ist die Exponentialverteilung die Wahrscheinlichkeitsverteilung der Zeit zwischen Ereignissen in einem Poisson-Punktprozess, d. h. einem Prozess, in dem Ereignisse kontinuierlich und unabhängig voneinander mit einer konstanten durchschnittlichen Rate auftreten. Sie ist ein Sonderfall der Gamma-Verteilung. Sie ist das kontinuierliche Analogon der geometrischen Verteilung und hat die Schlüsseleigenschaft, gedächtnislos zu sein. Sie wird nicht nur für die Analyse von Poisson-Punktprozessen verwendet, sondern findet sich auch in verschiedenen anderen Zusammenhängen.

Definitionen

Wahrscheinlichkeitsdichtefunktion

Die Wahrscheinlichkeitsdichtefunktion (pdf) einer Exponentialverteilung ist

Dabei ist λ > 0 der Parameter der Verteilung, der oft als Ratenparameter bezeichnet wird. Die Verteilung ist auf dem Intervall [0, ∞) verteilt. Wenn eine Zufallsvariable X diese Verteilung hat, schreiben wir X ~ Exp(λ).

Die Exponentialverteilung weist eine unendliche Teilbarkeit auf.

Kumulative Verteilungsfunktion

Die kumulative Verteilungsfunktion ist gegeben durch

Alternative Parametrisierung

Die Exponentialverteilung wird manchmal in Form des Skalenparameters β = 1/λ parametrisiert, der auch der Mittelwert ist:

Eigenschaften

Mittelwert, Varianz, Momente und Median

Der Mittelwert ist das Zentrum der Wahrscheinlichkeitsmasse, d. h. das erste Moment.
Der Median ist das Vorbild F-1(1/2).

Der Mittelwert oder Erwartungswert einer exponentialverteilten Zufallsvariablen X mit dem Ratenparameter λ ist gegeben durch

In Anbetracht der nachstehenden Beispiele ist dies sinnvoll: Wenn Sie durchschnittlich 2 Anrufe pro Stunde erhalten, können Sie davon ausgehen, dass Sie eine halbe Stunde auf jeden Anruf warten müssen.

Die Varianz von X ist gegeben durch

Die Standardabweichung ist also gleich dem Mittelwert.

Die Momente von X, für sind gegeben durch

Die zentralen Momente von X, für sind gegeben durch

wobei !n das Unterfaktorielle von n ist

Der Median von X ist gegeben durch

wobei sich ln auf den natürlichen Logarithmus bezieht. Die absolute Differenz zwischen dem Mittelwert und dem Median ist also

in Übereinstimmung mit der Median-Mittelwert-Ungleichung.

Speicherlosigkeit

Eine exponentialverteilte Zufallsvariable T gehorcht der Beziehung

Dies wird deutlich, wenn man die komplementäre kumulative Verteilungsfunktion betrachtet:

Wenn T als die Wartezeit auf das Eintreten eines Ereignisses in Bezug auf einen Anfangszeitpunkt interpretiert wird, impliziert diese Beziehung, dass die Verteilung der verbleibenden Wartezeit dieselbe ist wie die ursprüngliche unbedingte Verteilung, wenn T durch die Nichtbeobachtung des Ereignisses während eines Anfangszeitraums s bedingt ist. Wenn zum Beispiel ein Ereignis nach 30 Sekunden noch nicht eingetreten ist, ist die bedingte Wahrscheinlichkeit, dass das Ereignis noch mindestens 10 Sekunden dauert, gleich der unbedingten Wahrscheinlichkeit, dass das Ereignis mehr als 10 Sekunden nach der Anfangszeit beobachtet wird.

Die Exponentialverteilung und die geometrische Verteilung sind die einzigen speicherlosen Wahrscheinlichkeitsverteilungen.

Die Exponentialverteilung ist somit zwangsläufig auch die einzige kontinuierliche Wahrscheinlichkeitsverteilung, die eine konstante Ausfallrate aufweist.

Daraus ergibt sich nach Division durch die Wahrscheinlichkeitsdichte der Exponentialverteilung mit als Ereignisrate und als mittlerem Ereignisabstand.

.

Quantile

Tukey anomaly criteria for exponential probability distribution function.
Tukey-Kriterien für Anomalien.

Die Quantilsfunktion (inverse kumulative Verteilungsfunktion) für Exp(λ) ist

Die Quartile sind also

  • erstes Quartil: ln(4/3)/λ
  • Median: ln(2)/λ
  • drittes Quartil: ln(4)/λ

Daraus folgt, dass der Interquartilsbereich ln(3)/λ ist.

Die Quantilfunktion der Exponentialverteilung lässt sich angeben und ist

.

Damit ist der Interquartilabstand .

Kullback-Leibler-Divergenz

Die gerichtete Kullback-Leibler-Divergenz in nats von ("approximierende" Verteilung) von ("wahre" Verteilung) ist gegeben durch

Maximale Entropieverteilung

Unter allen kontinuierlichen Wahrscheinlichkeitsverteilungen mit Unterstützung [0, ∞) und Mittelwert μ hat die Exponentialverteilung mit λ = 1/μ die größte differentielle Entropie. Mit anderen Worten, sie ist die Wahrscheinlichkeitsverteilung mit maximaler Entropie für eine Zufallsvariable X, die größer oder gleich Null ist und für die E[X] fest ist.

Verteilung des Minimums von exponentiellen Zufallsvariablen

Seien X1, ..., Xn unabhängige exponentialverteilte Zufallsvariablen mit Ratenparametern λ1, ..., λn. Dann ist

ebenfalls exponentialverteilt, mit dem Parameter

Dies wird deutlich, wenn man die komplementäre kumulative Verteilungsfunktion betrachtet:

Der Index der Variablen, die das Minimum erreicht, ist gemäß der kategorialen Verteilung

Ein Beweis kann erbracht werden, indem man . Dann,

Man beachte, dass

nicht exponentialverteilt ist, wenn X1, ..., Xn nicht alle den Parameter 0 haben.

Gemeinsame Momente von Statistiken i.i.d. exponentiellen Ordnung

Sei seien unabhängige und identisch verteilte exponentielle Zufallsvariablen mit dem Ratenparameter λ. Sei die entsprechenden Ordnungsstatistiken bezeichnen. Für das gemeinsame Moment der Ordnungsstatistiken und ist gegeben durch

Dies wird deutlich, wenn man das Gesetz der Gesamterwartung und die Eigenschaft der Gedächtnislosigkeit heranzieht:

Die erste Gleichung folgt aus dem Gesetz der Gesamterwartung. Die zweite Gleichung macht sich die Tatsache zunutze, dass, sobald wir die Bedingung folgt, dass . Die dritte Gleichung stützt sich auf die Eigenschaft der Gedächtnislosigkeit und ersetzt durch .

Summe von zwei unabhängigen exponentiellen Zufallsvariablen

Die Wahrscheinlichkeitsverteilungsfunktion (PDF) einer Summe von zwei unabhängigen Zufallsvariablen ist die Faltung ihrer individuellen PDFs. Wenn und unabhängige exponentielle Zufallsvariablen mit entsprechenden Ratenparametern sind und dann ist die Wahrscheinlichkeitsdichte von ist gegeben durch

Die Entropie dieser Verteilung ist in geschlossener Form verfügbar: unter der Annahme (ohne Verlust der Allgemeinheit), dann
wobei die Euler-Mascheroni-Konstante ist und die Digamma-Funktion ist.

Im Falle gleicher Ratenparameter ist das Ergebnis eine Erlang-Verteilung mit Form 2 und Parameter die ihrerseits ein Spezialfall der Gamma-Verteilung ist.

Das Geometrische Mittel der Exponentialverteilung ist

,

wobei die Euler-Mascheroni-Konstante bezeichnet.

Erwartungswert

Die Exponentialverteilung besitzt den Erwartungswert , denn

.

Der Erwartungswert entspricht der mittleren Betriebsdauer von Bauteilen, Maschinen und Geräten, wenn Alterungserscheinungen nicht betrachtet werden müssen. Er wird in diesem Zusammenhang als Mean Time Between Failures (MTBF) bezeichnet.

Varianz

Die Varianz ergibt sich analog mittels

.

Standardabweichung

Für die Standardabweichung ergibt sich

.

Variationskoeffizient

Aus Erwartungswert und Varianz erhält man unmittelbar den Variationskoeffizienten. Es gilt

.

Also gilt

.

Weitere Streumaße

Die mittlere absolute Abweichung

ist kleiner als die Standardabweichung, die mittlere absolute Abweichung bezüglich des Medians

ist noch etwas kleiner.

Schiefe

Die Schiefe besitzt unabhängig vom Parameter immer den Wert 2. Die Verteilung ist ein typischer Vertreter einer rechtsschiefen Verteilung, für die auch gilt.

Wölbung

Die Wölbung besitzt unabhängig vom Parameter immer den Wert 9.

Höhere Momente

Die k-ten Momente sind

.

Dies lässt sich zum Beispiel mit der k-ten Ableitung der momenterzeugenden Funktion zeigen.

Kumulanten

Die kumulantenerzeugende Funktion ist

für .

Damit ist die k-te Kumulante

Überlebenswahrscheinlichkeit

Da die Exponentialverteilung auch als Lebensdauerverteilung und im technischen Bereichen als Ausdruck für die Zuverlässigkeit eines Gerätes verwendet wird, ist es möglich, damit zusammenhängende Größen wie Überlebensfunktion und die Ausfallrate mit Hilfe der Verteilungsfunktion anzugeben. So nennt man das Komplement der Verteilungsfunktion die Überlebensfunktion:

Damit ergibt sich unmittelbar die auf einen Zeitpunkt bezogene bedingte Überlebenswahrscheinlichkeit

Die Exponentialverteilung ist eine gedächtnislose Lebensdauerverteilung, d. h. die Überlebenswahrscheinlichkeit in Bezug auf einen bestimmten Zeitpunkt ist unabhängig vom bisher erreichten Alter. Im Gegensatz zur Weibull-Verteilung kann die Exponentialverteilung nur für sogenannte ermüdungsfreie Systeme verwendet werden

Die Ausfallrate ergibt sich zu

Sie ist für die Exponentialverteilung zeitlich und räumlich konstant und wird in der Literatur üblicherweise mit der Konstanten λ bezeichnet.

Verwandte Verteilungen

  • Wenn dann ist |X - μ| ~ Exp(β).
  • Wenn X ~ Pareto(1, λ), dann log(X) ~ Exp(λ).
  • Wenn X ~ SkewLogistic(θ), dann .
  • Wenn Xi ~ U(0, 1), dann
  • Die Exponentialverteilung ist ein Grenzwert einer skalierten Beta-Verteilung:
  • Die Exponentialverteilung ist ein Spezialfall der Pearson-Verteilung vom Typ 3.
  • Wenn X ~ Exp(λ) und Xi ~ Exp(λi) dann:
    • , Schließung unter Skalierung mit einem positiven Faktor.
    • 1 + X ~ BenktanderWeibull(λ, 1), was auf eine abgeschnittene Exponentialverteilung reduziert.
    • keX ~ Pareto(k, λ).
    • e-X ~ Beta(λ, 1).
    • 1/keX ~ PowerLaw(k, λ)
    • , die Rayleigh-Verteilung
    • , die Weibull-Verteilung
    • μ - β log(λX) ∼ Gumbel(μ, β).
    • , eine geometrische Verteilung auf 0,1,2,3,...
    • , eine geometrische Verteilung auf 1,2,3,4,...
    • Wenn auch Y ~ Erlang(n, λ) oder dann
    • Wenn auch λ ~ Gamma(k, θ) (Form, Skalenparametrisierung), dann ist die Randverteilung von X Lomax(k, 1/θ), die Gamma-Mischung
    • λ1X1 - λ2Y2 ~ Laplace(0, 1).
    • min{X1, ..., Xn} ~ Exp(λ1 + ... + λn).
    • Wenn auch λi = λ dann:
      • Erlang(k, λ) = Gamma(k, λ-1) = Gamma(k, λ) (in (k, θ) bzw. (α, β)-Parametrisierung) mit einem ganzzahligen Formparameter k.
      • Xi - Xj ~ Laplace(0, λ-1).
    • Wenn auch Xi unabhängig sind, dann:
      • ~ U(0, 1)
      • hat die Wahrscheinlichkeitsdichtefunktion . Dies kann verwendet werden, um ein Konfidenzintervall zu erhalten für .
    • Wenn auch λ = 1:
      • , die logistische Verteilung
      • μ - σ log(X) ~ GEV(μ, σ, 0).
      • Wenn ferner dann (K-Distribution)
    • Wenn auch λ = 1/2, dann X ∼ χ2
      2; d.h. X hat eine Chi-Quadrat-Verteilung mit 2 Freiheitsgraden. Daraus folgt:
  • Wenn und ~ Poisson(X) dann (geometrische Verteilung)
  • Die Hoyt-Verteilung lässt sich aus der Exponentialverteilung und der Arkussinusverteilung ableiten
  • Die Exponentialverteilung ist ein Grenzwert der κ-Exponentialverteilung im Fall.
  • Die Exponentialverteilung ist ein Grenzwert der κ-Generalisierten Gamma-Verteilung in den und Fällen:

Andere verwandte Verteilungen:

  • Hyper-Exponentialverteilung - die Verteilung, deren Dichte eine gewichtete Summe von Exponentialdichten ist.
  • Hypoexponentialverteilung - die Verteilung einer allgemeinen Summe von exponentiellen Zufallsvariablen.
  • exGaußsche Verteilung - die Summe einer Exponentialverteilung und einer Normalverteilung.

Sind stochastisch unabhängig, so ist eine Linearkombination von Exponentialverteilungen, sind die alle gleich, so ist die Summe Erlang-verteilt.

Statistische Inferenz

Im Folgenden wird angenommen, dass die Zufallsvariable X exponentialverteilt ist mit dem Ratenparameter λ, und sind n unabhängige Stichproben von X, mit Stichprobenmittelwert .

Schätzung der Parameter

Der Maximum-Likelihood-Schätzer für λ wird wie folgt konstruiert: Die Likelihood-Funktion für λ, gegeben eine unabhängige und identisch verteilte Stichprobe x = (x1, ..., xn), die aus der Variablen gezogen wurde, ist:

wobei:

der Mittelwert der Stichprobe ist.

Die Ableitung des Logarithmus der Likelihood-Funktion ist:

Folglich ist der Maximum-Likelihood-Schätzwert für den Ratenparameter gleich:

Dies ist nicht ein unverzerrter Schätzer für obwohl ist ein unverzerrter MLE-Schätzer für und den Mittelwert der Verteilung.

Die Verzerrung von ist gleich

was zu dem verzerrungskorrigierten Maximum-Likelihood-Schätzer führt

Approximativer Minimierer des erwarteten quadratischen Fehlers

Angenommen, Sie haben mindestens drei Stichproben. Wenn wir eine Minimierung des erwarteten mittleren quadratischen Fehlers suchen (siehe auch: Bias-Varianz-Abgleich), die der Maximum-Likelihood-Schätzung ähnlich ist (d. h. eine multiplikative Korrektur der Likelihood-Schätzung), haben wir folgendes Ergebnis:

Diese wird aus dem Mittelwert und der Varianz der inversen Gamma-Verteilung abgeleitet: .

Fisher-Information

Die Fisher-Information, bezeichnet als für einen Schätzer des Ratenparameters ist gegeben als:

Durch Einsetzen der Verteilung und Lösen erhält man:

Dies bestimmt die Menge an Informationen, die jede unabhängige Stichprobe einer Exponentialverteilung über den unbekannten Ratenparameter enthält .

Konfidenzintervalle

Das 100(1 - α)%-Konfidenzintervall für den Ratenparameter einer Exponentialverteilung ist gegeben durch:

was auch gleich ist zu:
wobei χ2
p,v das 100(p)-Perzentil der Chi-Quadrat-Verteilung mit v Freiheitsgraden ist, n die Anzahl der Beobachtungen der Ankunftszeiten in der Stichprobe und x-bar der Stichprobendurchschnitt ist. Eine einfache Annäherung an die exakten Intervallendpunkte lässt sich durch eine Normalannäherung an die χ2
p,v-Verteilung. Diese Annäherung ergibt die folgenden Werte für ein 95%-Konfidenzintervall:

Diese Annäherung kann für Stichproben, die mindestens 15 bis 20 Elemente enthalten, akzeptabel sein.

Bayes'sche Inferenz

Der konjugierte Prior für die Exponentialverteilung ist die Gammaverteilung (von der die Exponentialverteilung ein Spezialfall ist). Die folgende Parametrisierung der Gamma-Wahrscheinlichkeitsdichtefunktion ist nützlich:

Die posteriore Verteilung p kann dann durch die oben definierte Likelihood-Funktion und einen Gamma-Prior ausgedrückt werden:

Die Posterior-Dichte p ist nun bis auf eine fehlende Normalisierungskonstante spezifiziert. Da sie die Form einer Gamma-PDF hat, kann diese leicht ausgefüllt werden, und man erhält:

Hier kann der Hyperparameter α als die Anzahl der vorherigen Beobachtungen interpretiert werden und β als die Summe der vorherigen Beobachtungen. Der posteriore Mittelwert ist hier:

Vorkommen und Anwendungen

Auftreten von Ereignissen

Die Exponentialverteilung kommt natürlicherweise vor, wenn es darum geht, die Länge der Eintreffzeiten in einem homogenen Poisson-Prozess zu beschreiben.

Die Exponentialverteilung kann als kontinuierliches Gegenstück zur geometrischen Verteilung betrachtet werden, die die Anzahl der Bernoulli-Versuche beschreibt, die notwendig sind, damit ein diskreter Prozess seinen Zustand ändert. Im Gegensatz dazu beschreibt die Exponentialverteilung die Zeit, die ein kontinuierlicher Prozess benötigt, um seinen Zustand zu ändern.

In realen Szenarien ist die Annahme einer konstanten Rate (oder Wahrscheinlichkeit pro Zeiteinheit) selten erfüllt. Zum Beispiel ist die Rate der eingehenden Telefonanrufe je nach Tageszeit unterschiedlich. Wenn wir uns jedoch auf ein Zeitintervall konzentrieren, in dem die Rate annähernd konstant ist, wie z. B. zwischen 14 und 16 Uhr an Werktagen, kann die Exponentialverteilung als gutes Näherungsmodell für die Zeit bis zum nächsten eingehenden Anruf verwendet werden. Ähnliche Vorbehalte gelten für die folgenden Beispiele, die annähernd exponentiell verteilte Variablen ergeben:

  • Die Zeit, bis ein radioaktives Teilchen zerfällt, oder die Zeit zwischen den Klicks eines Geigerzählers
  • Die Zeit bis zu Ihrem nächsten Telefonanruf
  • Die Zeit bis zum Zahlungsausfall (bei Zahlungen an die Gläubiger eines Unternehmens) bei der Modellierung von Kreditrisiken in reduzierter Form

Exponentialvariablen können auch verwendet werden, um Situationen zu modellieren, in denen bestimmte Ereignisse mit einer konstanten Wahrscheinlichkeit pro Längeneinheit auftreten, wie z. B. der Abstand zwischen Mutationen auf einem DNA-Strang oder zwischen Verkehrsunfällen auf einer bestimmten Straße.

In der Warteschlangentheorie werden die Servicezeiten der Agenten in einem System (z. B. wie lange ein Bankangestellter usw. braucht, um einen Kunden zu bedienen) häufig als exponentialverteilte Variablen modelliert. (Die Ankunft von Kunden wird z. B. auch durch die Poisson-Verteilung modelliert, wenn die Ankünfte unabhängig und identisch verteilt sind.) Die Länge eines Prozesses, den man sich als eine Folge mehrerer unabhängiger Aufgaben vorstellen kann, folgt der Erlang-Verteilung (das ist die Verteilung der Summe mehrerer unabhängiger exponentialverteilter Variablen). Auch die Zuverlässigkeitstheorie und die Zuverlässigkeitstechnik machen ausgiebig Gebrauch von der Exponentialverteilung. Aufgrund der gedächtnislosen Eigenschaft dieser Verteilung ist sie gut geeignet, um den konstanten Teil der Badewannenkurve zu modellieren, der in der Zuverlässigkeitstheorie verwendet wird. Sie ist auch sehr praktisch, weil es so einfach ist, Ausfallraten in ein Zuverlässigkeitsmodell einzufügen. Die Exponentialverteilung ist jedoch nicht geeignet, um die Gesamtlebensdauer von Organismen oder technischen Geräten zu modellieren, da die "Ausfallraten" hier nicht konstant sind: bei sehr jungen und sehr alten Systemen treten mehr Ausfälle auf.

Angepasste kumulative Exponentialverteilung für jährlich maximale 1-Tages-Regenfälle mit CumFreq

Betrachtet man in der Physik ein Gas bei fester Temperatur und festem Druck in einem gleichmäßigen Gravitationsfeld, so folgen die Höhen der einzelnen Moleküle ebenfalls einer annähernden Exponentialverteilung, der so genannten Barometrischen Formel. Dies ist eine Folge der weiter unten erwähnten Entropieeigenschaft.

In der Hydrologie wird die Exponentialverteilung verwendet, um Extremwerte von Variablen wie monatliche und jährliche Höchstwerte von Tagesniederschlägen und Flussabflussmengen zu analysieren.

Das blaue Bild zeigt ein Beispiel für die Anpassung der Exponentialverteilung an die jährlich maximalen eintägigen Niederschlagsmengen, wobei auch der 90%ige Vertrauensbereich auf der Grundlage der Binomialverteilung dargestellt ist. Die Niederschlagsdaten werden als Teil der kumulativen Häufigkeitsanalyse durch Plotting-Positionen dargestellt.

Im OP-Management die Verteilung der OP-Dauer für eine Kategorie von Eingriffen ohne typischen Arbeitsinhalt (wie in einer Notaufnahme, die alle Arten von Eingriffen umfasst).

Vorhersage

Nachdem eine Stichprobe von n Datenpunkten aus einer unbekannten Exponentialverteilung beobachtet wurde, besteht eine häufige Aufgabe darin, diese Stichproben zu verwenden, um Vorhersagen über zukünftige Daten aus derselben Quelle zu treffen. Eine gängige Vorhersageverteilung für künftige Stichproben ist die so genannte Plug-in-Verteilung, die durch Einsetzen eines geeigneten Schätzwertes für den Ratenparameter λ in die Exponentialdichtefunktion gebildet wird. Eine übliche Wahl der Schätzung ist diejenige, die durch das Prinzip der maximalen Wahrscheinlichkeit bereitgestellt wird, und die Verwendung dieser ergibt die Vorhersagedichte über eine zukünftige Stichprobe xn+1, bedingt durch die beobachteten Stichproben x = (x1, ..., xn), gegeben durch

Der Bayes'sche Ansatz liefert eine prädiktive Verteilung, die die Unsicherheit des geschätzten Parameters berücksichtigt, obwohl dies entscheidend von der Wahl des Priors abhängen kann.

Eine prädiktive Verteilung, die frei von den Problemen bei der Wahl der Prioren ist, die beim subjektiven Bayes'schen Ansatz auftreten, ist

die betrachtet werden kann als

  1. eine frequentistische Vertrauensverteilung, die sich aus der Verteilung der zentralen Größe ergibt ;
  2. eine prädiktive Profil-Likelihood, die durch Eliminierung des Parameters λ aus der gemeinsamen Likelihood von xn+1 und λ durch Maximierung erhalten wird;
  3. eine objektive Bayes'sche prädiktive Posterior-Verteilung, die unter Verwendung des nicht-informativen Jeffreys-Prior 1/λ ermittelt wird;
  4. die aus informationstheoretischen Überlegungen abgeleitete bedingte normalisierte maximale Wahrscheinlichkeitsverteilung (Conditional Normalized Maximum Likelihood, CNML).

Die Genauigkeit einer Vorhersageverteilung kann anhand des Abstands oder der Divergenz zwischen der wahren Exponentialverteilung mit dem Ratenparameter λ0 und der auf der Stichprobe x basierenden Vorhersageverteilung gemessen werden. Die Kullback-Leibler-Divergenz ist ein allgemein verwendetes, parametrisierungsfreies Maß für die Differenz zwischen zwei Verteilungen. Lässt man Δ(λ0||p) die Kullback-Leibler-Divergenz zwischen einer Exponentialverteilung mit dem Ratenparameter λ0 und einer prädiktiven Verteilung p bezeichnen, so kann gezeigt werden, dass

wobei der Erwartungswert in Bezug auf die Exponentialverteilung mit dem Ratenparameter λ0 ∈ (0, ∞) genommen wird und ψ( - ) die Digamma-Funktion ist. Es ist klar, dass die CNML-Vorhersageverteilung der Maximum-Likelihood-Plug-in-Verteilung in Bezug auf die durchschnittliche Kullback-Leibler-Divergenz für alle Stichprobengrößen n > 0 deutlich überlegen ist.

Berechnungsmethoden

Generierung von Exponentialvariablen

Eine konzeptionell sehr einfache Methode zur Erzeugung von Exponentialvariablen basiert auf der inversen Transformationsstichprobe: Bei einer Zufallsvariablen U, die aus der Gleichverteilung auf dem Einheitsintervall (0, 1) gezogen wird, hat die Variate

eine Exponentialverteilung, wobei F-1 die Quantilsfunktion ist, definiert durch

Wenn U auf (0, 1) gleichförmig ist, ist es auch 1 - U. Das bedeutet, dass man Exponentialvariablen wie folgt erzeugen kann:

Andere Methoden zur Erzeugung von Exponentialvariablen werden von Knuth und Devroye diskutiert.

Eine schnelle Methode zur Erzeugung einer Menge fertig geordneter Exponentialvariablen ohne Verwendung einer Sortierroutine ist ebenfalls verfügbar.

Beziehung zu anderen Verteilungen

Beziehung zur Gammaverteilung

  • Die Verallgemeinerung der Exponentialverteilung, d. h. die Wartezeit bis zum Eintreffen des -ten Ereignisses eines Poisson-Prozesses, wird mit der Gammaverteilung beschrieben. Die Exponentialverteilung mit Parameter ist also identisch mit der Gammaverteilung mit Parametern und . Die Exponentialverteilung besitzt demnach auch alle Eigenschaften der Gammaverteilung. Insbesondere ist die Summe von unabhängigen, -verteilten Zufallsvariablen gamma- oder Erlang-verteilt mit Parametern und .
  • Die Faltung von zwei Exponentialverteilungen mit demselben ergibt eine Gammaverteilung mit , .

Beziehung zur Pareto-Verteilung

Wenn Pareto-verteilt mit Parametern und ist, dann ist exponentialverteilt mit dem Parameter .

Beziehung zur Weibull-Verteilung

  • Mit geht die Weibull-Verteilung in die Exponentialverteilung über. Mit anderen Worten: Die Exponentialverteilung behandelt Probleme mit konstanter Ausfallrate . Untersucht man jedoch Fragestellungen mit steigender () oder fallender () Ausfallrate, dann geht man von der Exponentialverteilung zur Weibull-Verteilung über.
  • Wenn exponentialverteilt ist, dann ist Weibull-verteilt.

Anwendungsbeispiel

Die Exponentialverteilung ist eine typische Lebensdauerverteilung. So ist beispielsweise die Lebensdauer von elektronischen Bauelementen häufig annähernd exponentialverteilt. Hierbei spielt besonders die Gedächtnislosigkeit eine bedeutende Rolle: die Wahrscheinlichkeit, dass ein x Tage altes Bauelement noch mindestens t Tage hält, ist demnach genauso groß wie die, dass ein neues Bauelement überhaupt t Tage hält. Charakteristisch bei der Exponentialverteilung ist die konstante Ausfallrate .

Dies ist zum Beispiel bei Glühlampen nur annähernd richtig, da diese nur beim Einschalten stark beansprucht werden. Auf Lebewesen darf ebenfalls keine Exponentialverteilung angewendet werden, sonst wäre zum Beispiel die Wahrscheinlichkeit, dass ein Achtzigjähriger noch weitere fünfzig Jahre lebt, genauso hoch wie die, dass ein Neugeborener das fünfzigste Lebensjahr erreicht.

Beispiel: In einer Elektronikfirma werden Funkwecker produziert. Im Rahmen der Qualitätssicherung wird anhand von Reklamationen die Funktionsdauer der Wecker untersucht. Es stellt sich heraus, dass durchschnittlich pro Tag 5 ‰ der Wecker unabhängig von ihrem Alter ausfallen.

Die Zufallsgröße „Zeitdauer der Funktionsfähigkeit eines Funkweckers in Tagen“ ist also exponentialverteilt mit der Ausfallrate . Entsprechend beträgt die durchschnittliche Zeitdauer, bis ein Wecker ausfällt, Tage.

Die Wahrscheinlichkeit, dass ein Wecker höchstens (noch) 20 Tage hält, ist

d. h. nach 20 Tagen sind durchschnittlich ca. 10 % der Wecker ausgefallen.

Entsprechend ist der Anteil der Wecker, die mindestens 180 Tage aushalten,

also halten durchschnittlich ca. 40 % der Wecker länger als 180 Tage.

Obwohl bei einer exponentialverteilten Lebensdauerverteilung am Anfang absolut betrachtet mehr Geräte ausfallen, ist die Ausfallrate konstant: in jedem Zeitintervall fallen relativ betrachtet immer gleich viele Geräte aus. Dieser Umstand darf nicht mit den Frühausfällen der Badewannenkurve verwechselt werden. Hier ist zu Beginn die Ausfallrate höher und nicht konstant über die Lebensdauer. Zur Beschreibung der Badewannenkurve ist eine andere Lebensdauerverteilung (Weibull-Verteilung) notwendig.

Zufallszahlen

Zur Erzeugung exponentialverteilter Zufallszahlen bietet sich die Inversionsmethode an.

Die nach dem Simulationslemma zu bildende Inverse der Verteilungsfunktion lautet hierbei . Zu einer Folge von Standardzufallszahlen lässt sich daher eine Folge exponentialverteilter Zufallszahlen berechnen. Einfacher kann stattdessen auch gerechnet werden.