Weibull-Verteilung

Aus besserwiki.de
Weibull-Verteilung
Dichtefunktion
Weibull PDF.svg Dichtefunktion für verschiedene Formparameter
Verteilungsfunktion
Weibull CDF.svg Verteilungsfunktion für verschiedene Formparameter k
Parameter — Formparameter
— inverser Skalenparameter
Träger
Dichtefunktion
Verteilungsfunktion
Erwartungswert
Varianz

Die Weibull-Verteilung ist eine zweiparametrige Familie von stetigen Wahrscheinlichkeitsverteilungen über der Menge der positiven reellen Zahlen. Abhängig von ihren beiden Parametern ähnelt sie einer Normalverteilung oder asymmetrischen Verteilungen wie der Exponentialverteilung. Sie wird unter anderem zur statistischen Modellierung von Windgeschwindigkeiten oder zur Beschreibung der Lebensdauer und Ausfallhäufigkeit von elektronischen Bauelementen oder (spröden) Werkstoffen herangezogen. Anders als eine Exponentialverteilung berücksichtigt sie die Vorgeschichte eines Objekts, sie ist gedächtnisbehaftet und berücksichtigt die Alterung eines Bauelements nicht nur mit der Zeit, sondern in Abhängigkeit von seinem Einsatz. Sie lässt sich an steigende, konstante und fallende Ausfallraten technischer Systeme anpassen. Benannt ist die Verteilung nach dem schwedischen Ingenieur und Mathematiker Waloddi Weibull. Eine besondere Bedeutung hat sie in der Ereigniszeitanalyse.

In der Wahrscheinlichkeitstheorie und Statistik ist die Weibull-Verteilung /ˈwbʊl/ eine kontinuierliche Wahrscheinlichkeitsverteilung. Sie ist nach dem schwedischen Mathematiker Waloddi Weibull benannt, der sie 1951 ausführlich beschrieb, obwohl sie zuerst von Maurice René Fréchet identifiziert und erstmals von Rosin & Rammler (1933) zur Beschreibung einer Partikelgrößenverteilung angewendet wurde.

Definition

Standard-Parametrisierung

Die Wahrscheinlichkeitsdichtefunktion einer Weibull-Zufallsvariablen ist:

wobei k > 0 der Formparameter und λ > 0 der Skalenparameter der Verteilung ist. Ihre komplementäre kumulative Verteilungsfunktion ist eine gestreckte Exponentialfunktion. Die Weibull-Verteilung ist mit einer Reihe von anderen Wahrscheinlichkeitsverteilungen verwandt; insbesondere interpoliert sie zwischen der Exponentialverteilung (k = 1) und der Rayleigh-Verteilung (k = 2 und ).

Wenn die Größe X eine "Zeit bis zum Ausfall" ist, ergibt die Weibull-Verteilung eine Verteilung, bei der die Ausfallrate proportional zu einer Potenz der Zeit ist. Der Formparameter k ist diese Potenz plus eins, so dass dieser Parameter direkt wie folgt interpretiert werden kann:

  • Ein Wert von zeigt an, dass die Ausfallrate mit der Zeit abnimmt (wie beim Lindy-Effekt, der jedoch eher einer Pareto-Verteilung als einer Weibull-Verteilung entspricht). Dies ist der Fall, wenn es eine signifikante "Kindersterblichkeit" gibt, oder wenn fehlerhafte Produkte früh ausfallen und die Ausfallrate im Laufe der Zeit abnimmt, da die fehlerhaften Produkte aus der Population ausgesondert werden. Im Zusammenhang mit der Diffusion von Innovationen bedeutet dies negative Mundpropaganda: Die Hazard-Funktion ist eine monoton abnehmende Funktion des Anteils der Adoptoren;
  • Ein Wert von bedeutet, dass die Misserfolgsrate im Laufe der Zeit konstant ist. Dies könnte darauf hindeuten, dass zufällige externe Ereignisse die Sterblichkeit oder das Scheitern verursachen. Die Weibull-Verteilung reduziert sich auf eine Exponentialverteilung;
  • Ein Wert von zeigt an, dass die Ausfallrate mit der Zeit zunimmt. Dies ist der Fall, wenn es einen "Alterungsprozess" gibt oder Teile, die im Laufe der Zeit mit größerer Wahrscheinlichkeit ausfallen. Im Zusammenhang mit der Diffusion von Innovationen bedeutet dies positive Mundpropaganda: Die Hazard-Funktion ist eine monoton steigende Funktion des Anteils der Adoptoren. Die Funktion ist zunächst konvex, dann konkav mit einem Knickpunkt bei .

In der Materialwissenschaft wird der Formparameter k einer Festigkeitsverteilung als Weibull-Modul bezeichnet. Im Kontext der Diffusion von Innovationen ist die Weibull-Verteilung ein "reines" Imitations-/Ablehnungsmodell.

Alternative Parametrisierungen

Anwendungen in der medizinischen Statistik und Ökonometrie verwenden oft eine andere Parametrisierung. Der Formparameter k ist derselbe wie oben, während der Skalenparameter ist . In diesem Fall ist für x ≥ 0 die Wahrscheinlichkeitsdichtefunktion

die kumulative Verteilungsfunktion ist

die Hazard-Funktion ist

und der Mittelwert ist

Eine dritte Parametrisierung kann ebenfalls gefunden werden. Der Formparameter k ist derselbe wie im Standardfall, während der Skalenparameter λ durch einen Ratenparameter β = 1/λ ersetzt wird. Für x ≥ 0 ist dann die Wahrscheinlichkeitsdichtefunktion

die kumulative Verteilungsfunktion ist

und die Hazardfunktion ist

In allen drei Parametrisierungen ist der Hazard abnehmend für k < 1, ansteigend für k > 1 und konstant für k = 1, in welchem Fall die Weibull-Verteilung auf eine Exponentialverteilung reduziert wird.

Skalenparameter

Der Skalenparameter ist .

In manchen Anwendungen, insbesondere bei Zeitabhängigkeiten wird durch seinen Kehrwert, die charakteristische Lebensdauer , ersetzt. ist bei Lebensdauer-Analysen jene Zeitspanne, nach der ca. 63,2 % der Einheiten ausgefallen sind. Dieser Wert ist eine Kenngröße der Weibull-Verteilung.

.

Wird kein Skalenparameter angegeben, so ist implizit gemeint.

Eigenschaften

Dichtefunktion

Die Form der Dichtefunktion der Weibull-Verteilung ändert sich drastisch mit dem Wert von k. Für 0 < k < 1 tendiert die Dichtefunktion zu ∞, wenn sich x von oben her der Null nähert, und ist streng abnehmend. Für k = 1 tendiert die Dichtefunktion zu 1/λ, wenn sich x von oben her Null nähert, und ist streng abnehmend. Für k > 1 tendiert die Dichtefunktion gegen Null, wenn x sich von oben her dem Nullpunkt nähert, steigt bis zu ihrer Mode an und fällt danach ab. Die Dichtefunktion hat eine unendliche negative Steigung bei x = 0, wenn 0 < k < 1, eine unendliche positive Steigung bei x = 0, wenn 1 < k < 2 und eine Nullsteigung bei x = 0, wenn k > 2. Für k = 1 hat die Dichte eine endliche negative Steigung bei x = 0. Für k = 2 hat die Dichte eine endliche positive Steigung bei x = 0. Wenn k gegen unendlich geht, konvergiert die Weibull-Verteilung zu einer Dirac-Delta-Verteilung mit Zentrum bei x = λ. Außerdem hängen die Schiefe und der Variationskoeffizient nur von dem Formparameter ab. Eine Verallgemeinerung der Weibull-Verteilung ist die hyperbolastische Verteilung vom Typ III.

Kumulative Verteilungsfunktion

Die kumulative Verteilungsfunktion für die Weibull-Verteilung ist

für x ≥ 0, und F(x; k; λ) = 0 für x < 0.

Wenn x = λ, dann ist F(x; k; λ) = 1 - e-1 ≈ 0,632 für alle Werte von k. Umgekehrt: bei F(x; k; λ) = 0,632 ist der Wert von xλ.

Die Quantilsfunktion (inverse kumulative Verteilung) für die Weibull-Verteilung ist

für 0 ≤ p < 1.

Die Ausfallrate h (oder Gefahrenfunktion) ist gegeben durch

Die mittlere Zeit zwischen Ausfällen MTBF ist

Momente

Die Momentenerzeugungsfunktion des Logarithmus einer Weibull-verteilten Zufallsvariablen ist gegeben durch

wobei Γ die Gamma-Funktion ist. In ähnlicher Weise ist die charakteristische Funktion von log X gegeben durch

Insbesondere ist das n-te rohe Moment von X gegeben durch

Der Mittelwert und die Varianz einer Weibull-Zufallsvariablen können wie folgt ausgedrückt werden

und

Die Schiefe ist gegeben durch

wobei gegeben, was auch geschrieben werden kann als

wobei der Mittelwert mit μ und die Standardabweichung mit σ bezeichnet wird.

Die übermäßige Kurtosis ist gegeben durch

wobei . Der Kurtosis-Exzess kann auch wie folgt geschrieben werden:

Momenterzeugende Funktion

Für die momentgenerierende Funktion von X selbst gibt es eine Vielzahl von Ausdrücken. Als Potenzreihe, da die Rohmomente bereits bekannt sind, erhält man

Alternativ kann man versuchen, direkt mit dem Integral zu arbeiten

Wenn man annimmt, dass der Parameter k eine rationale Zahl ist, ausgedrückt als k = p/q, wobei p und q ganze Zahlen sind, dann kann dieses Integral analytisch ausgewertet werden. Wenn man t durch -t ersetzt, erhält man

wobei G die Meijer-G-Funktion ist.

Die charakteristische Funktion wurde auch von Muraleedharan et al. (2007) ermittelt. Die charakteristische Funktion und die momenterzeugende Funktion der 3-Parameter Weibull-Verteilung wurden auch von Muraleedharan & Soares (2014) durch einen direkten Ansatz abgeleitet.

Reparametrisierungstricks

Fixieren Sie einige . Sei seien nichtnegativ und nicht alle null, und seien seien unabhängige Stichproben von sein, dann

  • .

Shannon-Entropie

Die Informationsentropie ist gegeben durch

wobei ist die Euler-Mascheroni-Konstante. Die Weibull-Verteilung ist die maximale Entropieverteilung für eine nicht-negative reelle Zufallsvariable mit einem festen Erwartungswert von xk gleich λk und einem festen Erwartungswert von ln(xk) gleich ln(λk) - .

Schätzung der Parameter

Maximale Likelihood

Der Maximum-Likelihood-Schätzer für den gegebenen Parameter ist

Der Maximum-Likelihood-Schätzer für ist die Lösung für k der folgenden Gleichung

Diese Gleichung definiert nur implizit definiert, muss man im Allgemeinen lösen für mit numerischen Mitteln lösen.

Wenn sind die größten beobachteten Stichproben aus einem Datensatz von mehr als Stichproben, dann ist der Maximum-Likelihood-Schätzer für die gegebenen Parameter ist

Auch unter dieser Bedingung ist der Maximum-Likelihood-Schätzer für ist

Da es sich auch hier um eine implizite Funktion handelt, muss man im Allgemeinen lösen für mit numerischen Mitteln lösen.

Weibull-Diagramm

Die Anpassung einer Weibull-Verteilung an die Daten kann visuell mit Hilfe einer Weibull-Darstellung bewertet werden. Die Weibull-Darstellung ist eine Darstellung der empirischen kumulativen Verteilungsfunktion von Daten auf speziellen Achsen in einer Art Q-Q-Diagramm. Die Achsen sind gegen . Der Grund für diese Änderung der Variablen ist, dass die kumulative Verteilungsfunktion linearisiert werden kann:

Man kann sehen, dass sie die Standardform einer Geraden hat. Wenn also die Daten aus einer Weibull-Verteilung stammen, wird eine gerade Linie in einem Weibull-Diagramm erwartet.

Es gibt verschiedene Ansätze, um die empirische Verteilungsfunktion aus den Daten zu erhalten: Eine Methode besteht darin, die vertikale Koordinate für jeden Punkt zu erhalten, indem wobei der Rang des Datenpunktes ist und die Anzahl der Datenpunkte ist.

Die lineare Regression kann auch verwendet werden, um die Anpassungsgüte numerisch zu bewerten und die Parameter der Weibull-Verteilung zu schätzen. Der Gradient gibt direkt Auskunft über den Formparameter und der Skalenparameter kann ebenfalls abgeleitet werden.

Kullback-Leibler-Divergenz

Die Varianz der Verteilung ist

.

Anwendungen

Die Weibull-Verteilung wird verwendet

Angepasste kumulative Weibull-Verteilung für maximale eintägige Regenfälle mit CumFreq, siehe auch Verteilungsanpassung
Angepasste Kurven für Zeitreihendaten der Ölproduktion
  • In der Überlebensanalyse
  • In der Zuverlässigkeitstechnik und Fehleranalyse
  • In der Elektrotechnik zur Darstellung der in einem elektrischen System auftretenden Überspannung
  • In der Industrietechnik zur Darstellung von Fertigungs- und Lieferzeiten
  • In der Extremwerttheorie
  • In der Wettervorhersage und in der Windkraftindustrie zur Beschreibung von Windgeschwindigkeitsverteilungen, da die natürliche Verteilung oft der Weibull-Form entspricht
  • In der Kommunikationssystemtechnik
    • In Radarsystemen zur Modellierung der Streuung der empfangenen Signale, die durch einige Arten von Cluttern erzeugt werden
    • Zur Modellierung von Fading-Kanälen in der drahtlosen Kommunikation, da das Weibull-Fading-Modell eine gute Anpassung an experimentelle Fading-Kanalmessungen zu zeigen scheint
  • Im Information Retrieval zur Modellierung der Verweildauer auf Webseiten.
  • Im allgemeinen Versicherungswesen zur Modellierung des Umfangs von Rückversicherungsansprüchen und der kumulativen Entwicklung von Asbestose-Schäden
  • Bei der Vorhersage des technologischen Wandels (auch bekannt als Sharif-Islam-Modell)
  • In der Hydrologie wird die Weibull-Verteilung auf Extremereignisse wie jährliche maximale eintägige Regenfälle und Flussabflüsse angewendet.
  • Bei der Analyse von Fallkurven zur Modellierung der Ölförderkurve von Schieferölbohrungen.
  • Bei der Beschreibung der Größe von Partikeln, die bei Mahl-, Fräs- und Zerkleinerungsvorgängen entstehen, wird die 2-Parameter-Weibull-Verteilung verwendet, die in diesen Anwendungen manchmal auch als Rosin-Rammler-Verteilung bezeichnet wird. In diesem Zusammenhang sagt sie weniger feine Partikel voraus als die Log-Normal-Verteilung und ist im Allgemeinen für enge Partikelgrößenverteilungen am genauesten. Die Interpretation der kumulativen Verteilungsfunktion ist, dass der Massenanteil der Partikel mit einem Durchmesser kleiner als ist, wobei die mittlere Partikelgröße ist und ein Maß für die Streuung der Partikelgrößen ist.
  • Bei der Beschreibung von zufälligen Punktwolken (z. B. die Positionen von Teilchen in einem idealen Gas): Die Wahrscheinlichkeit, das nächstgelegene Teilchen in einem Abstand von einem gegebenen Teilchen zu finden, ist durch eine Weibull-Verteilung gegeben mit und gleich der Dichte der Teilchen.
  • Bei der Berechnung der Rate strahleninduzierter Einzelereignisse an Bord von Raumfahrzeugen wird eine Vier-Parameter-Weibull-Verteilung verwendet, um experimentell gemessene Gerätequerschnittswahrscheinlichkeitsdaten an ein lineares Teilchenenergieübertragungsspektrum anzupassen. Ursprünglich wurde die Weibull-Anpassung aufgrund der Annahme verwendet, dass die Energieniveaus der Teilchen einer statistischen Verteilung entsprechen. Diese Annahme hat sich jedoch später als falsch erwiesen, und die Weibull-Anpassung wird weiterhin aufgrund ihrer vielen einstellbaren Parameter und nicht aufgrund einer nachgewiesenen physikalischen Grundlage verwendet.

Weibullnetz

Weibullnetz

Trägt man die Verteilung in der Form

in einem doppelt logarithmischen Diagramm auf, welches auch als Weibullnetz bezeichnet wird, ergibt sich eine Gerade, bei der man den Parameter leicht als Steigung ablesen kann. Die charakteristische Lebensdauer kann dann folgendermaßen bestimmt werden:

.

Hierbei bezeichnet den y-Achsenabschnitt.

Oft kommt es vor, dass trotz Beanspruchung erst nach einer anfänglichen Betriebszeit Ausfälle eintreten (beispielsweise infolge des Verschleiß von Bremsbelägen). Dies kann in der Weibull-Verteilungsfunktion berücksichtigt werden. Sie hat dann folgendes Aussehen:

Trägt man die Funktion wieder auf, ergibt sich keine Gerade, sondern eine nach oben konvexe Kurve. Verschiebt man alle Punkte um den Wert , so geht die Kurve in eine Gerade über.

Windgeschwindigkeit

Windgeschwindigkeitshäufigkeiten.

Die Grafik zeigt beispielhaft eine Messreihe von Windgeschwindigkeiten (grün). Ein Gauß-Fit (blau) nähert sich den Zahlen nur ungenügend. Weder gibt es negative Windgeschwindigkeiten noch ist die Verteilung symmetrisch. Eine Weibull-Verteilung führt einen zweiten freien Parameter ein. Durch sie wird die Verteilung für große und kleine Windgeschwindigkeiten sehr gut approximiert, ebenso die Werte um das Maximum. Aus den Fitparametern und folgt ein Erwartungswert von 4,5 m/s, in guter Übereinstimmung mit dem Wert von 4,6 m/s bestimmt aus den Messwerten.

Verwandte Verteilungen

  • Eine Weibull-Verteilung ist eine verallgemeinerte Gamma-Verteilung, bei der beide Formparameter gleich k sind.
  • Die übersetzte Weibull-Verteilung (oder 3-Parameter Weibull) enthält einen zusätzlichen Parameter. Sie hat die Wahrscheinlichkeitsdichtefunktion

    für und für ist, wobei ist der Formparameter, ist der Skalenparameter und ist der Lageparameter der Verteilung. Wert legt eine anfängliche ausfallfreie Zeit fest, bevor der reguläre Weibull-Prozess beginnt. Wenn ist, reduziert sich dies auf die 2-Parameter-Verteilung.
  • Die Weibull-Verteilung kann charakterisiert werden als die Verteilung einer Zufallsvariablen so dass die Zufallsvariable

    die Standard-Exponentialverteilung mit der Intensität 1 ist.
  • Dies impliziert, dass die Weibull-Verteilung auch in Form einer Gleichverteilung charakterisiert werden kann: wenn gleichmäßig verteilt ist auf ist, dann ist die Zufallsvariable eine Weibull-Verteilung mit den Parametern und . Beachten Sie, dass hier äquivalent ist zu gerade oben. Dies führt zu einem einfach zu implementierenden numerischen Schema für die Simulation einer Weibull-Verteilung.
  • Die Weibull-Verteilung interpoliert zwischen der Exponentialverteilung mit der Intensität wenn und einer Rayleigh-Verteilung mit Modus wenn .
  • Die Weibull-Verteilung (in der Regel ausreichend in der Zuverlässigkeitstechnik) ist ein Spezialfall der dreiparametrigen exponentiellen Weibull-Verteilung, bei der der zusätzliche Exponent gleich 1 ist. Die exponentiierte Weibull-Verteilung passt zu unimodalen, wannenförmigen und monotonen Ausfallraten.
  • Die Weibull-Verteilung ist ein Spezialfall der verallgemeinerten Extremwertverteilung. In diesem Zusammenhang wurde die Verteilung erstmals von Maurice Fréchet im Jahr 1927 identifiziert. Die eng verwandte Fréchet-Verteilung, benannt nach dieser Arbeit, hat die Wahrscheinlichkeitsdichtefunktion

  • Die Verteilung einer Zufallsvariablen, die als Minimum mehrerer Zufallsvariablen definiert ist, die jeweils eine andere Weibull-Verteilung aufweisen, ist eine Poly-Weibull-Verteilung.
  • Die Weibull-Verteilung wurde erstmals von Rosin & Rammler (1933) zur Beschreibung von Partikelgrößenverteilungen verwendet. Sie wird in der Mineralienaufbereitung häufig zur Beschreibung von Partikelgrößenverteilungen in Zerkleinerungsprozessen verwendet. In diesem Zusammenhang ist die kumulative Verteilung gegeben durch

    wobei
    • ist die Partikelgröße
    • ist das 80. Perzentil der Partikelgrößenverteilung
    • ist ein Parameter, der die Streuung der Verteilung beschreibt
  • Aufgrund ihrer Verfügbarkeit in Tabellenkalkulationen wird sie auch verwendet, wenn das zugrunde liegende Verhalten besser durch eine Erlang-Verteilung modelliert werden kann.
  • Wenn dann (Exponentialverteilung)
  • Für die gleichen Werte von k nimmt die Gamma-Verteilung ähnliche Formen an, aber die Weibull-Verteilung ist platykurtischer.
  • Unter dem Gesichtspunkt der stabilen Zählverteilung, kann als Lévy's Stabilitätsparameter betrachtet werden. Eine Weibull-Verteilung kann in ein Integral der Kernel-Dichte zerlegt werden, wobei der Kernel entweder eine Laplace-Verteilung ist oder eine Rayleigh-Verteilung :

    wobei die Stabile Zählverteilung ist und die Stabile Vol-Verteilung ist.

Beziehung zu anderen Verteilungen

Gestreckte Exponentialfunktion

Die Funktion

wird als gestreckte Exponentialfunktion bezeichnet.