Kalman-Filter

Der Kalman-Filter verfolgt den geschätzten Zustand des Systems und die Varianz oder Unsicherheit der Schätzung. Die Schätzung wird anhand eines Zustandsübergangsmodells und von Messungen aktualisiert.

{\hat {x}}_{k\mid k-1}

bezeichnet die Schätzung des Systemzustands zum Zeitpunkt k, bevor die k-te Messung yk berücksichtigt wurde;

P_{k\mid k-1}

ist die entsprechende Unsicherheit. ⓘ

In der Statistik und Steuerungstheorie ist die Kalman-Filterung, auch bekannt als lineare quadratische Schätzung (LQE), ein Algorithmus, der eine Reihe von Messungen verwendet, die im Laufe der Zeit beobachtet werden, einschließlich statistischem Rauschen und anderen Ungenauigkeiten, und der Schätzungen unbekannter Variablen erzeugt, die in der Regel genauer sind als diejenigen, die nur auf einer einzigen Messung basieren, indem er eine gemeinsame Wahrscheinlichkeitsverteilung über die Variablen für jeden Zeitrahmen schätzt. Der Filter ist nach Rudolf E. Kálmán benannt, der einer der Hauptentwickler seiner Theorie war. ⓘ

Dieser digitale Filter wird manchmal auch als Stratonovich-Kalman-Bucy-Filter bezeichnet, weil er ein Spezialfall eines allgemeineren, nichtlinearen Filters ist, der etwas früher von dem sowjetischen Mathematiker Ruslan Stratonovich entwickelt wurde. Einige der Gleichungen des linearen Spezialfilters wurden bereits vor dem Sommer 1960 in Abhandlungen von Stratonowitsch veröffentlicht, als sich Kalman und Stratonowitsch auf einer Konferenz in Moskau trafen. ⓘ

Die Kalman-Filterung hat zahlreiche technische Anwendungen. Eine häufige Anwendung ist die Lenkung, Navigation und Steuerung von Fahrzeugen, insbesondere von dynamisch positionierten Flugzeugen, Raumfahrzeugen und Schiffen. Darüber hinaus ist die Kalman-Filterung ein viel genutztes Konzept in der Zeitreihenanalyse, die unter anderem in der Signalverarbeitung und Ökonometrie eingesetzt wird. Die Kalman-Filterung ist auch eines der Hauptthemen der Bewegungsplanung und -steuerung von Robotern und kann zur Optimierung von Flugbahnen verwendet werden. Die Kalman-Filterung eignet sich auch für die Modellierung der Bewegungskontrolle des zentralen Nervensystems. Aufgrund der Zeitverzögerung zwischen der Ausgabe motorischer Befehle und dem Erhalt sensorischer Rückmeldungen bietet die Verwendung von Kalman-Filtern ein realistisches Modell für die Schätzung des aktuellen Zustands eines Motorsystems und die Ausgabe aktualisierter Befehle. ⓘ

Der Algorithmus arbeitet in einem zweistufigen Prozess. In der Vorhersagephase erstellt der Kalman-Filter Schätzungen der aktuellen Zustandsvariablen zusammen mit ihren Unsicherheiten. Sobald das Ergebnis der nächsten Messung (die zwangsläufig mit einem gewissen Fehler, einschließlich zufälligem Rauschen, behaftet ist) beobachtet wird, werden diese Schätzungen anhand eines gewichteten Durchschnitts aktualisiert, wobei Schätzungen mit größerer Sicherheit mehr Gewicht erhalten. Der Algorithmus ist rekursiv. Er kann in Echtzeit arbeiten, indem er nur die aktuellen Eingangsmessungen und den zuvor berechneten Zustand sowie seine Unsicherheitsmatrix verwendet; zusätzliche Informationen aus der Vergangenheit sind nicht erforderlich. ⓘ

Die Optimalität der Kalman-Filterung setzt voraus, dass die Fehler eine normale (Gaußsche) Verteilung haben. Mit den Worten von Rudolf E. Kálmán: "Zusammenfassend werden die folgenden Annahmen über Zufallsprozesse gemacht: Physikalische Zufallsphänomene können als Folge von primären Zufallsquellen betrachtet werden, die dynamische Systeme anregen. Die primären Quellen werden als unabhängige gaußsche Zufallsprozesse mit Mittelwert Null angenommen; die dynamischen Systeme werden linear sein." Wenn die Kovarianzen des Prozesses und der Messungen bekannt sind, ist der Kalman-Filter unabhängig von der Gaußschen Verteilung der bestmögliche lineare Schätzer im Sinne eines minimalen mittleren quadratischen Fehlers. ⓘ

Es wurden auch Erweiterungen und Verallgemeinerungen der Methode entwickelt, wie der erweiterte Kalman-Filter und der unscented Kalman-Filter, die für nichtlineare Systeme funktionieren. Grundlage ist ein verborgenes Markov-Modell, bei dem der Zustandsraum der latenten Variablen kontinuierlich ist und alle latenten und beobachteten Variablen Gaußsche Verteilungen haben. Die Kalman-Filterung wurde auch erfolgreich bei der Fusion mehrerer Sensoren und bei verteilten Sensornetzen eingesetzt, um eine verteilte oder Konsens-Kalman-Filterung zu entwickeln. ⓘ

Das Kalman-Filter dient dazu, nicht direkt messbare Systemgrößen zu schätzen, während die Fehler der Messungen optimal reduziert werden. Bei dynamischen Größen kann dem Filter ein mathematisches Modell als Nebenbedingung hinzugefügt werden, um dynamische Beziehungen zwischen den Systemgrößen zu berücksichtigen. So können beispielsweise Bewegungsgleichungen helfen, veränderliche Positionen und Geschwindigkeiten gemeinsam präzise zu schätzen. Die Besonderheit des 1960 von Kálmán vorgestellten Filters bildet dabei seine spezielle mathematische Struktur, die den Einsatz in Echtzeitsystemen verschiedener technischer Bereiche ermöglicht. Dazu zählen u. a. die Auswertung von Radarsignalen oder GNSS-Daten zur Positionsbestimmung sich bewegender Objekte (Tracking), aber auch der Einsatz in allgegenwärtigen elektronischen Regelkreisen in Kommunikationssystemen wie etwa Radio oder Mobilfunk oder in der Steuerung von Elektrofahrrädern. ⓘ

Geschichte

Die Filtermethode ist nach dem ungarischen Emigranten Rudolf E. Kálmán benannt, obwohl Thorvald Nicolai Thiele und Peter Swerling schon früher einen ähnlichen Algorithmus entwickelt hatten. Richard S. Bucy vom Johns Hopkins Applied Physics Laboratory trug zur Theorie bei, so dass das Verfahren manchmal auch als Kalman-Bucy-Filterung bezeichnet wird. Stanley F. Schmidt wird allgemein die Entwicklung der ersten Implementierung eines Kalman-Filters zugeschrieben. Er erkannte, dass der Filter in zwei verschiedene Teile unterteilt werden kann, wobei ein Teil für die Zeiträume zwischen den Sensorausgaben und ein anderer Teil für die Einbeziehung von Messungen zuständig ist. Während eines Besuchs von Kálmán im Ames Research Center der NASA erkannte Schmidt die Anwendbarkeit von Kálmáns Ideen auf das nichtlineare Problem der Flugbahnschätzung für das Apollo-Programm, was dazu führte, dass es in den Apollo-Navigationscomputer eingebaut wurde. Diese Kalman-Filterung wurde erstmals in technischen Abhandlungen von Swerling (1958), Kalman (1960) und Kalman und Bucy (1961) beschrieben und teilweise weiterentwickelt. ⓘ

Der Apollo-Computer verwendete 2k Magnetkern-RAM und 36k Drahtseil [...]. Die CPU war aus ICs aufgebaut [...]. Die Taktrate lag unter 100 kHz [...]. Die Tatsache, dass die MIT-Ingenieure in der Lage waren, eine so gute Software (eine der allerersten Anwendungen des Kalman-Filters) in einen so kleinen Computer zu packen, ist wirklich bemerkenswert.
- Interview mit Jack Crenshaw, von Matthew Reed, TRS-80.org (2009) [1] ⓘ

Kalman-Filter sind von entscheidender Bedeutung für die Implementierung der Navigationssysteme von U-Booten mit ballistischen Atomraketen der US-Marine und für die Lenk- und Navigationssysteme von Marschflugkörpern wie dem Tomahawk-Raketen der US-Marine und dem luftgestützten Marschflugkörper der US-Luftwaffe. Sie werden auch in den Lenk- und Navigationssystemen von wiederverwendbaren Trägerraketen und in den Lageregelungs- und Navigationssystemen von Raumfahrzeugen verwendet, die an der Internationalen Raumstation andocken. ⓘ

Überblick über die Berechnung

Bei der Kalman-Filterung werden das dynamische Modell eines Systems (z. B. physikalische Bewegungsgesetze), bekannte Steuereingaben für dieses System und mehrere aufeinander folgende Messungen (z. B. von Sensoren) verwendet, um eine Schätzung der sich ändernden Größen des Systems (seines Zustands) zu erstellen, die besser ist als die Schätzung, die durch die Verwendung nur einer Messung allein erzielt wird. Als solches ist es ein gängiger Algorithmus zur Sensorfusion und Datenfusion. ⓘ

Verrauschte Sensordaten, Näherungswerte in den Gleichungen, die die Systementwicklung beschreiben, und externe Faktoren, die nicht berücksichtigt werden, schränken die Möglichkeit ein, den Zustand des Systems zu bestimmen. Mit dem Kalman-Filter lässt sich die Unsicherheit, die durch verrauschte Sensordaten und bis zu einem gewissen Grad auch durch zufällige externe Faktoren entsteht, wirksam bekämpfen. Der Kalman-Filter erzeugt eine Schätzung des Systemzustands als Mittelwert aus dem vorhergesagten Systemzustand und der neuen Messung unter Verwendung eines gewichteten Mittelwerts. Der Zweck der Gewichte besteht darin, dass Werte mit besserer (d. h. kleinerer) geschätzter Unsicherheit mehr "Vertrauen" genießen. Die Gewichte werden aus der Kovarianz berechnet, einem Maß für die geschätzte Unsicherheit der Vorhersage des Systemzustands. Das Ergebnis des gewichteten Mittelwerts ist eine neue Zustandsschätzung, die zwischen dem vorhergesagten und dem gemessenen Zustand liegt und eine bessere geschätzte Unsicherheit aufweist als beide allein. Dieser Prozess wird bei jedem Zeitschritt wiederholt, wobei die neue Schätzung und ihre Kovarianz die in der folgenden Iteration verwendete Vorhersage beeinflussen. Das bedeutet, dass der Kalman-Filter rekursiv arbeitet und zur Berechnung eines neuen Zustands nur die letzte "beste Schätzung" und nicht die gesamte Historie des Systemzustands benötigt. ⓘ

Die Gewissheitseinstufung der Messungen und die Schätzung des aktuellen Zustands sind wichtige Überlegungen. Es ist üblich, die Reaktion des Filters als Verstärkung des Kalman-Filters zu bezeichnen. Die Kalman-Verstärkung ist das Gewicht, das den Messungen und der aktuellen Zustandsschätzung gegeben wird, und kann "abgestimmt" werden, um eine bestimmte Leistung zu erzielen. Bei einer hohen Verstärkung legt der Filter mehr Gewicht auf die jüngsten Messungen und passt sich ihnen daher schneller an. Bei einer niedrigen Verstärkung hält sich der Filter enger an die Modellvorhersagen. Bei den Extremen führt eine hohe Verstärkung nahe bei 1 zu einer sprunghafteren geschätzten Flugbahn, während eine niedrige Verstärkung nahe bei 0 das Rauschen glättet, aber die Reaktionsfähigkeit verringert. ⓘ

Bei der Durchführung der eigentlichen Berechnungen für den Filter (wie unten beschrieben) werden die Zustandsschätzung und die Kovarianzen in Matrizen kodiert, da ein einzelner Satz von Berechnungen mehrere Dimensionen umfasst. Dies ermöglicht die Darstellung linearer Beziehungen zwischen verschiedenen Zustandsvariablen (z. B. Position, Geschwindigkeit und Beschleunigung) in jedem der Übergangsmodelle oder Kovarianzen. ⓘ

Anwendungsbeispiel

Ein Anwendungsbeispiel ist die Bestimmung der genauen Position eines Lastwagens. Der Lkw kann mit einem GPS-Gerät ausgestattet sein, das eine Schätzung der Position auf wenige Meter genau liefert. Die GPS-Schätzung ist wahrscheinlich verrauscht; die Messwerte "springen" schnell umher, bleiben aber innerhalb weniger Meter der tatsächlichen Position. Da man davon ausgeht, dass der Lkw den physikalischen Gesetzen folgt, kann seine Position auch durch die Integration seiner Geschwindigkeit über die Zeit geschätzt werden, die durch die Verfolgung der Radumdrehungen und des Lenkradwinkels bestimmt wird. Diese Technik wird als Koppelnavigation bezeichnet. In der Regel liefert die Koppelnavigation eine sehr gleichmäßige Schätzung der Position des Staplers, die jedoch mit der Zeit abweicht, da sich kleine Fehler ansammeln. ⓘ

In diesem Beispiel kann man sich den Kalman-Filter in zwei verschiedenen Phasen vorstellen: Vorhersage und Aktualisierung. In der Vorhersagephase wird die alte Position des Lkw gemäß den physikalischen Bewegungsgesetzen (dem dynamischen oder "Zustandsübergangs"-Modell) geändert. Es wird nicht nur eine neue Positionsschätzung berechnet, sondern auch eine neue Kovarianz. Vielleicht ist die Kovarianz proportional zur Geschwindigkeit des Lastwagens, weil die Genauigkeit der Positionsschätzung nach dem Koppelnavigationssystem bei hohen Geschwindigkeiten unsicherer ist, während die Positionsschätzung bei niedrigen Geschwindigkeiten sehr sicher ist. Als Nächstes wird in der Aktualisierungsphase die Position des Lkw mit dem GPS-Gerät gemessen. Diese Messung ist mit einer gewissen Unsicherheit behaftet, und ihre Kovarianz gegenüber der Vorhersage aus der vorherigen Phase bestimmt, wie stark die neue Messung die aktualisierte Vorhersage beeinflusst. Da die Schätzungen der Koppelnavigation dazu neigen, sich von der tatsächlichen Position zu entfernen, sollte die GPS-Messung die Positionsschätzung im Idealfall wieder an die tatsächliche Position heranführen, sie aber nicht so weit stören, dass sie verrauscht und schnell springt. ⓘ

Technische Beschreibung und Kontext

Der Kalman-Filter ist ein effizienter rekursiver Filter, der den internen Zustand eines linearen dynamischen Systems aus einer Reihe von verrauschten Messungen schätzt. Er wird in einer Vielzahl von technischen und ökonometrischen Anwendungen eingesetzt, von Radar und Computer Vision bis hin zur Schätzung von strukturellen makroökonomischen Modellen, und ist ein wichtiges Thema in der Kontrolltheorie und der Kontrollsystemtechnik. Zusammen mit dem linear-quadratischen Regler (LQR) löst der Kalman-Filter das linear-quadratisch-gaußsche Regelungsproblem (LQG). Das Kalman-Filter, der linear-quadratische Regler und der linear-quadratisch-gaußsche Regler sind Lösungen für die wohl grundlegendsten Probleme der Regelungstheorie. ⓘ

In den meisten Anwendungen ist der interne Zustand viel größer (mehr Freiheitsgrade) als die wenigen "beobachtbaren" Parameter, die gemessen werden. Durch die Kombination einer Reihe von Messungen kann der Kalman-Filter jedoch den gesamten internen Zustand schätzen. ⓘ

Bei der Dempster-Shafer-Theorie wird jede Zustandsgleichung oder Beobachtung als Spezialfall einer linearen Glaubensfunktion betrachtet, und die Kalman-Filterung ist ein Spezialfall der Kombination linearer Glaubensfunktionen in einem Join-Tree oder Markov-Baum. Zu den weiteren Methoden gehört das Belief Filtering, das Bayes- oder Evidential-Updates für die Zustandsgleichungen verwendet. ⓘ

Es gibt inzwischen eine Vielzahl von Kalman-Filtern, von Kalmans ursprünglicher Formulierung - heute als "einfacher" Kalman-Filter bezeichnet - über den Kalman-Bucy-Filter, Schmidts "erweiterten" Filter, den Informationsfilter bis hin zu einer Vielzahl von "Quadratwurzel"-Filtern, die von Bierman, Thornton und vielen anderen entwickelt wurden. Der vielleicht am häufigsten verwendete Typ eines sehr einfachen Kalman-Filters ist der Phasenregelkreis, der heute in Radios, insbesondere in FM-Radios, Fernsehgeräten, Satellitenkommunikationsempfängern, Weltraumkommunikationssystemen und fast allen anderen elektronischen Kommunikationsgeräten allgegenwärtig ist. ⓘ

Zugrundeliegendes dynamisches Systemmodell

Die Kalman-Filterung basiert auf linearen dynamischen Systemen, die im Zeitbereich diskretisiert sind. Sie werden durch eine Markov-Kette modelliert, die aus linearen Operatoren besteht, die durch Fehler, zu denen auch Gaußsches Rauschen gehören kann, gestört werden. Der Zustand des Zielsystems bezieht sich auf die (noch verborgene) Systemkonfiguration von Interesse, die als Vektor aus reellen Zahlen dargestellt wird. Bei jedem diskreten Zeitinkrement wird ein linearer Operator auf den Zustand angewandt, um den neuen Zustand zu erzeugen, dem etwas Rauschen beigemischt ist, sowie optional einige Informationen aus den Steuerungen des Systems, falls diese bekannt sind. Dann erzeugt ein weiterer linearer Operator, der mit mehr Rauschen vermischt ist, die messbaren Ausgänge (d. h. die Beobachtung) aus dem wahren ("verborgenen") Zustand. Der Kalman-Filter kann als Analogon zum verborgenen Markov-Modell betrachtet werden, mit dem Unterschied, dass die verborgenen Zustandsvariablen Werte in einem kontinuierlichen Raum haben, im Gegensatz zu einem diskreten Zustandsraum wie beim verborgenen Markov-Modell. Es besteht eine starke Analogie zwischen den Gleichungen eines Kalman-Filters und denen des Hidden-Markov-Modells. Ein Überblick über dieses und andere Modelle findet sich in Roweis und Ghahramani (1999) und Hamilton (1994), Kapitel 13. ⓘ

Um den Kalman-Filter zur Schätzung des internen Zustands eines Prozesses zu verwenden, wenn nur eine Folge verrauschter Beobachtungen vorliegt, muss man den Prozess gemäß dem folgenden Rahmen modellieren. Dies bedeutet, dass für jeden Zeitschritt k die folgenden Matrizen festgelegt werden:

F_k, das Zustandsübergangsmodell;
H_k, das Beobachtungsmodell;
Q_k, die Kovarianz des Prozessrauschens;
R_k, die Kovarianz des Beobachtungsrauschens;
und manchmal B_k, das Steuereingangsmodell, wie unten beschrieben; wenn B_k enthalten ist, dann gibt es auch
uk, der Steuerungsvektor, der die Steuerungseingabe in das Steuerungseingangsmodell darstellt. ⓘ

Dem Kalman-Filter zugrunde liegendes Modell. Quadrate stellen Matrizen dar. Ellipsen stellen multivariate Normalverteilungen dar (mit eingeschlossenem Mittelwert und Kovarianzmatrix). Die nicht eingeschlossenen Werte sind Vektoren. Im einfachen Fall sind die verschiedenen Matrizen zeitlich konstant, so dass die Indizes nicht verwendet werden, aber die Kalman-Filterung erlaubt es, dass sich jede von ihnen in jedem Zeitschritt ändert. ⓘ

Das Kalman-Filter-Modell geht davon aus, dass sich der wahre Zustand zum Zeitpunkt k aus dem Zustand zum Zeitpunkt (k - 1) entwickelt, und zwar gemäß ⓘ

\mathbf {x} _{k}=\mathbf {F} _{k}\mathbf {x} _{k-1}+\mathbf {B} _{k}\mathbf {u} _{k}+\mathbf {w} _{k}

ⓘ

wobei

F_k ist das Zustandsübergangsmodell, das auf den vorherigen Zustand xk-1 angewendet wird;
Bk das Steuereingangsmodell ist, das auf den Steuervektor uk angewandt wird;
w_k das Prozessrauschen ist, von dem angenommen wird, dass es aus einer multivariaten Normalverteilung mit Nullmittelwert gezogen wird, ${\mathcal {N}}$ mit der Kovarianz Q_k: $\mathbf {w} _{k}\sim {\mathcal {N}}\left(0,\mathbf {Q} _{k}\right)$ . ⓘ

Zum Zeitpunkt k wird eine Beobachtung (oder Messung) zk des wahren Zustands xk nach folgender Formel durchgeführt ⓘ

\mathbf {z} _{k}=\mathbf {H} _{k}\mathbf {x} _{k}+\mathbf {v} _{k}

ⓘ

wobei

H_k ist das Beobachtungsmodell, das den wahren Zustandsraum auf den beobachteten Raum abbildet, und
v_k ist das Beobachtungsrauschen, das als nullwertiges weißes Gaußsches Rauschen mit der Kovarianz R_k angenommen wird: $\mathbf {v} _{k}\sim {\mathcal {N}}\left(0,\mathbf {R} _{k}\right)$ . ⓘ

Der Anfangszustand und die Rauschvektoren bei jedem Schritt {x₀, w₁, ..., wk, v₁, ... ,vk} werden alle als voneinander unabhängig angenommen. ⓘ

Viele dynamische Echtzeitsysteme entsprechen nicht genau diesem Modell. In der Tat kann eine nicht modellierte Dynamik die Leistung des Filters ernsthaft beeinträchtigen, selbst wenn er mit unbekannten stochastischen Signalen als Eingaben arbeiten sollte. Der Grund dafür ist, dass die Wirkung einer nicht modellierten Dynamik von der Eingabe abhängt und daher den Schätzalgorithmus zur Instabilität bringen kann (er divergiert). Andererseits führen unabhängige Signale mit weißem Rauschen nicht zu einer Divergenz des Algorithmus. Die Unterscheidung zwischen Messrauschen und nicht modellierter Dynamik ist ein schwieriges Problem und wird als Problem der Kontrolltheorie unter Verwendung robuster Kontrolle behandelt. ⓘ

Einzelheiten

Der Kalman-Filter ist ein rekursiver Schätzer. Das bedeutet, dass nur der geschätzte Zustand aus dem vorangegangenen Zeitschritt und die aktuelle Messung benötigt werden, um die Schätzung für den aktuellen Zustand zu berechnen. Im Gegensatz zu Batch-Schätzverfahren ist keine Historie von Beobachtungen und/oder Schätzungen erforderlich. Im Folgenden steht die Schreibweise ${\hat {\mathbf {x} }}_{n\mid m}$ für die Schätzung von $\mathbf {x}$ zum Zeitpunkt n bei Beobachtungen bis einschließlich zum Zeitpunkt m ≤ n. ⓘ

Der Zustand des Filters wird durch zwei Variablen dargestellt:

${\hat {\mathbf {x} }}_{k\mid k}$ , die a posteriori Zustandsschätzung zum Zeitpunkt k bei Beobachtungen bis einschließlich zum Zeitpunkt k;
$\mathbf {P} _{k\mid k}$ , die Kovarianzmatrix der a posteriori-Schätzung (ein Maß für die geschätzte Genauigkeit der Zustandsschätzung). ⓘ

Die Algorithmusstruktur des Kalman-Filters ähnelt der des Alpha-Beta-Filters. Der Kalman-Filter kann als eine einzige Gleichung geschrieben werden; er wird jedoch meist als zwei getrennte Phasen konzeptualisiert: "Vorhersage" und "Aktualisierung". In der Vorhersagephase wird die Zustandsschätzung des vorherigen Zeitschritts verwendet, um eine Schätzung des Zustands im aktuellen Zeitschritt zu erstellen. Diese vorhergesagte Zustandsschätzung wird auch als a priori Zustandsschätzung bezeichnet, da sie zwar eine Schätzung des Zustands im aktuellen Zeitschritt ist, aber keine Beobachtungsinformationen aus dem aktuellen Zeitschritt enthält. In der Aktualisierungsphase wird die Innovation (das Pre-Fit-Residuum), d. h. die Differenz zwischen der aktuellen A-priori-Vorhersage und den aktuellen Beobachtungsinformationen, mit der optimalen Kalman-Verstärkung multipliziert und mit der vorherigen Zustandsschätzung kombiniert, um die Zustandsschätzung zu verbessern. Diese verbesserte Schätzung auf der Grundlage der aktuellen Beobachtung wird als a posteriori Zustandsschätzung bezeichnet. ⓘ

Normalerweise wechseln sich die beiden Phasen ab, wobei die Vorhersage den Zustand bis zur nächsten geplanten Beobachtung vorverlegt und die Aktualisierung die Beobachtung einbezieht. Dies ist jedoch nicht notwendig; wenn eine Beobachtung aus irgendeinem Grund nicht verfügbar ist, kann die Aktualisierung übersprungen und mehrere Vorhersageverfahren durchgeführt werden. Ebenso können, wenn mehrere unabhängige Beobachtungen gleichzeitig verfügbar sind, mehrere Aktualisierungsverfahren durchgeführt werden (typischerweise mit unterschiedlichen Beobachtungsmatrizen Hk). ⓘ

Vorhersage

Vorausgesagte (a priori) Zustandsschätzung	${\hat {\mathbf {x} }}_{k\mid k-1}=\mathbf {F} _{k}{\hat {\mathbf {x} }}_{k-1\mid k-1}+\mathbf {B} _{k}\mathbf {u} _{k}$ ⓘ
Vorausgesagte (a priori) Kovarianz der Schätzung	$\mathbf {P} _{k\mid k-1}=\mathbf {F} _{k}\mathbf {P} _{k-1\mid k-1}\mathbf {F} _{k}^{\textsf {T}}+\mathbf {Q} _{k}$

Aktualisieren

Innovation oder Pre-Fit-Residuum der Messung	${\tilde {\mathbf {y} }}_{k}=\mathbf {z} _{k}-\mathbf {H} _{k}{\hat {\mathbf {x} }}_{k\mid k-1}$ ⓘ
Kovarianz der Innovation (oder des Pre-Fit-Restes)	$\mathbf {S} _{k}=\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}+\mathbf {R} _{k}$
Optimale Kalman-Verstärkung	$\mathbf {K} _{k}=\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}\mathbf {S} _{k}^{-1}$
Aktualisierte (a posteriori) Zustandsschätzung	${\hat {\mathbf {x} }}_{k\mid k}={\hat {\mathbf {x} }}_{k\mid k-1}+\mathbf {K} _{k}{\tilde {\mathbf {y} }}_{k}$
Aktualisierte (a posteriori) Kovarianz der Schätzung	$\mathbf {P} _{k\|k}=\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)\mathbf {P} _{k\|k-1}$
Post-Fit-Restwert der Messung	${\tilde {\mathbf {y} }}_{k\mid k}=\mathbf {z} _{k}-\mathbf {H} _{k}{\hat {\mathbf {x} }}_{k\mid k}$

Die obige Formel für die aktualisierte (a posteriori) Kovarianz der Schätzung gilt für die optimale Kk-Verstärkung, die den Restfehler minimiert, und in dieser Form wird sie am häufigsten in Anwendungen verwendet. Der Beweis für die Formeln findet sich im Abschnitt Ableitungen, wo auch die für jedes Kk gültige Formel gezeigt wird. ⓘ

Eine intuitivere Art, die aktualisierte Zustandsschätzung ( ${\hat {\mathbf {x} }}_{k\mid k}$ ) ist:

{\hat {\mathbf {x} }}_{k\mid k}=(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}){\hat {\mathbf {x} }}_{k\mid k-1}+\mathbf {K} _{k}(\mathbf {H} _{k}\mathbf {x} _{k}+\mathbf {v} _{k})

ⓘ

Dieser Ausdruck erinnert uns an eine lineare Interpolation, $x=(1-t)(a)+t(b)$ für $t$ zwischen [0,1]. In unserem Fall:

$t$ ist die Kalman-Verstärkung ( $\mathbf {K} _{k}$ ), eine Matrix, die Werte von $0$ (hoher Fehler im Sensor) bis $I$ (geringer Fehler) annimmt.
$a$ ist der aus dem Modell geschätzte Wert.
$b$ ist der Wert aus der Messung.

Dieser Ausdruck ähnelt auch dem Aktualisierungsschritt des Alpha-Beta-Filters. ⓘ

Invarianten

Wenn das Modell genau ist, und die Werte für ${\hat {\mathbf {x} }}_{0\mid 0}$ und $\mathbf {P} _{0\mid 0}$ die Verteilung der anfänglichen Zustandswerte genau wiedergeben, dann bleiben die folgenden Invarianten erhalten:

{\begin{aligned}\operatorname {E} [\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k}]&=\operatorname {E} [\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k-1}]=0\\\operatorname {E} [{\tilde {\mathbf {y} }}_{k}]&=0\end{aligned}}

ⓘ

wobei $\operatorname {E} [\xi ]$ ist der Erwartungswert von $\xi$ . Das heißt, alle Schätzungen haben einen mittleren Fehler von Null. ⓘ

Außerdem:

{\begin{aligned}\mathbf {P} _{k\mid k}&=\operatorname {cov} \left(\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k}\right)\\\mathbf {P} _{k\mid k-1}&=\operatorname {cov} \left(\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k-1}\right)\\\mathbf {S} _{k}&=\operatorname {cov} \left({\tilde {\mathbf {y} }}_{k}\right)\end{aligned}}

ⓘ

Die Kovarianzmatrizen geben also die Kovarianz der Schätzungen genau wieder. ⓘ

Schätzung der Rauschkovarianzen Qk und Rk

Die praktische Umsetzung eines Kalman-Filters ist oft schwierig, weil es schwierig ist, eine gute Schätzung der Rauschkovarianzmatrizen Qk und Rk zu erhalten. Es wurden umfangreiche Forschungsarbeiten durchgeführt, um diese Kovarianzen anhand von Daten zu schätzen. Eine praktische Methode hierfür ist die Autokovarianz-Least-Squares-Technik (ALS), die die zeitverzögerten Autokovarianzen von Routinebetriebsdaten zur Schätzung der Kovarianzen verwendet. Der GNU Octave- und Matlab-Code, der zur Berechnung der Rauschkovarianzmatrizen unter Verwendung der ALS-Technik verwendet wird, ist online unter der GNU General Public License verfügbar. Field Kalman Filter (FKF), ein Bayes'scher Algorithmus, der eine gleichzeitige Schätzung des Zustands, der Parameter und der Rauschkovarianz ermöglicht, wurde vorgeschlagen. Der FKF-Algorithmus hat eine rekursive Formulierung, gute beobachtete Konvergenz und relativ geringe Komplexität. Dies lässt darauf schließen, dass der FKF-Algorithmus eine Alternative zu den Autocovariance-Least-Squares-Methoden sein könnte. ⓘ

Optimalität und Leistung

Aus der Theorie folgt, dass der Kalman-Filter der optimale lineare Filter ist, wenn a) das Modell perfekt mit dem realen System übereinstimmt, b) das eingehende Rauschen "weiß" (unkorreliert) ist und c) die Kovarianzen des Rauschens genau bekannt sind. Korreliertes Rauschen kann auch mit Kalman-Filtern behandelt werden. In den letzten Jahrzehnten wurden mehrere Methoden zur Schätzung der Kovarianz des Rauschens vorgeschlagen, darunter die im obigen Abschnitt erwähnte ALS. Nach der Schätzung der Kovarianzen ist es sinnvoll, die Leistung des Filters zu bewerten, d. h. ob es möglich ist, die Qualität der Zustandsschätzung zu verbessern. Wenn der Kalman-Filter optimal arbeitet, ist die Innovationssequenz (der Ausgangsprognosefehler) ein weißes Rauschen, so dass die Weiße-Eigenschaft der Innovationen die Filterleistung misst. Zu diesem Zweck können mehrere verschiedene Methoden verwendet werden. Für den Fall, dass die Rauschterme nicht gaußförmig verteilt sind, sind in der Literatur Methoden zur Bewertung der Leistung der Filterschätzung bekannt, die Wahrscheinlichkeitsungleichungen oder die Theorie der großen Stichproben verwenden. ⓘ

Prädiktion

Wahrheit; gefilterter Prozess; Beobachtungen. ⓘ

Betrachten wir einen Lastwagen auf reibungsfreien, geraden Schienen. Zu Beginn befindet sich der Lastwagen an der Position 0, wird aber durch zufällige, unkontrollierte Kräfte hin und her geschleudert. Wir messen die Position des Lastwagens alle Δt Sekunden, aber diese Messungen sind ungenau; wir wollen ein Modell der Position und der Geschwindigkeit des Lastwagens erhalten. Wir zeigen hier, wie wir das Modell ableiten, aus dem wir unseren Kalman-Filter erstellen. ⓘ

Da $\mathbf {F} ,\mathbf {H} ,\mathbf {R} ,\mathbf {Q}$ konstant sind, werden ihre Zeitindizes weggelassen. ⓘ

Die Position und die Geschwindigkeit des Lastwagens werden durch den linearen Zustandsraum beschrieben

\mathbf {x} _{k}={\begin{bmatrix}x\\{\dot {x}}\end{bmatrix}}

ⓘ

wobei ${\dot {x}}$ ist die Geschwindigkeit, d. h. die Ableitung der Position nach der Zeit. ⓘ

Wir nehmen an, dass zwischen (k - 1) und k Zeitschritten unkontrollierte Kräfte eine konstante Beschleunigung von ak verursachen, die normalverteilt ist, mit Mittelwert 0 und Standardabweichung σa. Aus den Newtonschen Bewegungsgesetzen schließen wir, dass

\mathbf {x} _{k}=\mathbf {F} \mathbf {x} _{k-1}+\mathbf {G} a_{k}

ⓘ

(es gibt keinen $\mathbf {B} u$ Term, da es keine bekannten Steuereingaben gibt. Stattdessen ist ak die Wirkung einer unbekannten Eingabe und $\mathbf {G}$ wendet diese Wirkung auf den Zustandsvektor an), wobei

{\begin{aligned}\mathbf {F} &={\begin{bmatrix}1&\Delta t\\0&1\end{bmatrix}}\\[4pt]\mathbf {G} &={\begin{bmatrix}{\frac {1}{2}}{\Delta t}^{2}\\[6pt]\Delta t\end{bmatrix}}\end{aligned}}

ⓘ

so dass

\mathbf {x} _{k}=\mathbf {F} \mathbf {x} _{k-1}+\mathbf {w} _{k}

ⓘ

wobei

{\begin{aligned}\mathbf {w} _{k}&\sim N(0,\mathbf {Q} )\\\mathbf {Q} &=\mathbf {G} \mathbf {G} ^{\textsf {T}}\sigma _{a}^{2}={\begin{bmatrix}{\frac {1}{4}}{\Delta t}^{4}&{\frac {1}{2}}{\Delta t}^{3}\\[6pt]{\frac {1}{2}}{\Delta t}^{3}&{\Delta t}^{2}\end{bmatrix}}\sigma _{a}^{2}.\end{aligned}}

ⓘ

Die Matrix $\mathbf {Q}$ ist nicht vollwertig (sie ist von Rang eins, wenn $\Delta t\neq 0$ ). Folglich ist die Verteilung $N(0,\mathbf {Q} )$ nicht absolut stetig und hat keine Wahrscheinlichkeitsdichtefunktion. Eine andere Möglichkeit, dies auszudrücken und dabei explizite entartete Verteilungen zu vermeiden, ist gegeben durch

\mathbf {w} _{k}\sim \mathbf {G} \cdot N\left(0,\sigma _{a}^{2}\right).

ⓘ

In jeder Zeitphase wird eine verrauschte Messung der wahren Position des Lastwagens durchgeführt. Nehmen wir an, das Messrauschen v_k ist ebenfalls normalverteilt, mit Mittelwert 0 und Standardabweichung σ_z.

\mathbf {z} _{k}=\mathbf {Hx} _{k}+\mathbf {v} _{k}

ⓘ

wobei

\mathbf {H} ={\begin{bmatrix}1&0\end{bmatrix}}

ⓘ

und

\mathbf {R} =\mathrm {E} \left[\mathbf {v} _{k}\mathbf {v} _{k}^{\textsf {T}}\right]={\begin{bmatrix}\sigma _{z}^{2}\end{bmatrix}}

ⓘ

Wir kennen den anfänglichen Startzustand des Lastwagens mit perfekter Präzision, also initialisieren wir

{\hat {\mathbf {x} }}_{0\mid 0}={\begin{bmatrix}0\\0\end{bmatrix}}

ⓘ

und um dem Filter mitzuteilen, dass wir die genaue Position und Geschwindigkeit kennen, geben wir ihm eine Null-Kovarianzmatrix:

\mathbf {P} _{0\mid 0}={\begin{bmatrix}0&0\\0&0\end{bmatrix}}

ⓘ

Wenn die Anfangsposition und -geschwindigkeit nicht genau bekannt sind, sollte die Kovarianzmatrix mit geeigneten Varianzen auf der Diagonalen initialisiert werden:

\mathbf {P} _{0\mid 0}={\begin{bmatrix}\sigma _{x}^{2}&0\\0&\sigma _{\dot {x}}^{2}\end{bmatrix}}

ⓘ

Der Filter wird dann die Informationen aus den ersten Messungen gegenüber den bereits im Modell enthaltenen Informationen bevorzugen. ⓘ

Beim ersten Schritt des Filtervorgangs wird die zeitlich vorangegangene Schätzung der Zustandsdynamik unterworfen, um eine Voraussage für den aktuellen Zeitpunkt zu erhalten. Für den Mittelwert ergibt sich ⓘ

und für die Kovarianz ⓘ

{\textbf {P}}_{k|k-1}={\textbf {F}}_{k-1}{\textbf {P}}_{k-1}{\textbf {F}}_{k-1}^{\text{T}}+{\textbf {Q}}_{k-1}

. ⓘ

Die Indizierungsschreibweise k|k-1 drückt für den Zustand zum Zeitpunkt t_k die Bedingtheit der Schätzung durch den vergangenen Zustand k-1 aus. Das hochgestellte T bezeichnet die transponierte Matrix. ⓘ

Bewegungsgleichungen für die Prädiktion

Ein Kalman-Filter kann bekannte Bewegungsgleichungen einer zu schätzenden Größe berücksichtigen und z. B. die zeitabhängige Position in einen Zusammenhang mit seiner Geschwindigkeit und seiner Beschleunigung bringen. Als Zustandsvektor wählt man in diesem Fall entsprechend

{\textbf {x}}={\begin{bmatrix}x\\{\dot {x}}\\{\ddot {x}}\end{bmatrix}}.

Damit soll beispielsweise eine Bewegung mit konstanter Beschleunigung geschätzt werden, die eine parabelförmige Bahn beschreibt. Die verschiedenen Zeitableitungen der Parabelfunktion

{\begin{array}{lcl}x&=&c_{0}+c_{1}t+c_{2}t^{2}\\{\dot {x}}&=&c_{1}+2c_{2}t\\{\ddot {x}}&=&2c_{2}\\{\ddot {x}}\!{\dot {}}&=&0\end{array}}

können in folgenden linearen Zusammenhang mit dem Zustandsvektor gebracht werden ⓘ

{\begin{bmatrix}{\dot {x}}\\{\ddot {x}}\\{\ddot {x}}\!{\dot {}}\end{bmatrix}}={\begin{bmatrix}0&1&0\\0&0&1\\0&0&0\end{bmatrix}}{\begin{bmatrix}x\\{\dot {x}}\\{\ddot {x}}\end{bmatrix}}\longrightarrow D={\begin{bmatrix}0&1&0\\0&0&1\\0&0&0\end{bmatrix}},

ⓘ

so dass die linke Seite dessen Zeitableitung ergibt. Die Matrix $D$ mit Einsen in der ersten oberen Nebendiagonalen ist folglich der Differentialoperator für den Zustandsvektor und beschreibt die infinitesimale Änderung des Zustandes der drei dynamisch zusammenhängenden Größen. Der geänderte Zustand nach einer endlichen Zeit $t$ wird durch das Aufsummieren einer Anzahl von $N=t/\delta t$ kleinen und stückweise linearen Änderungen der Schrittweite $\delta t$ gewonnen. Den Grenzwert dieser Summe bei $N\rightarrow \infty$ und $\delta t\rightarrow 0$ beschreibt im Allgemeinen das Matrixexponential, das durch eine Reihenentwicklung

F(t)=e^{Dt}:=\mathbb {I} +Dt+{\frac {(Dt)^{2}}{2!}}+{\frac {(Dt)^{3}}{3!}}+\cdots +{\frac {(Dt)^{n}}{n!}}

definiert ist. Bei einem Zustandsvektor der Länge n+1 mit Ableitungen bis zur n-ten Ordnung sind in diesem Fall nur die ersten Terme dieser Reihe bis zum Exponent n von Null verschieden. Für den Zeitpropagationsschritt der Schrittweite

\Delta t

wird dann die Matrix

F(\Delta t)

als Zeitentwicklungsmatrix verwendet:

F={\begin{bmatrix}1&\Delta t&{\frac {1}{2}}(\Delta t)^{2}\\0&1&\Delta t\\0&0&1\end{bmatrix}}

ⓘ

Für den Fall, dass nur für die Position Messwerte zur Korrektur der ersten Zustandsvariable vorliegen, während Geschwindigkeit und Beschleunigung im Filterzustand automatisch geschätzt und korrigiert werden sollen, ist die Beobachtungsmatrix

H={\begin{bmatrix}1&0&0\end{bmatrix}}.

ⓘ

Falls unabhängig gemessene direkte Geschwindigkeiten oder Beschleunigungen aus Inertialsensoren vorliegen, können auch diese mit einer erweiterten H-Matrix zur Korrektur verwendet werden, um die Stabilität der Schätzung zu verbessern, z. B. für Messwerte der Position und der Beschleunigung:

H={\begin{bmatrix}1&0&0\\0&0&1\end{bmatrix}}.

ⓘ

Prozessrauschen

Eine konstante Beschleunigung, wie im obigen Beispiel, ist für viele Anwendungen eine zu starre Annahme. Abhilfe schafft ein geeignetes Modell für das Prozessrauschen, welches der Beschleunigung eine bestimmte Variation erlaubt. Ein spezielles Modell ist das piecewise white noise model, das stückweise zu Beginn jedes Zeitschritts $\Delta t$ eine um $a$ geänderte und dann konstante Beschleunigung annimmt. Damit ändert sich nach Verstreichen des Zeitintervalls $\Delta t$ der Zustand um

{\vec {r}}={\begin{pmatrix}{\frac {1}{2}}(\Delta t)^{2}\\\Delta t\\1\end{pmatrix}}a

.

Diese Änderung kann durch das Prozessrauschen beschrieben werden, indem die Matrix

Q:=E[{\vec {r}}{\vec {r}}^{T}]=a^{2}{\begin{bmatrix}{\frac {\Delta t^{4}}{4}}&{\frac {\Delta t^{3}}{2}}&{\frac {\Delta t^{2}}{2}}\\{\frac {\Delta t^{3}}{2}}&\Delta t^{2}&\Delta t\\{\frac {\Delta t^{2}}{2}}&\Delta t&1.\end{bmatrix}}

den Filterzustand entsprechend relaxiert, wobei $a^{2}$ die Varianz der zufälligen Beschleunigungsänderung pro Zeitschritt vorgibt. ⓘ

Asymptotische Form

Der Einfachheit halber nehmen wir an, dass der Steuereingang $\mathbf {u} _{k}=\mathbf {0}$ . Dann kann der Kalman-Filter geschrieben werden:

{\hat {\mathbf {x} }}_{k\mid k}=\mathbf {F} _{k}{\hat {\mathbf {x} }}_{k-1\mid k-1}+\mathbf {K} _{k}[\mathbf {z} _{k}-\mathbf {H} _{k}\mathbf {F} _{k}{\hat {\mathbf {x} }}_{k-1\mid k-1}].

ⓘ

Eine ähnliche Gleichung gilt, wenn wir eine Steuereingabe ungleich Null einbeziehen. Verstärkungsmatrizen $\mathbf {K} _{k}$ entwickeln sich unabhängig von den Messungen $\mathbf {z} _{k}$ . Die vier Gleichungen, die für die Aktualisierung der Kalman-Verstärkung benötigt werden, lauten also wie folgt:

{\begin{aligned}\mathbf {P} _{k\mid k-1}&=\mathbf {F} _{k}\mathbf {P} _{k-1\mid k-1}\mathbf {F} _{k}^{\textsf {T}}+\mathbf {Q} _{k},\\\mathbf {S} _{k}&=\mathbf {R} _{k}+\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}},\\\mathbf {K} _{k}&=\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}\mathbf {S} _{k}^{-1},\\\mathbf {P} _{k|k}&=\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)\mathbf {P} _{k|k-1}.\end{aligned}}

ⓘ

Da die Verstärkungsmatrizen nur vom Modell und nicht von den Messungen abhängen, können sie offline berechnet werden. Konvergenz der Verstärkungsmatrizen $\mathbf {K} _{k}$ zu einer asymptotischen Matrix $\mathbf {K} _{\infty }$ gilt für die in Walrand und Dimakis aufgestellten Bedingungen. Durch Simulationen wird die Anzahl der Schritte bis zur Konvergenz ermittelt. Für das oben beschriebene Beispiel eines fahrenden Lastwagens, mit $\Delta t=1$ . und $\sigma _{a}^{2}=\sigma _{z}^{2}=\sigma _{x}^{2}=\sigma _{\dot {x}}^{2}=1$ zeigt die Simulation Konvergenz in $10$ Iterationen. ⓘ

Unter Verwendung der asymptotischen Verstärkung und der Annahme, dass $\mathbf {H} _{k}$ und $\mathbf {F} _{k}$ unabhängig sind von $k$ wird der Kalman-Filter zu einem linearen, zeitinvarianten Filter:

{\hat {\mathbf {x} }}_{k}=\mathbf {F} {\hat {\mathbf {x} }}_{k-1}+\mathbf {K} _{\infty }[\mathbf {z} _{k}-\mathbf {H} \mathbf {F} {\hat {\mathbf {x} }}_{k-1}].

ⓘ

Die asymptotische Verstärkung $\mathbf {K} _{\infty }$ kann, sofern er existiert, berechnet werden, indem zunächst die folgende diskrete Riccati-Gleichung für die asymptotische Zustands-Kovarianz gelöst wird $\mathbf {P} _{\infty }$ :

\mathbf {P} _{\infty }=\mathbf {F} \left(\mathbf {P} _{\infty }-\mathbf {P} _{\infty }\mathbf {H} ^{\textsf {T}}\left(\mathbf {H} \mathbf {P} _{\infty }\mathbf {H} ^{\textsf {T}}+\mathbf {R} \right)^{-1}\mathbf {H} \mathbf {P} _{\infty }\right)\mathbf {F} ^{\textsf {T}}+\mathbf {Q} .

ⓘ

Die asymptotische Verstärkung wird dann wie zuvor berechnet. ⓘ

\mathbf {K} _{\infty }=\mathbf {P} _{\infty }\mathbf {H} ^{\textsf {T}}\left(\mathbf {R} +\mathbf {H} \mathbf {P} _{\infty }\mathbf {H} ^{\textsf {T}}\right)^{-1}.

ⓘ

Ableitungen

Der Kalman-Filter kann mithilfe der verallgemeinerten Kleinste-Quadrate-Schätzung auf vergangenen Daten hergeleitet werden. ⓘ

Der Kalman-Filter ist äquivalent zum exponentiell gewichteten gleitenden Mittelwert (exponentially weighted moving average, EMWA) falls die Gewichte in EMWA Funktionen des Prozessrauschens und des Messrauschens sind ⓘ

Ableitung der Kovarianzmatrix der Posteriori-Schätzung

Ausgehend von unserer Invariante der Fehlerkovarianz Pk | k wie oben

\mathbf {P} _{k\mid k}=\operatorname {cov} \left(\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k}\right)

ⓘ

ersetzen wir die Definition von ${\hat {\mathbf {x} }}_{k\mid k}$

\mathbf {P} _{k\mid k}=\operatorname {cov} \left[\mathbf {x} _{k}-\left({\hat {\mathbf {x} }}_{k\mid k-1}+\mathbf {K} _{k}{\tilde {\mathbf {y} }}_{k}\right)\right]

ⓘ

und ersetzen ${\tilde {\mathbf {y} }}_{k}$

\mathbf {P} _{k\mid k}=\operatorname {cov} \left(\mathbf {x} _{k}-\left[{\hat {\mathbf {x} }}_{k\mid k-1}+\mathbf {K} _{k}\left(\mathbf {z} _{k}-\mathbf {H} _{k}{\hat {\mathbf {x} }}_{k\mid k-1}\right)\right]\right)

ⓘ

und $\mathbf {z} _{k}$

\mathbf {P} _{k\mid k}=\operatorname {cov} \left(\mathbf {x} _{k}-\left[{\hat {\mathbf {x} }}_{k\mid k-1}+\mathbf {K} _{k}\left(\mathbf {H} _{k}\mathbf {x} _{k}+\mathbf {v} _{k}-\mathbf {H} _{k}{\hat {\mathbf {x} }}_{k\mid k-1}\right)\right]\right)

ⓘ

und durch Zusammenfassen der Fehlervektoren erhalten wir

\mathbf {P} _{k\mid k}=\operatorname {cov} \left[\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)\left(\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k-1}\right)-\mathbf {K} _{k}\mathbf {v} _{k}\right]

ⓘ

Da der Messfehler vk mit den anderen Termen unkorreliert ist, wird daraus

\mathbf {P} _{k\mid k}=\operatorname {cov} \left[\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)\left(\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k-1}\right)\right]+\operatorname {cov} \left[\mathbf {K} _{k}\mathbf {v} _{k}\right]

ⓘ

Durch die Eigenschaften der Vektorkovarianz wird dies zu

\mathbf {P} _{k\mid k}=\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)\operatorname {cov} \left(\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k-1}\right)\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)^{\textsf {T}}+\mathbf {K} _{k}\operatorname {cov} \left(\mathbf {v} _{k}\right)\mathbf {K} _{k}^{\textsf {T}}

ⓘ

was unter Verwendung unserer Invariante für Pk | k-1 und der Definition von R_k zu

\mathbf {P} _{k\mid k}=\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)\mathbf {P} _{k\mid k-1}\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)^{\textsf {T}}+\mathbf {K} _{k}\mathbf {R} _{k}\mathbf {K} _{k}^{\textsf {T}}

ⓘ

Diese Formel (manchmal auch als Joseph-Form der Kovarianz-Aktualisierungsgleichung bezeichnet) gilt für jeden Wert von Kk. Wenn Kk die optimale Kalman-Verstärkung ist, lässt sich diese Formel weiter vereinfachen (siehe unten). ⓘ

Herleitung der Kalman-Verstärkung

Der Kalman-Filter ist ein Schätzer mit minimalem mittleren quadratischen Fehler. Der Fehler bei der a posteriori Zustandsschätzung ist

\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k}

ⓘ

Wir versuchen, den Erwartungswert des Quadrats des Betrags dieses Vektors zu minimieren, $\operatorname {E} \left[\left\|\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k|k}\right\|^{2}\right]$ . Dies ist äquivalent zur Minimierung der Spur der Kovarianzmatrix der a posteriori Schätzung $\mathbf {P} _{k|k}$ . Durch Ausdehnung der Terme in der obigen Gleichung und Zusammenfassen erhalten wir:

{\begin{aligned}\mathbf {P} _{k\mid k}&=\mathbf {P} _{k\mid k-1}-\mathbf {K} _{k}\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}-\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}\mathbf {K} _{k}^{\textsf {T}}+\mathbf {K} _{k}\left(\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}+\mathbf {R} _{k}\right)\mathbf {K} _{k}^{\textsf {T}}\\[6pt]&=\mathbf {P} _{k\mid k-1}-\mathbf {K} _{k}\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}-\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}\mathbf {K} _{k}^{\textsf {T}}+\mathbf {K} _{k}\mathbf {S} _{k}\mathbf {K} _{k}^{\textsf {T}}\end{aligned}}

ⓘ

Die Spur ist minimiert, wenn ihre Matrixableitung in Bezug auf die Verstärkungsmatrix Null ist. Unter Verwendung der Regeln für die Gradientenmatrix und der Symmetrie der beteiligten Matrizen finden wir, dass

{\frac {\partial \;\operatorname {tr} (\mathbf {P} _{k\mid k})}{\partial \;\mathbf {K} _{k}}}=-2\left(\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}\right)^{\textsf {T}}+2\mathbf {K} _{k}\mathbf {S} _{k}=0.

ⓘ

Löst man dies für Kk, erhält man die Kalman-Verstärkung:

{\begin{aligned}\mathbf {K} _{k}\mathbf {S} _{k}&=\left(\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}\right)^{\textsf {T}}=\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}\\\Rightarrow \mathbf {K} _{k}&=\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}\mathbf {S} _{k}^{-1}\end{aligned}}

ⓘ

Diese Verstärkung, die als optimale Kalman-Verstärkung bekannt ist, führt zu MMSE-Schätzungen, wenn sie verwendet wird. ⓘ

Vereinfachung der Formel für die posteriori-Fehlerkovarianz

Die Formel zur Berechnung der a posteriori Fehlerkovarianz kann vereinfacht werden, wenn die Kalman-Verstärkung gleich dem oben abgeleiteten optimalen Wert ist. Multipliziert man beide Seiten unserer Kalman-Verstärkungsformel auf der rechten Seite mit SkKk^T, so ergibt sich folgendes

\mathbf {K} _{k}\mathbf {S} _{k}\mathbf {K} _{k}^{\textsf {T}}=\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}\mathbf {K} _{k}^{\textsf {T}}

ⓘ

Wir kehren zu unserer erweiterten Formel für die a posteriori Fehlerkovarianz zurück,

\mathbf {P} _{k\mid k}=\mathbf {P} _{k\mid k-1}-\mathbf {K} _{k}\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}-\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}\mathbf {K} _{k}^{\textsf {T}}+\mathbf {K} _{k}\mathbf {S} _{k}\mathbf {K} _{k}^{\textsf {T}}

ⓘ

ergibt sich, dass sich die letzten beiden Terme aufheben, so dass

\mathbf {P} _{k\mid k}=\mathbf {P} _{k\mid k-1}-\mathbf {K} _{k}\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}=(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k})\mathbf {P} _{k\mid k-1}.

ⓘ

Diese Formel ist rechnerisch günstiger und wird daher in der Praxis fast immer verwendet, ist aber nur für die optimale Verstärkung korrekt. Wenn die arithmetische Genauigkeit ungewöhnlich niedrig ist, was zu Problemen mit der numerischen Stabilität führt, oder wenn bewusst eine nicht-optimale Kalman-Verstärkung verwendet wird, kann diese Vereinfachung nicht angewandt werden; dann muss die oben abgeleitete a posteriori Fehlerkovarianzformel (Joseph-Form) verwendet werden. ⓘ

Sensitivitätsanalyse

Die Gleichungen der Kalman-Filterung liefern einen Schätzwert für den Zustand ${\hat {\mathbf {x} }}_{k\mid k}$ und seiner Fehlerkovarianz $\mathbf {P} _{k\mid k}$ rekursiv. Der Schätzwert und seine Qualität hängen von den Systemparametern und den Rauschstatistiken ab, die dem Schätzer als Eingaben zugeführt werden. In diesem Abschnitt werden die Auswirkungen von Unsicherheiten in den statistischen Eingaben für den Filter analysiert. In Ermangelung zuverlässiger Statistiken oder der wahren Werte der Rauschkovarianzmatrizen $\mathbf {Q} _{k}$ und $\mathbf {R} _{k}$ liefert der Ausdruck

\mathbf {P} _{k\mid k}=\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)\mathbf {P} _{k\mid k-1}\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)^{\textsf {T}}+\mathbf {K} _{k}\mathbf {R} _{k}\mathbf {K} _{k}^{\textsf {T}}

ⓘ

nicht mehr die tatsächliche Fehlerkovarianz. Mit anderen Worten, $\mathbf {P} _{k\mid k}\neq E\left[\left(\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k}\right)\left(\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k}\right)^{\textsf {T}}\right]$ . In den meisten Echtzeitanwendungen unterscheiden sich die Kovarianzmatrizen, die beim Entwurf des Kalman-Filters verwendet werden, von den tatsächlichen (wahren) Rausch-Kovarianzmatrizen. Diese Sensitivitätsanalyse beschreibt das Verhalten der Kovarianz des Schätzfehlers, wenn sowohl die Rauschkovarianzen als auch die Systemmatrizen $\mathbf {F} _{k}$ und $\mathbf {H} _{k}$ die dem Filter als Eingaben zugeführt werden, falsch sind. Die Sensitivitätsanalyse beschreibt also die Robustheit (oder Empfindlichkeit) des Schätzers gegenüber falsch spezifizierten statistischen und parametrischen Eingaben in den Schätzer. ⓘ

Diese Diskussion beschränkt sich auf die Fehlerempfindlichkeitsanalyse für den Fall statistischer Unsicherheiten. Hier werden die tatsächlichen Kovarianzen des Rauschens mit $\mathbf {Q} _{k}^{a}$ und $\mathbf {R} _{k}^{a}$ bezeichnet, während die im Schätzer verwendeten Designwerte $\mathbf {Q} _{k}$ und $\mathbf {R} _{k}$ sind. Die tatsächliche Fehlerkovarianz wird bezeichnet mit $\mathbf {P} _{k\mid k}^{a}$ und $\mathbf {P} _{k\mid k}$ wie sie vom Kalman-Filter berechnet wird, wird als Riccati-Variable bezeichnet. Wenn $\mathbf {Q} _{k}\equiv \mathbf {Q} _{k}^{a}$ und $\mathbf {R} _{k}\equiv \mathbf {R} _{k}^{a}$ ist, bedeutet dies, dass $\mathbf {P} _{k\mid k}=\mathbf {P} _{k\mid k}^{a}$ . Bei der Berechnung der tatsächlichen Fehlerkovarianz mit $\mathbf {P} _{k\mid k}^{a}=E\left[\left(\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k}\right)\left(\mathbf {x} _{k}-{\hat {\mathbf {x} }}_{k\mid k}\right)^{\textsf {T}}\right]$ , ersetzt man durch ${\widehat {\mathbf {x} }}_{k\mid k}$ und unter Verwendung der Tatsache, dass $E\left[\mathbf {w} _{k}\mathbf {w} _{k}^{\textsf {T}}\right]=\mathbf {Q} _{k}^{a}$ und $E\left[\mathbf {v} _{k}\mathbf {v} _{k}^{\textsf {T}}\right]=\mathbf {R} _{k}^{a}$ führt zu den folgenden rekursiven Gleichungen für $\mathbf {P} _{k\mid k}^{a}$ :

\mathbf {P} _{k\mid k-1}^{a}=\mathbf {F} _{k}\mathbf {P} _{k-1\mid k-1}^{a}\mathbf {F} _{k}^{\textsf {T}}+\mathbf {Q} _{k}^{a}

ⓘ

und

\mathbf {P} _{k\mid k}^{a}=\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)\mathbf {P} _{k\mid k-1}^{a}\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)^{\textsf {T}}+\mathbf {K} _{k}\mathbf {R} _{k}^{a}\mathbf {K} _{k}^{\textsf {T}}

ⓘ

Während der Berechnung von $\mathbf {P} _{k\mid k}$ geht das Filter implizit davon aus, dass $E\left[\mathbf {w} _{k}\mathbf {w} _{k}^{\textsf {T}}\right]=\mathbf {Q} _{k}$ und $E\left[\mathbf {v} _{k}\mathbf {v} _{k}^{\textsf {T}}\right]=\mathbf {R} _{k}$ . Die rekursiven Ausdrücke für $\mathbf {P} _{k\mid k}^{a}$ und $\mathbf {P} _{k\mid k}$ sind identisch, abgesehen von dem Vorhandensein von $\mathbf {Q} _{k}^{a}$ und $\mathbf {R} _{k}^{a}$ anstelle der Entwurfswerte $\mathbf {Q} _{k}$ und $\mathbf {R} _{k}$ ersetzt. Es wurden Forschungen durchgeführt, um die Robustheit des Kalman-Filtersystems zu analysieren. ⓘ

Quadratwurzelform

Ein Problem mit dem Kalman-Filter ist seine numerische Stabilität. Wenn die Kovarianz des Prozessrauschens Qk klein ist, führt ein Rundungsfehler häufig dazu, dass ein kleiner positiver Eigenwert als negative Zahl berechnet wird. Dadurch wird die numerische Darstellung der Zustands-Kovarianzmatrix P unbestimmt, während ihre wahre Form positiv-definit ist. ⓘ

Positiv definite Matrizen haben die Eigenschaft, dass sie eine Quadratwurzel aus einer Dreiecksmatrix P = S-ST haben. Diese kann mit Hilfe des Cholesky-Faktorisierungsalgorithmus effizient berechnet werden. Noch wichtiger ist jedoch, dass die Kovarianz in dieser Form niemals eine negative Diagonale haben oder asymmetrisch werden kann. Eine äquivalente Form, die viele der für die Matrixwurzel erforderlichen Quadratwurzeloperationen vermeidet und dennoch die erwünschten numerischen Eigenschaften beibehält, ist die U-D-Zerlegungsform, P = U-D-UT, wobei U eine Einheitsdreiecksmatrix (mit Einheitsdiagonale) und D eine Diagonalmatrix ist. ⓘ

Die U-D-Faktorisierung benötigt die gleiche Menge an Speicherplatz und etwas weniger Rechenaufwand und ist die am häufigsten verwendete Quadratwurzelform. (Die frühe Literatur über die relative Effizienz ist etwas irreführend, da sie davon ausging, dass Quadratwurzeln viel zeitaufwändiger sind als Divisionen, während sie auf Computern des 21. Jahrhunderts nur geringfügig teurer sind). ⓘ

Effiziente Algorithmen für die Kalman-Vorhersage und die Aktualisierungsschritte in der Quadratwurzelform wurden von G. J. Bierman und C. L. Thornton entwickelt. ⓘ

Die L-D-LT-Zerlegung der Innovations-Kovarianzmatrix Sk ist die Grundlage für eine andere Art von numerisch effizientem und robustem Quadratwurzelfilter. Der Algorithmus beginnt mit der LU-Zerlegung, wie sie im Linear Algebra PACKage (LAPACK) implementiert ist. Diese Ergebnisse werden mit den Methoden von Golub und Van Loan (Algorithmus 4.1.2) für eine symmetrische, nichtsinguläre Matrix in die L-D-LT-Struktur integriert. Jede singuläre Kovarianzmatrix wird so gepivotet, dass die erste diagonale Partition nichtsingulär und wohlkonditioniert ist. Der Schwenkalgorithmus muss jeden Teil der Innovationskovarianzmatrix beibehalten, der direkt beobachteten Zustandsvariablen Hk-x_k|k-1 entspricht, die mit Hilfsbeobachtungen in yk verbunden sind. Der l-d-lt Quadratwurzelfilter erfordert eine Orthogonalisierung des Beobachtungsvektors. Dies kann mit der inversen Quadratwurzel der Kovarianzmatrix für die Hilfsvariablen unter Verwendung von Methode 2 in Higham (2002, S. 263) erfolgen. ⓘ

Parallele Form

Der Kalman-Filter ist effizient für die sequentielle Datenverarbeitung auf zentralen Verarbeitungseinheiten (CPUs), aber in seiner ursprünglichen Form ist er auf parallelen Architekturen wie Grafikverarbeitungseinheiten (GPUs) ineffizient. Es ist jedoch möglich, die Filter-Aktualisierungsroutine in Form eines assoziativen Operators auszudrücken, indem die Formulierung in Särkkä (2021) verwendet wird. Die Filterlösung kann dann mit Hilfe eines Präfix-Summen-Algorithmus abgerufen werden, der effizient auf GPUs implementiert werden kann. Dies reduziert die Berechnungskomplexität von $O(N)$ in der Anzahl der Zeitschritte auf $O(\log(N))$ . ⓘ

Beziehung zur rekursiven Bayes'schen Schätzung

Der Kalman-Filter kann als eines der einfachsten dynamischen Bayes'schen Netze dargestellt werden. Der Kalman-Filter berechnet Schätzungen der wahren Werte von Zuständen rekursiv über die Zeit anhand eingehender Messungen und eines mathematischen Prozessmodells. In ähnlicher Weise berechnet die rekursive Bayes'sche Schätzung die Schätzungen einer unbekannten Wahrscheinlichkeitsdichtefunktion (PDF) rekursiv über die Zeit unter Verwendung eingehender Messungen und eines mathematischen Prozessmodells. ⓘ

Bei der rekursiven Bayes'schen Schätzung wird der wahre Zustand als unbeobachteter Markov-Prozess angenommen, und die Messungen sind die beobachteten Zustände eines verborgenen Markov-Modells (HMM). ⓘ

Aufgrund der Markov-Annahme ist der wahre Zustand bedingt unabhängig von allen früheren Zuständen, wenn der unmittelbar vorhergehende Zustand gegeben ist.

p(\mathbf {x} _{k}\mid \mathbf {x} _{0},\dots ,\mathbf {x} _{k-1})=p(\mathbf {x} _{k}\mid \mathbf {x} _{k-1})

ⓘ

Ebenso hängt die Messung zum k-ten Zeitschritt nur vom aktuellen Zustand ab und ist in Anbetracht des aktuellen Zustands von allen anderen Zuständen bedingt unabhängig.

p(\mathbf {z} _{k}\mid \mathbf {x} _{0},\dots ,\mathbf {x} _{k})=p(\mathbf {z} _{k}\mid \mathbf {x} _{k})

ⓘ

Unter diesen Annahmen kann die Wahrscheinlichkeitsverteilung über alle Zustände des verborgenen Markov-Modells einfach wie folgt geschrieben werden:

p\left(\mathbf {x} _{0},\dots ,\mathbf {x} _{k},\mathbf {z} _{1},\dots ,\mathbf {z} _{k}\right)=p\left(\mathbf {x} _{0}\right)\prod _{i=1}^{k}p\left(\mathbf {z} _{i}\mid \mathbf {x} _{i}\right)p\left(\mathbf {x} _{i}\mid \mathbf {x} _{i-1}\right)

ⓘ

Wenn jedoch ein Kalman-Filter zur Schätzung des Zustands x verwendet wird, ist die Wahrscheinlichkeitsverteilung von Interesse, die mit den aktuellen Zuständen verbunden ist, bedingt durch die Messungen bis zum aktuellen Zeitschritt. Dies wird erreicht, indem die vorherigen Zustände ausgeklammert und durch die Wahrscheinlichkeit des Messwertsatzes dividiert werden. ⓘ

Dies führt dazu, dass die Vorhersage- und Aktualisierungsphasen des Kalman-Filters probabilistisch geschrieben werden. Die Wahrscheinlichkeitsverteilung für den vorhergesagten Zustand ist die Summe (das Integral) der Produkte aus der Wahrscheinlichkeitsverteilung für den Übergang vom (k - 1)-ten Zeitschritt zum k-ten und der Wahrscheinlichkeitsverteilung für den vorherigen Zustand über alle möglichen Zeitpunkte. $x_{k-1}$ . ⓘ

p\left(\mathbf {x} _{k}\mid \mathbf {Z} _{k-1}\right)=\int p\left(\mathbf {x} _{k}\mid \mathbf {x} _{k-1}\right)p\left(\mathbf {x} _{k-1}\mid \mathbf {Z} _{k-1}\right)\,d\mathbf {x} _{k-1}

ⓘ

Die Messreihe bis zum Zeitpunkt t ist

\mathbf {Z} _{t}=\left\{\mathbf {z} _{1},\dots ,\mathbf {z} _{t}\right\}

ⓘ

Die Wahrscheinlichkeitsverteilung der Aktualisierung ist proportional zum Produkt aus der Messwahrscheinlichkeit und dem vorhergesagten Zustand.

p\left(\mathbf {x} _{k}\mid \mathbf {Z} _{k}\right)={\frac {p\left(\mathbf {z} _{k}\mid \mathbf {x} _{k}\right)p\left(\mathbf {x} _{k}\mid \mathbf {Z} _{k-1}\right)}{p\left(\mathbf {z} _{k}\mid \mathbf {Z} _{k-1}\right)}}

ⓘ

Der Nenner

p\left(\mathbf {z} _{k}\mid \mathbf {Z} _{k-1}\right)=\int p\left(\mathbf {z} _{k}\mid \mathbf {x} _{k}\right)p\left(\mathbf {x} _{k}\mid \mathbf {Z} _{k-1}\right)\,d\mathbf {x} _{k}

ⓘ

ist ein Normalisierungsterm. ⓘ

Die übrigen Wahrscheinlichkeitsdichtefunktionen sind

{\begin{aligned}p\left(\mathbf {x} _{k}\mid \mathbf {x} _{k-1}\right)&={\mathcal {N}}\left(\mathbf {F} _{k}\mathbf {x} _{k-1},\mathbf {Q} _{k}\right)\\p\left(\mathbf {z} _{k}\mid \mathbf {x} _{k}\right)&={\mathcal {N}}\left(\mathbf {H} _{k}\mathbf {x} _{k},\mathbf {R} _{k}\right)\\p\left(\mathbf {x} _{k-1}\mid \mathbf {Z} _{k-1}\right)&={\mathcal {N}}\left({\hat {\mathbf {x} }}_{k-1},\mathbf {P} _{k-1}\right)\end{aligned}}

ⓘ

Die PDF des vorangegangenen Zeitschritts wird induktiv als der geschätzte Zustand und die Kovarianz angenommen. Dies ist gerechtfertigt, da der Kalman-Filter als optimaler Schätzer die Messungen am besten ausnutzt, so dass die PDF für $\mathbf {x} _{k}$ unter Berücksichtigung der Messungen $\mathbf {Z} _{k}$ die Kalman-Filter-Schätzung ist. ⓘ

Marginal Likelihood

Im Zusammenhang mit der oben beschriebenen rekursiven Bayes'schen Interpretation kann der Kalman-Filter als generatives Modell betrachtet werden, d. h. als ein Prozess zur Erzeugung eines Stroms zufälliger Beobachtungen z = (z₀, z₁, z₂, ...). Konkret sieht der Prozess so aus ⓘ

Stichprobe eines verborgenen Zustands $\mathbf {x} _{0}$ aus der Gaußschen Prioritätsverteilung $p\left(\mathbf {x} _{0}\right)={\mathcal {N}}\left({\hat {\mathbf {x} }}_{0\mid 0},\mathbf {P} _{0\mid 0}\right)$ .
Stichprobe einer Beobachtung $\mathbf {z} _{0}$ aus dem Beobachtungsmodell $p\left(\mathbf {z} _{0}\mid \mathbf {x} _{0}\right)={\mathcal {N}}\left(\mathbf {H} _{0}\mathbf {x} _{0},\mathbf {R} _{0}\right)$ .
Für $k=1,2,3,\ldots$ $k=1,2,3,\ldots$ , tun
1. Stichprobe des nächsten verborgenen Zustands $\mathbf {x} _{k}$ aus dem Übergangsmodell $p\left(\mathbf {x} _{k}\mid \mathbf {x} _{k-1}\right)={\mathcal {N}}\left(\mathbf {F} _{k}\mathbf {x} _{k-1}+\mathbf {B} _{k}\mathbf {u} _{k},\mathbf {Q} _{k}\right).$
2. Stichprobe einer Beobachtung $\mathbf {z} _{k}$ aus dem Beobachtungsmodell $p\left(\mathbf {z} _{k}\mid \mathbf {x} _{k}\right)={\mathcal {N}}\left(\mathbf {H} _{k}\mathbf {x} _{k},\mathbf {R} _{k}\right).$ ⓘ

Dieser Prozess hat die gleiche Struktur wie das verborgene Markov-Modell, mit der Ausnahme, dass der diskrete Zustand und die Beobachtungen durch kontinuierliche Variablen ersetzt werden, die aus Gaußschen Verteilungen abgetastet werden. ⓘ

In einigen Anwendungen ist es nützlich, die Wahrscheinlichkeit zu berechnen, dass ein Kalman-Filter mit einem gegebenen Satz von Parametern (Prioritätsverteilung, Übergangs- und Beobachtungsmodelle und Steuereingänge) ein bestimmtes beobachtetes Signal erzeugen würde. Diese Wahrscheinlichkeit wird als marginale Wahrscheinlichkeit bezeichnet, weil sie die Werte der verborgenen Zustandsvariablen integriert ("marginalisiert"), so dass sie nur unter Verwendung des beobachteten Signals berechnet werden kann. Die marginale Wahrscheinlichkeit kann nützlich sein, um verschiedene Parameterwahlen zu bewerten oder den Kalman-Filter mit anderen Modellen durch Bayes'schen Modellvergleich zu vergleichen. ⓘ

Die Berechnung der marginalen Likelihood als Nebeneffekt der rekursiven Filterberechnung ist einfach zu bewerkstelligen. Mit Hilfe der Kettenregel kann die Wahrscheinlichkeit als Produkt der Wahrscheinlichkeit jeder Beobachtung unter Berücksichtigung früherer Beobachtungen berechnet werden,

p(\mathbf {z} )=\prod _{k=0}^{T}p\left(\mathbf {z} _{k}\mid \mathbf {z} _{k-1},\ldots ,\mathbf {z} _{0}\right)

, ⓘ

und da der Kalman-Filter einen Markov-Prozess beschreibt, sind alle relevanten Informationen aus früheren Beobachtungen in der aktuellen Zustandsschätzung enthalten ${\hat {\mathbf {x} }}_{k\mid k-1},\mathbf {P} _{k\mid k-1}.$ Somit ist die marginale Wahrscheinlichkeit gegeben durch

{\begin{aligned}p(\mathbf {z} )&=\prod _{k=0}^{T}\int p\left(\mathbf {z} _{k}\mid \mathbf {x} _{k}\right)p\left(\mathbf {x} _{k}\mid \mathbf {z} _{k-1},\ldots ,\mathbf {z} _{0}\right)d\mathbf {x} _{k}\\&=\prod _{k=0}^{T}\int {\mathcal {N}}\left(\mathbf {z} _{k};\mathbf {H} _{k}\mathbf {x} _{k},\mathbf {R} _{k}\right){\mathcal {N}}\left(\mathbf {x} _{k};{\hat {\mathbf {x} }}_{k\mid k-1},\mathbf {P} _{k\mid k-1}\right)d\mathbf {x} _{k}\\&=\prod _{k=0}^{T}{\mathcal {N}}\left(\mathbf {z} _{k};\mathbf {H} _{k}{\hat {\mathbf {x} }}_{k\mid k-1},\mathbf {R} _{k}+\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}\right)\\&=\prod _{k=0}^{T}{\mathcal {N}}\left(\mathbf {z} _{k};\mathbf {H} _{k}{\hat {\mathbf {x} }}_{k\mid k-1},\mathbf {S} _{k}\right),\end{aligned}}

ⓘ

d. h. ein Produkt von Gaußschen Dichten, die jeweils der Dichte einer Beobachtung zk unter der aktuellen Filterverteilung entsprechen $\mathbf {H} _{k}{\hat {\mathbf {x} }}_{k\mid k-1},\mathbf {S} _{k}$ . Dies kann leicht als einfache rekursive Aktualisierung berechnet werden; um jedoch einen numerischen Unterlauf zu vermeiden, ist es in einer praktischen Implementierung in der Regel wünschenswert, stattdessen die logarithmische marginale Likelihood zu berechnen $\ell =\log p(\mathbf {z} )$ zu berechnen. Indem man die Konvention $\ell ^{(-1)}=0$ kann dies über die rekursive Aktualisierungsregel erfolgen

\ell ^{(k)}=\ell ^{(k-1)}-{\frac {1}{2}}\left({\tilde {\mathbf {y} }}_{k}^{\textsf {T}}\mathbf {S} _{k}^{-1}{\tilde {\mathbf {y} }}_{k}+\log \left|\mathbf {S} _{k}\right|+d_{y}\log 2\pi \right),

wobei $d_{y}$ ist die Dimension des Messvektors. ⓘ

Eine wichtige Anwendung, bei der eine solche (logarithmische) Wahrscheinlichkeit der Beobachtungen (bei gegebenen Filterparametern) verwendet wird, ist die Verfolgung mehrerer Ziele. Betrachten wir beispielsweise ein Objektverfolgungsszenario, bei dem ein Strom von Beobachtungen die Eingabe ist, jedoch nicht bekannt ist, wie viele Objekte sich in der Szene befinden (oder die Anzahl der Objekte bekannt ist, aber größer als eins ist). In einem solchen Szenario kann von vornherein nicht bekannt sein, welche Beobachtungen/Messungen von welchem Objekt erzeugt wurden. Ein Multiple-Hypothesis-Tracker (MHT) bildet in der Regel verschiedene Hypothesen für die Spurzuordnung, wobei jede Hypothese als Kalman-Filter (für den linearen Gauß-Fall) mit einem bestimmten Satz von Parametern betrachtet werden kann, die mit dem angenommenen Objekt verbunden sind. Daher ist es wichtig, die Wahrscheinlichkeit der Beobachtungen für die verschiedenen in Frage kommenden Hypothesen zu berechnen, damit die wahrscheinlichste Hypothese gefunden werden kann. ⓘ

Informationsfilter

Beim Informationsfilter oder inversen Kovarianzfilter werden die geschätzte Kovarianz und der geschätzte Zustand durch die Informationsmatrix bzw. den Informationsvektor ersetzt. Diese sind wie folgt definiert:

{\begin{aligned}\mathbf {Y} _{k\mid k}&=\mathbf {P} _{k\mid k}^{-1}\\{\hat {\mathbf {y} }}_{k\mid k}&=\mathbf {P} _{k\mid k}^{-1}{\hat {\mathbf {x} }}_{k\mid k}\end{aligned}}

ⓘ

In ähnlicher Weise haben die vorhergesagte Kovarianz und der Zustand äquivalente Informationsformen, definiert als:

{\begin{aligned}\mathbf {Y} _{k\mid k-1}&=\mathbf {P} _{k\mid k-1}^{-1}\\{\hat {\mathbf {y} }}_{k\mid k-1}&=\mathbf {P} _{k\mid k-1}^{-1}{\hat {\mathbf {x} }}_{k\mid k-1}\end{aligned}}

ⓘ

sowie die Messkovarianz und der Messvektor, die wie folgt definiert sind:

{\begin{aligned}\mathbf {I} _{k}&=\mathbf {H} _{k}^{\textsf {T}}\mathbf {R} _{k}^{-1}\mathbf {H} _{k}\\\mathbf {i} _{k}&=\mathbf {H} _{k}^{\textsf {T}}\mathbf {R} _{k}^{-1}\mathbf {z} _{k}\end{aligned}}

ⓘ

Die Informationsaktualisierung wird nun zu einer trivialen Summe.

{\begin{aligned}\mathbf {Y} _{k\mid k}&=\mathbf {Y} _{k\mid k-1}+\mathbf {I} _{k}\\{\hat {\mathbf {y} }}_{k\mid k}&={\hat {\mathbf {y} }}_{k\mid k-1}+\mathbf {i} _{k}\end{aligned}}

ⓘ

Der Hauptvorteil des Informationsfilters besteht darin, dass N Messungen in jedem Zeitschritt gefiltert werden können, indem ihre Informationsmatrizen und -vektoren einfach summiert werden.

{\begin{aligned}\mathbf {Y} _{k\mid k}&=\mathbf {Y} _{k\mid k-1}+\sum _{j=1}^{N}\mathbf {I} _{k,j}\\{\hat {\mathbf {y} }}_{k\mid k}&={\hat {\mathbf {y} }}_{k\mid k-1}+\sum _{j=1}^{N}\mathbf {i} _{k,j}\end{aligned}}

ⓘ

Zur Vorhersage des Informationsfilters können die Informationsmatrix und der Informationsvektor in ihre Zustandsraumäquivalente zurückverwandelt werden, oder es kann alternativ die Informationsraumvorhersage verwendet werden.

{\begin{aligned}\mathbf {M} _{k}&=\left[\mathbf {F} _{k}^{-1}\right]^{\textsf {T}}\mathbf {Y} _{k-1\mid k-1}\mathbf {F} _{k}^{-1}\\\mathbf {C} _{k}&=\mathbf {M} _{k}\left[\mathbf {M} _{k}+\mathbf {Q} _{k}^{-1}\right]^{-1}\\\mathbf {L} _{k}&=\mathbf {I} -\mathbf {C} _{k}\\\mathbf {Y} _{k\mid k-1}&=\mathbf {L} _{k}\mathbf {M} _{k}\mathbf {L} _{k}^{\textsf {T}}+\mathbf {C} _{k}\mathbf {Q} _{k}^{-1}\mathbf {C} _{k}^{\textsf {T}}\\{\hat {\mathbf {y} }}_{k\mid k-1}&=\mathbf {L} _{k}\left[\mathbf {F} _{k}^{-1}\right]^{\textsf {T}}{\hat {\mathbf {y} }}_{k-1\mid k-1}\end{aligned}}

ⓘ

Wenn F und Q zeitinvariant sind, können diese Werte zwischengespeichert werden, und F und Q müssen invertierbar sein. ⓘ

Glättungsfaktor mit fester Verzögerung

Die optimale Glättungsfunktion mit fester Verzögerung liefert die optimale Schätzung von ${\hat {\mathbf {x} }}_{k-N\mid k}$ für eine gegebene feste Verzögerung $N$ unter Verwendung der Messungen von $\mathbf {z} _{1}$ bis $\mathbf {z} _{k}$ . Er kann unter Verwendung der vorherigen Theorie über einen erweiterten Zustand abgeleitet werden, und die Hauptgleichung des Filters lautet wie folgt:

{\begin{bmatrix}{\hat {\mathbf {x} }}_{t\mid t}\\{\hat {\mathbf {x} }}_{t-1\mid t}\\\vdots \\{\hat {\mathbf {x} }}_{t-N+1\mid t}\\\end{bmatrix}}={\begin{bmatrix}\mathbf {I} \\0\\\vdots \\0\\\end{bmatrix}}{\hat {\mathbf {x} }}_{t\mid t-1}+{\begin{bmatrix}0&\ldots &0\\\mathbf {I} &0&\vdots \\\vdots &\ddots &\vdots \\0&\ldots &\mathbf {I} \\\end{bmatrix}}{\begin{bmatrix}{\hat {\mathbf {x} }}_{t-1\mid t-1}\\{\hat {\mathbf {x} }}_{t-2\mid t-1}\\\vdots \\{\hat {\mathbf {x} }}_{t-N+1\mid t-1}\\\end{bmatrix}}+{\begin{bmatrix}\mathbf {K} ^{(0)}\\\mathbf {K} ^{(1)}\\\vdots \\\mathbf {K} ^{(N-1)}\\\end{bmatrix}}\mathbf {y} _{t\mid t-1}

ⓘ

wobei:

${\hat {\mathbf {x} }}_{t\mid t-1}$ mittels eines Standard-Kalman-Filters geschätzt wird;
$\mathbf {y} _{t\mid t-1}=\mathbf {z} _{t}-\mathbf {H} {\hat {\mathbf {x} }}_{t\mid t-1}$ die Innovation ist, die sich unter Berücksichtigung der Schätzung des Standard-Kalman-Filters ergibt;
die verschiedenen ${\hat {\mathbf {x} }}_{t-i\mid t}$ mit $i=1,\ldots ,N-1$ sind neue Variablen, d.h. sie erscheinen nicht im Standard-Kalman-Filter;
die Gewinne werden nach dem folgenden Schema berechnet:
$\mathbf {K} ^{(i+1)}=\mathbf {P} ^{(i)}\mathbf {H} ^{\textsf {T}}\left[\mathbf {H} \mathbf {P} \mathbf {H} ^{\textsf {T}}+\mathbf {R} \right]^{-1}$

und

\mathbf {P} ^{(i)}=\mathbf {P} \left[\left(\mathbf {F} -\mathbf {K} \mathbf {H} \right)^{\textsf {T}}\right]^{i}

wobei

\mathbf {P}

und

\mathbf {K}

sind die Kovarianz des Vorhersagefehlers und die Verstärkungen des Standard-Kalman-Filters (d.h.,

\mathbf {P} _{t\mid t-1}

). ⓘ

Wenn die Kovarianz des Schätzfehlers so definiert ist, dass

\mathbf {P} _{i}:=E\left[\left(\mathbf {x} _{t-i}-{\hat {\mathbf {x} }}_{t-i\mid t}\right)^{*}\left(\mathbf {x} _{t-i}-{\hat {\mathbf {x} }}_{t-i\mid t}\right)\mid z_{1}\ldots z_{t}\right],

ⓘ

dann ergibt sich, dass die Verbesserung der Schätzung von $\mathbf {x} _{t-i}$ gegeben ist durch:

\mathbf {P} -\mathbf {P} _{i}=\sum _{j=0}^{i}\left[\mathbf {P} ^{(j)}\mathbf {H} ^{\textsf {T}}\left(\mathbf {H} \mathbf {P} \mathbf {H} ^{\textsf {T}}+\mathbf {R} \right)^{-1}\mathbf {H} \left(\mathbf {P} ^{(i)}\right)^{\textsf {T}}\right]

ⓘ

Glätter mit festem Intervall

Die optimale Festintervallglättung liefert die optimale Schätzung von ${\hat {\mathbf {x} }}_{k\mid n}$ ( $k<n$ ) unter Verwendung der Messungen aus einem festen Intervall $\mathbf {z} _{1}$ bis $\mathbf {z} _{n}$ . Dies wird auch als "Kalman-Glättung" bezeichnet. Es gibt mehrere gebräuchliche Glättungsalgorithmen. ⓘ

Rauch-Tung-Striebel

Der Rauch-Tung-Striebel (RTS)-Glättungsalgorithmus ist ein effizienter Algorithmus mit zwei Durchgängen zur Glättung von festen Intervallen. ⓘ

Der Vorwärtsdurchlauf ist derselbe wie beim regulären Kalman-Filter-Algorithmus. Diese gefilterten a-priori und a-posteriori Zustandsschätzungen ${\hat {\mathbf {x} }}_{k\mid k-1}$ , ${\hat {\mathbf {x} }}_{k\mid k}$ und Kovarianzen $\mathbf {P} _{k\mid k-1}$ , $\mathbf {P} _{k\mid k}$ werden zur Verwendung im Rückwärtsdurchlauf (für die Retrodiktion) gespeichert. ⓘ

Im rückwärtigen Durchlauf werden die geglätteten Zustandsschätzungen berechnet ${\hat {\mathbf {x} }}_{k\mid n}$ und Kovarianzen $\mathbf {P} _{k\mid n}$ . Wir beginnen mit dem letzten Zeitschritt und gehen zeitlich rückwärts unter Verwendung der folgenden rekursiven Gleichungen vor:

{\begin{aligned}{\hat {\mathbf {x} }}_{k\mid n}&={\hat {\mathbf {x} }}_{k\mid k}+\mathbf {C} _{k}\left({\hat {\mathbf {x} }}_{k+1\mid n}-{\hat {\mathbf {x} }}_{k+1\mid k}\right)\\\mathbf {P} _{k\mid n}&=\mathbf {P} _{k\mid k}+\mathbf {C} _{k}\left(\mathbf {P} _{k+1\mid n}-\mathbf {P} _{k+1\mid k}\right)\mathbf {C} _{k}^{\textsf {T}}\end{aligned}}

ⓘ

wobei

\mathbf {C} _{k}=\mathbf {P} _{k\mid k}\mathbf {F} _{k+1}^{\textsf {T}}\mathbf {P} _{k+1\mid k}^{-1}.

ⓘ

$\mathbf {x} _{k\mid k}$ ist die a-posteriori Zustandsschätzung des Zeitschritts $k$ und $\mathbf {x} _{k+1\mid k}$ ist die a-priori-Zustandsschätzung des Zeitschritts $k+1$ . Die gleiche Notation gilt für die Kovarianz. ⓘ

Modifizierte Bryson-Frazier-Glättung

Eine Alternative zum RTS-Algorithmus ist die von Bierman entwickelte modifizierte Bryson-Frazier-Glättung (MBF) mit festen Intervallen. Dieser verwendet ebenfalls einen Rückwärtsdurchlauf, der die vom Kalman-Filter-Vorwärtsdurchlauf gespeicherten Daten verarbeitet. Die Gleichungen für den Rückwärtsdurchlauf beinhalten die rekursive Die Gleichungen für den Rückwärtsdurchlauf beinhalten die rekursive Berechnung von Daten, die zu jedem Beobachtungszeitpunkt verwendet werden, um den geglätteten Zustand und die Kovarianz zu berechnen. ⓘ

Die rekursiven Gleichungen lauten

{\begin{aligned}{\tilde {\Lambda }}_{k}&=\mathbf {H} _{k}^{\textsf {T}}\mathbf {S} _{k}^{-1}\mathbf {H} _{k}+{\hat {\mathbf {C} }}_{k}^{\textsf {T}}{\hat {\Lambda }}_{k}{\hat {\mathbf {C} }}_{k}\\{\hat {\Lambda }}_{k-1}&=\mathbf {F} _{k}^{\textsf {T}}{\tilde {\Lambda }}_{k}\mathbf {F} _{k}\\{\hat {\Lambda }}_{n}&=0\\{\tilde {\lambda }}_{k}&=-\mathbf {H} _{k}^{\textsf {T}}\mathbf {S} _{k}^{-1}\mathbf {y} _{k}+{\hat {\mathbf {C} }}_{k}^{\textsf {T}}{\hat {\lambda }}_{k}\\{\hat {\lambda }}_{k-1}&=\mathbf {F} _{k}^{\textsf {T}}{\tilde {\lambda }}_{k}\\{\hat {\lambda }}_{n}&=0\end{aligned}}

ⓘ

wobei $\mathbf {S} _{k}$ ist die Restkovarianz und ${\hat {\mathbf {C} }}_{k}=\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}$ . Der geglättete Zustand und die Kovarianz können dann durch Substitution in die Gleichungen

{\begin{aligned}\mathbf {P} _{k\mid n}&=\mathbf {P} _{k\mid k}-\mathbf {P} _{k\mid k}{\hat {\Lambda }}_{k}\mathbf {P} _{k\mid k}\\\mathbf {x} _{k\mid n}&=\mathbf {x} _{k\mid k}-\mathbf {P} _{k\mid k}{\hat {\lambda }}_{k}\end{aligned}}

ⓘ

oder

{\begin{aligned}\mathbf {P} _{k\mid n}&=\mathbf {P} _{k\mid k-1}-\mathbf {P} _{k\mid k-1}{\tilde {\Lambda }}_{k}\mathbf {P} _{k\mid k-1}\\\mathbf {x} _{k\mid n}&=\mathbf {x} _{k\mid k-1}-\mathbf {P} _{k\mid k-1}{\tilde {\lambda }}_{k}.\end{aligned}}

ⓘ

Ein wichtiger Vorteil der MBF ist, dass es nicht erforderlich ist, die Inverse der Kovarianzmatrix zu finden. ⓘ

Minimum-Varianz-Glättung

Mit der Minimum-Varianz-Glättung kann die bestmögliche Fehlerleistung erzielt werden, vorausgesetzt, die Modelle sind linear, ihre Parameter und die Rauschstatistiken sind genau bekannt. Dieser Glätter ist eine zeitvariable Zustandsraumverallgemeinerung des optimalen nicht-kausalen Wiener Filters. ⓘ

Die Glättungsberechnungen werden in zwei Durchgängen durchgeführt. Die Vorwärtsberechnungen beinhalten eine Ein-Schritt-Vorausberechnung und sind gegeben durch

{\begin{aligned}{\hat {\mathbf {x} }}_{k+1\mid k}&=(\mathbf {F} _{k}-\mathbf {K} _{k}\mathbf {H} _{k}){\hat {\mathbf {x} }}_{k\mid k-1}+\mathbf {K} _{k}\mathbf {z} _{k}\\\alpha _{k}&=-\mathbf {S} _{k}^{-{\frac {1}{2}}}\mathbf {H} _{k}{\hat {\mathbf {x} }}_{k\mid k-1}+\mathbf {S} _{k}^{-{\frac {1}{2}}}\mathbf {z} _{k}\end{aligned}}

ⓘ

Das obige System ist bekannt als der inverse Wiener-Hopf-Faktor. Die Rückwärtsrekursion ist der Adjungierte des obigen Vorwärtssystems. Das Ergebnis der Rückwärtsrekursion $\beta _{k}$ kann berechnet werden, indem die Vorwärtsgleichungen mit dem zeitlich umgekehrten $\alpha _{k}$ und die Zeitumkehrung des Ergebnisses. Im Falle der Output-Schätzung ist die geglättete Schätzung gegeben durch

{\hat {\mathbf {y} }}_{k\mid N}=\mathbf {z} _{k}-\mathbf {R} _{k}\beta _{k}

ⓘ

Nimmt man den kausalen Teil dieser Minimum-Varianz-Glättung, so erhält man

{\hat {\mathbf {y} }}_{k\mid k}=\mathbf {z} _{k}-\mathbf {R} _{k}\mathbf {S} _{k}^{-{\frac {1}{2}}}\alpha _{k}

ⓘ

was mit dem Kalman-Filter mit minimaler Varianz identisch ist. Die obigen Lösungen minimieren die Varianz des Ausgangsschätzungsfehlers. Man beachte, dass die Rauch-Tung-Striebel-Glättungsableitung davon ausgeht, dass die zugrundeliegenden Verteilungen gaußförmig sind, während dies bei den Lösungen mit minimaler Varianz nicht der Fall ist. Optimale Glättungen für Zustands- und Eingangsschätzungen können auf ähnliche Weise konstruiert werden. ⓘ

Eine zeitkontinuierliche Version der obigen Glättung wird in beschrieben. ⓘ

Erwartungsmaximierungsalgorithmen können eingesetzt werden, um annähernde Maximum-Likelihood-Schätzungen unbekannter Zustandsraumparameter in Minimum-Varianz-Filtern und -Glättungen zu berechnen. Oftmals verbleiben Ungewissheiten innerhalb der Problemannahmen. Eine Glättung, die Unsicherheiten berücksichtigt, kann durch Hinzufügen eines positiv definiten Terms zur Riccati-Gleichung entworfen werden. ⓘ

In Fällen, in denen die Modelle nichtlinear sind, können schrittweise Linearisierungen in den Rekursionen des Minimum-Varianz-Filters und des Glätters enthalten sein (erweiterte Kalman-Filterung). ⓘ

Frequenzbewertete Kalman-Filter

In den 1930er Jahren führten Fletcher und Munson bahnbrechende Forschungen über die Wahrnehmung von Geräuschen bei verschiedenen Frequenzen durch. Ihre Arbeit führte zu einer Standardmethode zur Gewichtung gemessener Schallpegel bei Untersuchungen von Industrielärm und Hörverlust. Seitdem werden Frequenzbewertungen bei der Entwicklung von Filtern und Reglern verwendet, um die Leistung innerhalb der gewünschten Frequenzbereiche zu steuern. ⓘ

In der Regel wird eine Frequenzformungsfunktion verwendet, um die durchschnittliche Leistung der Fehlerspektraldichte in einem bestimmten Frequenzband zu gewichten. Sei $\mathbf {y} -{\hat {\mathbf {y} }}$ den Ausgangsschätzungsfehler eines herkömmlichen Kalman-Filters bezeichnen. Außerdem sei $\mathbf {W}$ eine kausale Frequenzbewertungsübertragungsfunktion bezeichnen. Die optimale Lösung zur Minimierung der Varianz von $\mathbf {W} \left(\mathbf {y} -{\hat {\mathbf {y} }}\right)$ minimiert, ergibt sich durch einfaches Konstruieren von $\mathbf {W} ^{-1}{\hat {\mathbf {y} }}$ . ⓘ

Der Entwurf von $\mathbf {W}$ bleibt eine offene Frage. Eine Möglichkeit des Vorgehens besteht darin, ein System zu identifizieren, das den Schätzfehler erzeugt, und die $\mathbf {W}$ gleich dem Kehrwert dieses Systems zu setzen. Dieses Verfahren kann wiederholt werden, um eine Verbesserung des mittleren quadratischen Fehlers um den Preis einer höheren Filterordnung zu erreichen. Die gleiche Technik kann auf Glättungsfilter angewandt werden. ⓘ

Nichtlineare Filter

Der grundlegende Kalman-Filter ist auf eine lineare Annahme beschränkt. Komplexere Systeme können jedoch nichtlinear sein. Die Nichtlinearität kann entweder mit dem Prozessmodell oder mit dem Beobachtungsmodell oder mit beiden verbunden sein. ⓘ

Die gebräuchlichsten Varianten von Kalman-Filtern für nichtlineare Systeme sind der Erweiterte Kalman-Filter und der Unscented Kalman-Filter. Die Eignung des zu verwendenden Filters hängt von den Nichtlinearitätsindizes des Prozess- und des Beobachtungsmodells ab. ⓘ

Erweiterter Kalman-Filter

Beim erweiterten Kalman-Filter (EKF) müssen die Zustandsübergangs- und Beobachtungsmodelle keine linearen Funktionen des Zustands sein, sondern können stattdessen nichtlineare Funktionen sein. Diese Funktionen sind vom differenzierbaren Typ.

{\begin{aligned}\mathbf {x} _{k}&=f(\mathbf {x} _{k-1},\mathbf {u} _{k})+\mathbf {w} _{k}\\\mathbf {z} _{k}&=h(\mathbf {x} _{k})+\mathbf {v} _{k}\end{aligned}}

ⓘ

Die Funktion f kann verwendet werden, um den vorausgesagten Zustand aus der vorherigen Schätzung zu berechnen, und die Funktion h kann verwendet werden, um die vorausgesagte Messung aus dem vorausgesagten Zustand zu berechnen. Allerdings können f und h nicht direkt auf die Kovarianz angewendet werden. Stattdessen wird eine Matrix von partiellen Ableitungen (die Jacobi-Matrix) berechnet. ⓘ

Bei jedem Zeitschritt wird die Jacobimatrix mit den aktuellen vorhergesagten Zuständen ausgewertet. Diese Matrizen können in den Gleichungen des Kalman-Filters verwendet werden. Durch diesen Prozess wird die nichtlineare Funktion im Wesentlichen um die aktuelle Schätzung linearisiert. ⓘ

Unscented Kalman-Filter

Wenn die Zustandsübergangs- und Beobachtungsmodelle, d. h. die Vorhersage- und Aktualisierungsfunktionen $f$ und $h$ hochgradig nichtlinear sind, kann der erweiterte Kalman-Filter besonders schlechte Ergebnisse liefern. Dies liegt daran, dass die Kovarianz durch Linearisierung des zugrunde liegenden nichtlinearen Modells propagiert wird. Der unscented Kalman-Filter (UKF) verwendet eine deterministische Abtasttechnik, die als unscented transformation (UT) bekannt ist, um eine minimale Menge von Abtastpunkten (so genannte Sigma-Punkte) um den Mittelwert herum auszuwählen. Die Sigma-Punkte werden dann durch die nichtlinearen Funktionen propagiert, aus denen dann eine neue Mittelwert- und Kovarianzschätzung gebildet wird. Der resultierende Filter hängt davon ab, wie die transformierte Statistik des UT berechnet wird und welcher Satz von Sigma-Punkten verwendet wird. Es ist anzumerken, dass es immer möglich ist, neue UKFs auf konsistente Weise zu konstruieren. Für bestimmte Systeme schätzt die resultierende UKF den wahren Mittelwert und die Kovarianz genauer. Dies kann durch Monte-Carlo-Stichproben oder Taylorreihenerweiterung der posterioren Statistiken überprüft werden. Außerdem erübrigt sich durch diese Technik die explizite Berechnung von Jakobianern, die bei komplexen Funktionen eine schwierige Aufgabe sein kann (d. h. sie erfordert komplizierte Ableitungen, wenn sie analytisch durchgeführt wird, oder ist rechenintensiv, wenn sie numerisch durchgeführt wird), wenn nicht sogar unmöglich (wenn diese Funktionen nicht differenzierbar sind). ⓘ

Sigma-Punkte

Für einen Zufallsvektor $\mathbf {x} =(x_{1},\dots ,x_{L})$ sind Sigma-Punkte eine beliebige Menge von Vektoren

\{\mathbf {s} _{0},\dots ,\mathbf {s} _{N}\}={\bigl \{}{\begin{pmatrix}s_{0,1}&s_{0,2}&\ldots &s_{0,L}\end{pmatrix}},\dots ,{\begin{pmatrix}s_{N,1}&s_{N,2}&\ldots &s_{N,L}\end{pmatrix}}{\bigr \}}

zugewiesen mit ⓘ

Gewichten erster Ordnung $W_{0}^{a},\dots ,W_{N}^{a}$ die folgende Bedingungen erfüllen

$\sum _{j=0}^{N}W_{j}^{a}=1$
für alle $i=1,\dots ,L$ : $E[x_{i}]=\sum _{j=0}^{N}W_{j}^{a}s_{j,i}$

Gewichte zweiter Ordnung $W_{0}^{c},\dots ,W_{N}^{c}$ die folgende Bedingungen erfüllen

$\sum _{j=0}^{N}W_{j}^{c}=1$
für alle Paare $(i,l)\in \{1,\dots ,L\}^{2}:E[x_{i}x_{l}]=\sum _{j=0}^{N}W_{j}^{c}s_{j,i}s_{j,l}$ . ⓘ

Eine einfache Wahl von Sigma-Punkten und Gewichten für $\mathbf {x} _{k-1\mid k-1}$ im UKF-Algorithmus ist

{\begin{aligned}\mathbf {s} _{0}&={\hat {\mathbf {x} }}_{k-1\mid k-1}\\-1&<W_{0}^{a}=W_{0}^{c}<1\\\mathbf {s} _{j}&={\hat {\mathbf {x} }}_{k-1\mid k-1}+{\sqrt {\frac {L}{1-W_{0}}}}\mathbf {A} _{j},\quad j=1,\dots ,L\\\mathbf {s} _{L+j}&={\hat {\mathbf {x} }}_{k-1\mid k-1}-{\sqrt {\frac {L}{1-W_{0}}}}\mathbf {A} _{j},\quad j=1,\dots ,L\\W_{j}^{a}&=W_{j}^{c}={\frac {1-W_{0}}{2L}},\quad j=1,\dots ,2L\end{aligned}}

wobei ${\hat {\mathbf {x} }}_{k-1\mid k-1}$ ist die mittlere Schätzung von $\mathbf {x} _{k-1\mid k-1}$ . Der Vektor $\mathbf {A} _{j}$ ist die j-te Spalte von $\mathbf {A}$ wobei $\mathbf {P} _{k-1\mid k-1}=\mathbf {AA} ^{\textsf {T}}$ . Typischerweise, $\mathbf {A}$ durch Cholesky-Zerlegung von $\mathbf {P} _{k-1\mid k-1}$ . Mit einiger Sorgfalt können die Filtergleichungen so ausgedrückt werden, dass $\mathbf {A}$ direkt ausgewertet wird, ohne Zwischenberechnungen von $\mathbf {P} _{k-1\mid k-1}$ . Dies wird als unsensierter Kalman-Filter mit Quadratwurzel bezeichnet. ⓘ

Die Gewichtung des Mittelwertes, $W_{0}$ kann willkürlich gewählt werden. ⓘ

Eine weitere beliebte Parametrisierung (die die obige verallgemeinert) ist

{\begin{aligned}\mathbf {s} _{0}&={\hat {\mathbf {x} }}_{k-1\mid k-1}\\W_{0}^{a}&={\frac {\alpha ^{2}\kappa -L}{\alpha ^{2}\kappa }}\\W_{0}^{c}&=W_{0}^{a}+1-\alpha ^{2}+\beta \\\mathbf {s} _{j}&={\hat {\mathbf {x} }}_{k-1\mid k-1}+\alpha {\sqrt {\kappa }}\mathbf {A} _{j},\quad j=1,\dots ,L\\\mathbf {s} _{L+j}&={\hat {\mathbf {x} }}_{k-1\mid k-1}-\alpha {\sqrt {\kappa }}\mathbf {A} _{j},\quad j=1,\dots ,L\\W_{j}^{a}&=W_{j}^{c}={\frac {1}{2\alpha ^{2}\kappa }},\quad j=1,\dots ,2L.\end{aligned}}

ⓘ

$\alpha$ und $\kappa$ steuert die Streuung der Sigma-Punkte. $\beta$ steht im Zusammenhang mit der Verteilung von $x$ . ⓘ

Geeignete Werte hängen vom jeweiligen Problem ab, aber eine typische Empfehlung ist $\alpha =10^{-3}$ , $\kappa =1$ und $\beta =2$ . Allerdings ist ein größerer Wert von $\alpha$ (z.B., $\alpha =1$ ) kann jedoch von Vorteil sein, um die Streuung der Verteilung und mögliche Nichtlinearitäten besser zu erfassen. Wenn die wahre Verteilung von $x$ gaußförmig ist, $\beta =2$ optimal. ⓘ

Vorhersage

Wie bei der EKF kann die UKF-Vorhersage unabhängig von der UKF-Aktualisierung in Kombination mit einer linearen (oder auch EKF-) Aktualisierung verwendet werden oder umgekehrt. ⓘ

Bei gegebenen Schätzungen von Mittelwert und Kovarianz, ${\hat {\mathbf {x} }}_{k-1\mid k-1}$ und $\mathbf {P} _{k-1\mid k-1}$ erhält man $N=2L+1$ Sigma-Punkte, wie im obigen Abschnitt beschrieben. Die Sigma-Punkte werden durch die Übergangsfunktion f propagiert.

\mathbf {x} _{j}=f\left(\mathbf {s} _{j}\right)\quad j=0,\dots ,2L

. ⓘ

Die propagierten Sigma-Punkte werden gewichtet, um den vorhergesagten Mittelwert und die Kovarianz zu erhalten.

{\begin{aligned}{\hat {\mathbf {x} }}_{k\mid k-1}&=\sum _{j=0}^{2L}W_{j}^{a}\mathbf {x} _{j}\\\mathbf {P} _{k\mid k-1}&=\sum _{j=0}^{2L}W_{j}^{c}\left(\mathbf {x} _{j}-{\hat {\mathbf {x} }}_{k\mid k-1}\right)\left(\mathbf {x} _{j}-{\hat {\mathbf {x} }}_{k\mid k-1}\right)^{\textsf {T}}+\mathbf {Q} _{k}\end{aligned}}

wobei $W_{j}^{a}$ sind die Gewichte erster Ordnung der ursprünglichen Sigma-Punkte, und $W_{j}^{c}$ sind die Gewichte zweiter Ordnung. Die Matrix $\mathbf {Q} _{k}$ ist die Kovarianz des Übergangsrauschens, $\mathbf {w} _{k}$ . ⓘ

Aktualisieren

Bei gegebenen Vorhersageschätzungen ${\hat {\mathbf {x} }}_{k\mid k-1}$ und $\mathbf {P} _{k\mid k-1}$ eine neue Menge von $N=2L+1$ Sigma-Punkten $\mathbf {s} _{0},\dots ,\mathbf {s} _{2L}$ mit entsprechenden Gewichten erster Ordnung $W_{0}^{a},\dots W_{2L}^{a}$ und Gewichten zweiter Ordnung $W_{0}^{c},\dots ,W_{2L}^{c}$ wird berechnet. Diese Sigma-Punkte werden durch die Messfunktion $h$ .

\mathbf {z} _{j}=h(\mathbf {s} _{j}),\,\,j=0,1,\dots ,2L

. ⓘ

Anschließend werden der empirische Mittelwert und die Kovarianz der transformierten Punkte berechnet.

{\begin{aligned}{\hat {\mathbf {z} }}&=\sum _{j=0}^{2L}W_{j}^{a}\mathbf {z} _{j}\\[6pt]{\hat {\mathbf {S} }}_{k}&=\sum _{j=0}^{2L}W_{j}^{c}(\mathbf {z} _{j}-{\hat {\mathbf {z} }})(\mathbf {z} _{j}-{\hat {\mathbf {z} }})^{\textsf {T}}+\mathbf {R} _{k}\end{aligned}}

wobei $\mathbf {R} _{k}$ ist die Kovarianzmatrix des Beobachtungsrauschens, $\mathbf {v} _{k}$ . Zusätzlich wird auch die Kreuzkovarianzmatrix benötigt

{\begin{aligned}\mathbf {C_{xz}} &=\sum _{j=0}^{2L}W_{j}^{c}(\mathbf {x} _{j}-{\hat {\mathbf {x} }}_{k|k-1})(\mathbf {z} _{j}-{\hat {\mathbf {z} }})^{\textsf {T}}.\end{aligned}}

ⓘ

Die Kalman-Verstärkung ist

{\begin{aligned}\mathbf {K} _{k}=\mathbf {C_{xz}} {\hat {\mathbf {S} }}_{k}^{-1}.\end{aligned}}

ⓘ

Die aktualisierten Mittelwert- und Kovarianzschätzungen sind

{\begin{aligned}{\hat {\mathbf {x} }}_{k\mid k}&={\hat {\mathbf {x} }}_{k|k-1}+\mathbf {K} _{k}(\mathbf {z} _{k}-{\hat {\mathbf {z} }})\\\mathbf {P} _{k\mid k}&=\mathbf {P} _{k\mid k-1}-\mathbf {K} _{k}{\hat {\mathbf {S} }}_{k}\mathbf {K} _{k}^{\textsf {T}}.\end{aligned}}

ⓘ

Unterscheidender Kalman-Filter

Wenn das Beobachtungsmodell $p(\mathbf {z} _{k}\mid \mathbf {x} _{k})$ stark nicht-linear und/oder nicht-Gauß'sch ist, kann es sich als vorteilhaft erweisen, die Bayes'sche Regel anzuwenden und zu schätzen

p(\mathbf {z} _{k}\mid \mathbf {x} _{k})\approx {\frac {p(\mathbf {x} _{k}\mid \mathbf {z} _{k})}{p(\mathbf {x} _{k})}}

wobei $p(\mathbf {x} _{k}\mid \mathbf {z} _{k})\approx {\mathcal {N}}(g(\mathbf {z} _{k}),Q(\mathbf {z} _{k}))$ für nichtlineare Funktionen $g,Q$ . Dadurch wird die generative Spezifikation des Standard-Kalman-Filters durch ein diskriminatives Modell für die latenten Zustände bei gegebenen Beobachtungen ersetzt. ⓘ

Unter einem stationären Zustandsmodell

{\begin{aligned}p(\mathbf {x} _{1})&={\mathcal {N}}(0,\mathbf {T} ),\\p(\mathbf {x} _{k}\mid \mathbf {x} _{k-1})&={\mathcal {N}}(\mathbf {F} \mathbf {x} _{k-1},\mathbf {C} ),\end{aligned}}

wobei $\mathbf {T} =\mathbf {F} \mathbf {T} \mathbf {F} ^{\intercal }+\mathbf {C}$ wenn

p(\mathbf {x} _{k}\mid \mathbf {z} _{1:k})\approx {\mathcal {N}}({\hat {\mathbf {x} }}_{k|k-1},\mathbf {P} _{k|k-1}),

dann folgt aus einer neuen Beobachtung $\mathbf {z} _{k}$ folgt, dass

p(\mathbf {x} _{k+1}\mid \mathbf {z} _{1:k+1})\approx {\mathcal {N}}({\hat {\mathbf {x} }}_{k+1|k},\mathbf {P} _{k+1|k})

wobei

{\begin{aligned}\mathbf {M} _{k+1}&=\mathbf {F} \mathbf {P} _{k|k-1}\mathbf {F} ^{\intercal }+\mathbf {C} ,\\\mathbf {P} _{k+1|k}&=(\mathbf {M} _{k+1}^{-1}+Q(\mathbf {z} _{k})^{-1}-\mathbf {T} ^{-1})^{-1},\\{\hat {\mathbf {x} }}_{k+1|k}&=\mathbf {P} _{k+1|k}(\mathbf {M} _{k+1}^{-1}\mathbf {F} {\hat {\mathbf {x} }}_{k|k-1}+\mathbf {P} _{k+1|k}^{-1}g(\mathbf {z} _{k})).\end{aligned}}

Man beachte, dass diese Approximation Folgendes erfordert $Q(\mathbf {z} _{k})^{-1}-\mathbf {T} ^{-1}$ positiv-definit sein; ist dies nicht der Fall, so wird

\mathbf {P} _{k+1|k}=(\mathbf {M} _{k+1}^{-1}+Q(\mathbf {z} _{k})^{-1})^{-1}

stattdessen verwendet wird. Ein solcher Ansatz erweist sich als besonders nützlich, wenn die Dimensionalität der Beobachtungen viel größer ist als die der latenten Zustände, und es können Filter erstellt werden, die besonders robust gegenüber Nichtstationaritäten im Beobachtungsmodell sind. ⓘ

Adaptive Kalman-Filter

Adaptive Kalman-Filter ermöglichen die Anpassung an Prozessdynamiken, die nicht im Prozessmodell modelliert sind, was z. B. bei einem manövrierenden Ziel der Fall ist, wenn ein Kalman-Filter reduzierter Ordnung zur Verfolgung eingesetzt wird. ⓘ

Kalman-Bucy-Filter

Das Kalman-Bucy-Filter (benannt nach Richard Snowden Bucy) ist eine zeitkontinuierliche Version des Kalman-Filters. ⓘ

Er basiert auf dem Zustandsraummodell

{\begin{aligned}{\frac {d}{dt}}\mathbf {x} (t)&=\mathbf {F} (t)\mathbf {x} (t)+\mathbf {B} (t)\mathbf {u} (t)+\mathbf {w} (t)\\\mathbf {z} (t)&=\mathbf {H} (t)\mathbf {x} (t)+\mathbf {v} (t)\end{aligned}}

ⓘ

wobei $\mathbf {Q} (t)$ und $\mathbf {R} (t)$ stellen die Intensitäten (oder genauer: die Power Spectral Density - PSD - Matrizen) der beiden weißen Rauschterme $\mathbf {w} (t)$ und $\mathbf {v} (t)$ dar. ⓘ

Der Filter besteht aus zwei Differentialgleichungen, eine für die Zustandsschätzung und eine für die Kovarianz:

{\begin{aligned}{\frac {d}{dt}}{\hat {\mathbf {x} }}(t)&=\mathbf {F} (t){\hat {\mathbf {x} }}(t)+\mathbf {B} (t)\mathbf {u} (t)+\mathbf {K} (t)\left(\mathbf {z} (t)-\mathbf {H} (t){\hat {\mathbf {x} }}(t)\right)\\{\frac {d}{dt}}\mathbf {P} (t)&=\mathbf {F} (t)\mathbf {P} (t)+\mathbf {P} (t)\mathbf {F} ^{\textsf {T}}(t)+\mathbf {Q} (t)-\mathbf {K} (t)\mathbf {R} (t)\mathbf {K} ^{\textsf {T}}(t)\end{aligned}}

ⓘ

wobei die Kalman-Verstärkung gegeben ist durch

\mathbf {K} (t)=\mathbf {P} (t)\mathbf {H} ^{\textsf {T}}(t)\mathbf {R} ^{-1}(t)

ⓘ

Man beachte, dass in diesem Ausdruck für $\mathbf {K} (t)$ die Kovarianz des Beobachtungsrauschens $\mathbf {R} (t)$ gleichzeitig die Kovarianz des Vorhersagefehlers (oder der Innovation) darstellt ${\tilde {\mathbf {y} }}(t)=\mathbf {z} (t)-\mathbf {H} (t){\hat {\mathbf {x} }}(t)$ Diese Kovarianzen sind nur im Falle einer kontinuierlichen Zeit gleich. ⓘ

Die Unterscheidung zwischen den Vorhersage- und Aktualisierungsschritten der zeitdiskreten Kalman-Filterung gibt es in der kontinuierlichen Zeit nicht. ⓘ

Die zweite Differentialgleichung, für die Kovarianz, ist ein Beispiel für eine Riccati-Gleichung. Zu den nichtlinearen Verallgemeinerungen der Kalman-Bucy-Filter gehört der erweiterte Kalman-Filter mit kontinuierlicher Zeit. ⓘ

Hybrider Kalman-Filter

Die meisten physikalischen Systeme werden als zeitkontinuierliche Modelle dargestellt, während für die Zustandsschätzung über einen Digitalprozessor häufig zeitdiskrete Messungen vorgenommen werden. Daher sind das Systemmodell und das Messmodell gegeben durch

{\begin{aligned}{\dot {\mathbf {x} }}(t)&=\mathbf {F} (t)\mathbf {x} (t)+\mathbf {B} (t)\mathbf {u} (t)+\mathbf {w} (t),&\mathbf {w} (t)&\sim N\left(\mathbf {0} ,\mathbf {Q} (t)\right)\\\mathbf {z} _{k}&=\mathbf {H} _{k}\mathbf {x} _{k}+\mathbf {v} _{k},&\mathbf {v} _{k}&\sim N(\mathbf {0} ,\mathbf {R} _{k})\end{aligned}}

ⓘ

wobei

\mathbf {x} _{k}=\mathbf {x} (t_{k})

. ⓘ

Initialisieren

{\hat {\mathbf {x} }}_{0\mid 0}=E\left[\mathbf {x} (t_{0})\right],\mathbf {P} _{0\mid 0}=\operatorname {Var} \left[\mathbf {x} \left(t_{0}\right)\right]

ⓘ

Vorhersage

{\begin{aligned}{\dot {\hat {\mathbf {x} }}}(t)&=\mathbf {F} (t){\hat {\mathbf {x} }}(t)+\mathbf {B} (t)\mathbf {u} (t){\text{, with }}{\hat {\mathbf {x} }}\left(t_{k-1}\right)={\hat {\mathbf {x} }}_{k-1\mid k-1}\\\Rightarrow {\hat {\mathbf {x} }}_{k\mid k-1}&={\hat {\mathbf {x} }}\left(t_{k}\right)\\{\dot {\mathbf {P} }}(t)&=\mathbf {F} (t)\mathbf {P} (t)+\mathbf {P} (t)\mathbf {F} (t)^{\textsf {T}}+\mathbf {Q} (t){\text{, with }}\mathbf {P} \left(t_{k-1}\right)=\mathbf {P} _{k-1\mid k-1}\\\Rightarrow \mathbf {P} _{k\mid k-1}&=\mathbf {P} \left(t_{k}\right)\end{aligned}}

ⓘ

Die Vorhersagegleichungen werden von denen des zeitkontinuierlichen Kalman-Filters ohne Aktualisierung durch Messungen abgeleitet, d.h., $\mathbf {K} (t)=0$ . Der vorhergesagte Zustand und die Kovarianz werden jeweils durch Lösen einer Reihe von Differentialgleichungen berechnet, wobei der Anfangswert gleich der Schätzung im vorherigen Schritt ist. ⓘ

Für den Fall linearer zeitinvarianter Systeme kann die zeitkontinuierliche Dynamik mit Hilfe von Matrixexponentialen exakt in ein zeitdiskretes System diskretisiert werden. ⓘ

Aktualisieren

{\begin{aligned}\mathbf {K} _{k}&=\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}\left(\mathbf {H} _{k}\mathbf {P} _{k\mid k-1}\mathbf {H} _{k}^{\textsf {T}}+\mathbf {R} _{k}\right)^{-1}\\{\hat {\mathbf {x} }}_{k\mid k}&={\hat {\mathbf {x} }}_{k\mid k-1}+\mathbf {K} _{k}\left(\mathbf {z} _{k}-\mathbf {H} _{k}{\hat {\mathbf {x} }}_{k\mid k-1}\right)\\\mathbf {P} _{k\mid k}&=\left(\mathbf {I} -\mathbf {K} _{k}\mathbf {H} _{k}\right)\mathbf {P} _{k\mid k-1}\end{aligned}}

ⓘ

Die Aktualisierungsgleichungen sind identisch mit denen des zeitdiskreten Kalman-Filters. ⓘ

Varianten für die Rückgewinnung spärlicher Signale

Der traditionelle Kalman-Filter wurde auch für die Rückgewinnung von spärlichen, möglicherweise dynamischen Signalen aus verrauschten Beobachtungen verwendet. In neueren Arbeiten werden Begriffe aus der Theorie des Compressed Sensing/Sampling, wie die eingeschränkte Isometrieeigenschaft und damit verbundene probabilistische Rückgewinnungsargumente, zur sequentiellen Schätzung des spärlichen Zustands in an sich niedrigdimensionalen Systemen verwendet. ⓘ

Beziehung zu Gaußschen Prozessen

Da lineare Gaußsche Zustandsraummodelle zu Gaußschen Prozessen führen, können Kalman-Filter als sequentielle Löser für die Regression von Gaußschen Prozessen betrachtet werden. ⓘ

Anwendungen

Fluglage- und Kursreferenzsysteme
Autopilot
Schätzung des Ladezustands elektrischer Batterien (SoC)
Gehirn-Computer-Schnittstellen
Chaotische Signale
Verfolgung und Scheitelpunktanpassung von geladenen Teilchen in Teilchendetektoren
Verfolgung von Objekten in der Computer Vision
Dynamische Positionierung in der Schifffahrt
Wirtschaftswissenschaften, insbesondere Makroökonomie, Zeitreihenanalyse und Ökonometrie
Inertiales Leitsystem
Nuklearmedizin - Bildwiederherstellung bei der Einzelphotonen-Emissions-Computertomographie
Bestimmung der Umlaufbahn
Schätzung des Zustands von Energiesystemen
Radar-Tracker
Satellitennavigationssysteme
Seismologie
Sensorlose Steuerung von AC-Motorantrieben mit variabler Frequenz
Gleichzeitige Lokalisierung und Kartierung
Sprachverbesserung
Visuelle Odometrie
Wettervorhersage
Navigationssystem
3D-Modellierung
Strukturelle Gesundheitsüberwachung
Menschliche sensomotorische Verarbeitung ⓘ

Grundlagen

Mathematische Grundidee

Die Besonderheit, die das Kalmanfilter von einfachen Filtern wie etwa dem gleitenden Mittelwert unterscheidet und deutlich leistungsfähiger macht, ist die Beschreibung des Schätzwertes durch mehrdimensionale Normalverteilungen. Diese repräsentieren nicht nur Wahrscheinlichkeitsverteilungen möglicher Fehler um jeden Schätzwert, sondern auch Korrelationen zwischen Schätzfehlern unterschiedlicher Variablen. Mit dieser Information werden in jedem Zeitschritt die bisherigen Schätzwerte mit den neuen Messungen auf optimale Weise kombiniert, so dass verbleibende Fehler des Filterzustands schnellstmöglich minimiert werden. Der momentane Filterzustand aus Schätzwerten, Fehlerschätzungen und Korrelationen bildet dabei eine Art Gedächtnis für die gesamte bisher gewonnene Information aus vergangenen Messwerten. Nach jeder neuen Messung verbessert das Kalmanfilter die bisherigen Schätzwerte und aktualisiert die zugehörigen Fehlerschätzungen und Korrelationen. ⓘ

In dynamischen Systemen, in denen neben den eigentlichen Werten z. B. auch Geschwindigkeiten oder Beschleunigungen geschätzt werden, schätzt das Kalmanfilter entsprechend auch Korrelationen zwischen den Fehlern dieser Größen und nutzt dieses Wissen in Kombination mit den bekannten dynamischen Zusammenhängen für eine optimale Fehlerunterdrückung. ⓘ

Theoretische Einordnung

Im Rahmen der mathematischen Schätztheorie spricht man beim Kalman-Filter auch von einem bayesschen Minimum-Varianz-Schätzer für lineare stochastische Systeme in Zustandsraumdarstellung. In der Ingenieurstechnik wird das Kalman-Filter auch als Optimalfilter für lineare stochastische Systeme bezeichnet. Siehe auch Bayesscher Filter. ⓘ

Im Gegensatz zu den klassischen FIR- und IIR-Filtern der Signal- und Zeitreihenanalyse basiert das Kalman-Filter auf einer Zustandsraummodellierung, bei der explizit zwischen der Dynamik des Systemzustands und dem Prozess seiner Messung unterschieden wird. In seinem Zeitverhalten ist er ein IIR-Filter mit einer Verzögerungsstufe. ⓘ

Das Filterproblem

Eine in der Praxis ausgeführte Messung ergibt pro Zeitpunkt häufig lediglich eine einzelne Realisierung z_k der normalverteilten Zufallsgröße Z_k. Nun stellt sich das inverse Problem, nämlich anhand der Informationen einer Messreihe mit den Werten z₁, z₂, z₃, z₄, … auf die entsprechenden X₁, X₂, X₃, X₄, … rückschließen zu können. Da die gesuchten Zustände aufgrund der Linearität des Modells und der gemachten Voraussetzungen für die Rauschterme w und v für alle Zeiten normalverteilt bleiben und eine Normalverteilung durch ihren Mittelwert und Kovarianz vollständig beschrieben wird, beschränkt sich das Filterproblem auf die Schätzung dieser beiden Bestimmungsstücke. Eine mögliche exakte Lösung dieses inversen Problems ist das zeitdiskrete Kalman-Filter, ein Satz von Gleichungen also, der Schätzungen für den Mittelwert ${\textbf {x}}_{k}$ und die Kovarianz ${\textbf {P}}_{k}$ des Zustands ⓘ

{\textbf {X}}_{k}\sim {\mathcal {N}}({\textbf {x}}_{k},{\textbf {P}}_{k})

ⓘ

anhand der aus der Messreihe z_k, z_k-1, z_k-2, …, z₁ extrahierten Informationen liefert. ⓘ

Häufig stellt sich die Aufgabe, das Filterproblem auch für zeitkontinuierliche Systeme zu lösen. Dabei gehen die Differenzengleichungen des Zustandsraummodells durch eine mathematische Grenzwertbildung in Differentialgleichungen über. Die Gleichungen des zeitkontinuierlichen Kalman-Filters ergeben sich entsprechend aus dem zeitdiskreten Filter durch Anwendung derselben Grenzwertbildung. Aus diesem Grund und im Sinne einer verständlichen Darstellung soll im Folgenden lediglich auf die Gleichungen des zeitdiskreten Filters eingegangen werden. ⓘ

Initialisierung

Der iterative Ansatz des Kalmanfilters verlangt eine a-prior-Schätzung als Startbedingung. Häufig verwendet man ⓘ

{\textbf {X}}_{0}\sim {\mathcal {N}}({\textbf {0}},\sigma ^{2}\cdot {\textbf {I}})

ⓘ

mit der Identitätsmatrix I und einer geeigneten Varianz $\sigma ^{2}$ , wenn der Wertebereich der zu schätzenden Größe etwa im Bereich $0\pm \sigma ^{2}$ erwartet wird. ⓘ

Anwendbarkeit

Die bei der Herleitung des Kalman-Filters gemachten Voraussetzungen können in der Praxis oft nur näherungsweise erfüllt werden. So ist in vielen Fällen die exakte Struktur der linearen Zustands- und Beobachtungsgleichung unbekannt oder zu umfangreich, als dass sie im Rahmen des Kalman-Filters rechentechnisch handhabbar wäre. Der Anwender muss demnach eine Einschränkung der zu verwendenden Modellklassen vornehmen. Die damit verbundenen Ungenauigkeiten führen häufig zu einem vom Optimalen abweichendem, divergenten Verhalten des Filters. Daher sind vor dem Einsatz Untersuchungen zur Abhängigkeit der Schätzergebnisse von den Modellierungsfehlern (und deren Kompensation) im Rahmen einer Sensitivitätsanalyse notwendig. ⓘ

Zu einer weiteren Einschränkung der Schätzgüte führen die durch den Einsatz digitaler Rechentechnik verursachten Rundungsfehler. Analog zu den Modellungenauigkeiten können diese zu einer drastischen Divergenz des Kalman-Filters führen. Abhilfe schaffen hier algebraische Umformulierungen (Faktorisierungen) der Kovarianzmatrizen, jedoch um den Preis erhöhten rechentechnischen Aufwandes. Die bekanntesten numerisch stabilen Varianten des Kalman-Filters sind die Wurzelimplementierung nach Potter et al. und deren Verfeinerung in Form des Bierman-Thornton-UD-Algorithmus (wobei $U$ eine obere Dreiecksmatrix und $D$ eine Diagonalmatrix darstellen). ⓘ