aboutsummaryrefslogtreecommitdiffstats
path: root/buch/papers/erdbeben/teil1.tex
diff options
context:
space:
mode:
Diffstat (limited to 'buch/papers/erdbeben/teil1.tex')
-rw-r--r--buch/papers/erdbeben/teil1.tex173
1 files changed, 90 insertions, 83 deletions
diff --git a/buch/papers/erdbeben/teil1.tex b/buch/papers/erdbeben/teil1.tex
index 6c334bf..014b53e 100644
--- a/buch/papers/erdbeben/teil1.tex
+++ b/buch/papers/erdbeben/teil1.tex
@@ -14,15 +14,20 @@
\rhead{Kalman-Filter}
\section{Kalman-Filter}
-Interessante Grösse ist also Integral von Überlagerung zweier Kräfte.
-Wir brauchen also dir zweite Ableitung von der Messung , ohne deren Eigendynamik.
+Die interessante Grösse ist also das Integral der Überlagerung zweier Kräfte.
+Wir brauchen also die zweite Ableitung der Messung, ohne deren Eigendynamik.
Da wir die äussere Kraft nicht direkt messen können, benötigen wir ein Werkzeug, welches aus der gemessenen Position, die Krafteinwirkung auf unsere System schätzt.
Dies ist eine typische Anwendung für das Kalman-Filter.
+
+Das Filter schätzt den Zustand eines Systems anhand von Messungen und kann den nächsten Zustand errechnen und aus dieser Schätzung auch eine erwartete Messung herleiten.
+Die für das Filter relevante Grösse ist dann nicht mehr die eigentliche Messung, sondern die Differenz aus Messung und Erwartung, da diese Differenz, die Innovation, eine Aussage über die nicht-deterministischen, externen Einflüsse auf das System ermöglicht.
+Das Filter berücksichtigt dazu nicht nur die Messung und den Zustand, sondern auch die Unsicherheiten dieser beiden Grössen, welche als Parameter in das Modell des Systems einfliessen.
+
Unser Ziel ist es, anhand der Messung die eigentlich interessante Grösse $f$ zu bestimmen.
-Dabei wird durch eine deterministische Vorhersage, in dem der Zustand * Eigendynamik des Systems gerechnet.
+Dabei wird durch eine deterministische Vorhersage, in dem der Zustand mit der Eigendynamik des Systems multipliziert wird.
Die Idee dahinter ist, dass das Kalman-Filter die nicht-deterministische Grösse $f$ anhand der Messung und der Vorhersage zu bestimmen.
-Für mehrere Dimensionen (x,y,z) würde der Pythagoras für das System benötigt werden.
+Für mehrere Dimensionen (x,y,z) würde der Satz von Pythagoras für das System benötigt.
Da sich der Pythagoras bekanntlich nicht linear verhält, kann kein lineares Kalman-Filter implementiert werden.
Da das Kalman-Filter besonders effektiv und einfach für lineare Abläufe geeignet ist, würde eine zweidimensionale Betrachtung den Rahmen dieser Arbeit sprengen.
Einfachheitshalber beschränken wir uns auf den linearen Fall, da dadurch die wesentlichen Punkte bereits aufgezeigt werden.
@@ -30,8 +35,7 @@ Für ein nicht-lineares System werden Extended Kalman-Filter benötigt, bei dene
\subsection{Geschichte}
Das Kalman-Filter wurde 1960 von Rudolf Emil Kalman entdeckt und direkt von der NASA für die Appollo Mission benutzt.
-Das Filter kommt mit wenig Rechenleistung aus und war somit dafür geeignet die Rakete bei der Navigation zu unterstützen.
-Das Filter schätzt den Zustand eines Systems anhand von Messungen und kann den nächsten Zustand errechnen. Eine typische Anwendungen des Kalman-Filters ist Glättung von verrauschten Daten und die Schätzung von Parametern. Dies kommt heutzutage in jedem Satellit, Navigationssystem, Smartphones und Videospielen vor.
+Das Filter kommt mit wenig Rechenleistung aus und war somit dafür geeignet die Rakete bei der Navigation zu unterstützen. Eine typische Anwendungen des Kalman-Filters ist Glättung von verrauschten Daten und die Schätzung von Parametern. Dies kommt heutzutage in jedem Satellit, Navigationssystem, Smartphones und Videospielen vor.
\subsection{Wahrscheinlichkeit}
Das Kalman-Filter schätzt den wahrscheinlichsten Wert zwischen Normalverteilungen.
@@ -62,11 +66,14 @@ und der Messung:
{y_2}(x;{\mu_2},{\sigma_2})=\frac{1}{\sqrt{2\pi\sigma_2^2}}\quad e^{-\frac{(x-{\mu_2})^2}{2{\sigma_2}^2}}.
\]
Diesen werden nun multipliziert und durch deren Fläche geteilt um sie wieder zu normieren, $\odot$ beschreibt dabei die Multiplikation und die Normierung auf den Flächeninhalt eins :
-\begin{align*} {y_f}(x; {\mu_f}, {\sigma_f}) = {y_1}(x;{ \mu_1},{ \sigma_1}) \odot {y_2}(x; {\mu_2}, {\sigma_2})
+\begin{align*}
+ {y_f}(x; {\mu_f}, {\sigma_f}) = {y_1}(x;{ \mu_1},{ \sigma_1}) \odot {y_2}(x; {\mu_2}, {\sigma_2})
&=
\frac{1}{\sqrt{2\pi\sigma_1^2}}\quad e^{-\frac{(x-{\mu_1})^2}{2{\sigma_1}^2}} \odot \frac{1}{\sqrt{2\pi\sigma_2^2}}\quad e^{-\frac{(x-{\mu_2})^2}{2{\sigma_2}^2}}
\\
- &= \frac{ \frac{1}{\sqrt{2\pi\sigma_1^2}}e^{-\frac{(x-{\mu_1})^2}{2{\sigma_1}^2}} \cdot \frac{1}{\sqrt{2\pi\sigma_2^2}}e^{-\frac{(x-{\mu_2})^2}{2{\sigma_2}^2}}}{\int {y_1} {y_2} dx}. \end{align*}
+ &=
+ \frac{ \frac{1}{\sqrt{2\pi\sigma_1^2}}e^{-\frac{(x-{\mu_1})^2}{2{\sigma_1}^2}} \cdot \frac{1}{\sqrt{2\pi\sigma_2^2}}e^{-\frac{(x-{\mu_2})^2}{2{\sigma_2}^2}}}{\int {y_1} {y_2} dx}.
+\end{align*}
Diese Kombination der beiden Verteilungen resultiert wiederum in einer Normalverteilung
mit Erwartungswert
\[ \mu_f = \frac{\mu_1\sigma_2^2 + \mu_2 \sigma_1^2}{\sigma_1^2 + \sigma_2^2} \]
@@ -94,6 +101,78 @@ Da wir nun ein Werkzeug besitzen, dass die Beschleunigung, welche auf das Gehäu
Um den Kalman Filter zu starten, müssen gewisse Bedingungen definiert werden.
In diesem Abschnitt werden die einzelnen Parameter und Matrizen erklärt und erläutert, wofür sie nützlich sind.
+\subsection{Fiter-Agorithmus}
+Nachdem alle Parameter aufgestellt sind, wird das Filter initialisiert.
+Zuerst wird der nächste Zustand der Masse vorhergesagt, danach wird die Messung präzisiert und laufend aktualisiert.
+Das Filter berechnet aufgrund der aktuellen Schätzung eine Vorhersage.
+Diese wird, sobald verfügbar, mit der Messung verglichen.
+Aus dieser Differenz und den Unsicherheiten des Prozesses ($Q$) und der Messung ($R$) wird der wahrscheinlichste, neue Zustand geschätzt.
+Dabei muss genau auf den Index geachtet werden. Nach dem Artikel~\cite{erdbeben:wikipedia} ist die Indexierung so genormt:
+Der Zeitschritt wird mit $k$ definiert, $k-1$ ist somit ein Zeitschritt vor $k$.
+Auf der linken Seite von | wird der aktuelle Zustand verlangt, bzw. ausgegeben, auf der rechten Seiten den bisherigen Zustand.
+Dies bedeutet, dass die Notation $x_{n|m}$ die Schätzung von $x$ zum Zeitpunkt $n$ bis und mit zur Zeitpunkt $m \leq \ n$ präsentiert.
+
+\subsubsection*{Vorhersage}
+Im Filterschritt Vorhersage wird der nächste Zustand anhand des Anfangszustand und der Systemmatrix berechnet.
+Dies funktioniert mit dem Rechenschritt:
+\[
+{x_{k|k-1}}=\Phi{x_{k-1|k-1}}= \exp(A\Delta t){x_{k-1|k-1}}.
+\]
+Die Kovarianz $P_{k|k-1}$ wird ebenfalls neu berechnet. Zudem kommt noch die Prozessunsicherheit $Q$ dazu, so dass die Unsicherheit des Anfangsfehlers $P$ laufend verändert.
+Dies funktioniert durch multiplizieren der Systemmatrix mit dem aktualisierten Anfangsfehler.
+Dazu wird noch die Prozessunsicherheit addiert, somit entsteht die Gleichung
+\[
+{P_{k|k-1}}=\Phi {P_{k-1|k-1}} {\Phi _{k}}^T + {Q_{k-1}}.
+\]
+Es vergeht genau $\Delta t$ Zeit, und dieser Vorgang wird wiederholt.
+Das hochgestellte T bezeichnet die transponierte Matrix.
+Dabei wird in den späteren Schritten überprüft, wie genau die letzte Anpassung von $P$ zur Messung stimmt.
+Ist der Unterschied klein, wird die Kovarianz $P$ kleiner, ist der Unterschied gross, wird auch die Kovarianz grösser.
+Das Filter passt sich selber an und korrigiert sich bei grosser Abweichung.
+
+\subsubsection*{Messen}
+Der Sensor wurde noch nicht benutz, doch genau der liefert Werte für das Filter.
+Die aktuellen Messwerte $z$ werden die Innovation $w$ mit dem Zustandsvektor $x$ und der Messmatrix $H$ zusammengerechnet.
+Hier bei wird lediglich die Messung mit dem Fehler behaftet, und die Messmatrix $H$ mit der Vorhersage multipliziert.
+\[
+{w_{k}}={z_{k}}-{H}{x_{k|k-1}}.
+\]
+Die Innovation ist der Teil der Messung, die nicht durch die Systemdynamik erklärt werden kann.
+Die Hilfsgröße Innovation beschreibt, wie genau die Vorhersage den aktuellen Messwert mittels der Systemmatrix $\Phi$ beschreiben kann.
+Für eine schlechte Vorhersage wird die dazugehörige Innovation gross, für eine genaue Vorhersage dagegen klein sein.
+Entsprechende Korrekturen müssen dann gross bzw. nur gering ausfallen.
+Innovation = Messung - Vorhersage. Dies leuchtet ein, eine Innovation von 0 bedeutet, dass die Messung nichts Neues hervorbrachte.
+
+Im nächsten Schritt wir analysiert, mit welcher Kovarianz weiter gerechnet wird.
+Hierbei wird die Unsicherheit $P$, die Messmatrix $H$ und die Messunsicherheit $R$ miteinander verrechnet.
+\[
+{S_{k}}={H}{P_{k|k-1}}{H}^T+{R_{k}}
+\]
+
+\subsubsection*{Aktualisieren}
+Im nächsten Schritt kommt nun die Wahrscheinlichkeit dazu.
+\[{K_{k}}= {P_{k|k-1}} {H^T}{S_{k}^{-1}}\]
+Die Grösse $K$ wird Kalman-Gain genannt.
+Das Kalman-Gain gibt dem Zustand die Gewichtung, bzw. wie die Vorhersage auf den Zustand passt.
+Vereinfacht gesagt: Es wird das das Verhältnis zwischen der Unsicherheit der Vorhersage $P_k$ zu der zugehörigen Messunsicherheit $R_k$ gebildet.
+In unserem Fall wird werden die Elemente der Kalman-Matrix vorweg berechnet, da das Kalman-Gain ohne Messungen auskommt.
+
+Anhand der Informationen aus der Innovation wird das Kalman-Gain $K$ gebildet. Dabei beschreibt das Kalman-Gain die Wirkung der Innovation auf den geschätzten Zustand. So wird das System aktualisiert.
+\[
+{x_{k|k}}={x_{k|k-1}}+{K_{k}}{w_{k}}
+\]
+Dabei wird der Unterschied zwischen dem erwarteten, errechneten, Zustand und dem gemessenen Zustand berechnet.
+
+Dazu kommt eine neue Kovarianz für den nächste Vorhersageschritt:
+\[
+{P_{k|k}}=(I-{K_{k}}{H}){P_{k|k-1}}
+\]
+Der ganze Algorithmus und beginnt wieder mit der Vorhersage
+\[
+{x_{k|k-1}}=\Phi{x_{k-1|k-1}}= \exp(A\Delta t){x_{k|k-1}}.
+\]
+
+
\subsection{Anfangsbedingungen}
\subsubsection*{Anfangszustand $x$}
Das Filter benötigt eine Anfangsbedingung.
@@ -141,14 +220,14 @@ A = \left(
\end{array}\right)
\]
Dabei soll der Kalman-Filter in diskreten Zeitschritten $\Delta t$ arbeiten.
+$A$ beschreibt ein kontinuierliches System ($\dot x = Ax$), wir benötigen jedoch ein Zeit-diskretes System $x_{k+1} = \Phi x_k$.
Die Übergangs-Matrix erhalten wir aus der Systemdynamikmatrix mittels Exponentialfunktion:
\[\Phi = \exp(A\Delta t). \]
Die Matrix $\Phi$ beschreibt die Übergänge zwischen zeitlich aufeinanderfolgenden Zuständen $x_{k-1}$ und $x_{k}$
\subsubsection*{Prozessrauschkovarianzmatrix $Q$}
Die Prozessrauschmatrix teilt dem Filter mit, wie sich der Prozess verändert.
-Kalman-Filter berücksichtigen Unsicherheiten wie Messfehler und -rauschen.
-In der Matrix $Q$ geht es jedoch um die Unsicherheit, die der Prozess mit sich bringt.
+Die Matrix $Q$ beschreibt die Unsicherheit, die der Prozess mit sich bringt.
Bei unserem Modell könnte das beispielsweise ein Windstoss an die Masse sein oder auch die Ungenauigkeiten im Modell, wie die Annahme das dich die Kraft nicht ändert.
Für uns wäre dies:
\[
@@ -160,11 +239,10 @@ Q = \left(
\end{array}\right)
\]
Die Standabweichungen müssten statistisch ermittelt werden, da der Fehler nicht vom Sensor kommt und somit nicht vom Hersteller gegeben ist.
-Das Bedeutet wiederum dass $Q$ die Unsicherheit des Prozesses beschreibt und nicht die der Messung.
\subsubsection*{Messmatrix $H$}
Die Messmatrix gibt an, welche Parameter gemessen werden.
-$H$ ist die Gleichung die für die Vorhersage der Messung.
+$H$ ist die Matrix für die Vorhersage der Messung.
In unserem Falle ist es die Position der Massen.
\[
H = (1, 0, 0)
@@ -179,77 +257,6 @@ R= ({\sigma_\mathrm{sensor}}^2).
Diese Messrauchen wird meistens vom Sensorhersteller angegeben.
Für unsere theoretische Apparatur wird hier ein kleiner Fehler eingesetzt da heutige Sensoren sehr genau messen können.
-\subsection{Fiter-Agorithmus}
-Nachdem alle Parameter aufgestellt sind, wird das Filter initialisiert.
-Zuerst wird der nächste Zustand der Masse vorhergesagt, danach wird die Messung präzisiert und laufend aktualisiert.
-Das Filter berechnet aufgrund der aktuellen Schätzung eine Vorhersage.
-Diese wird, sobald verfügbar, mit der Messung verglichen.
-Aus dieser Differenz und den Unsicherheiten des Prozesses ($Q$) und der Messung ($R$) wird der wahrscheinlichste, neue Zustand geschätzt.
-Dabei muss genau auf den Index geachtet werden. Nach dem Artikel~\cite{erdbeben:wikipedia} ist die Indexierung so genormt:
-Der Zeitschritt wird mit $k$ definiert, $k-1$ ist somit ein Zeitschritt vor $k$.
-Auf der linken Seite von | wird der aktuelle Zustand verlangt, bzw. ausgegeben, auf der rechten Seiten den bisherigen Zustand.
-Dies bedeutet, dass die Notation $x_{n|m}$ die Schätzung von $x$ zum Zeitpunkt $n$ bis und mit zur Zeitpunkt $m \leq \ n$ präsentiert.
-
-\subsubsection*{Vorhersage}
-Im Filterschritt Vorhersage wird der nächste Zustand anhand des Anfangszustand und der Systemmatrix berechnet.
-Dies funktioniert mit dem Rechenschritt:
-\[
-{x_{k|k-1}}=\Phi{x_{k-1|k-1}}= \exp(A\Delta t){x_{k-1|k-1}}.
-\]
-Die Kovarianz $P_{k|k-1}$ wird ebenfalls neu berechnet. Zudem kommt noch die Prozessunsicherheit $Q$ dazu, so dass die Unsicherheit des Anfangsfehlers $P$ laufend verändert.
-Dies funktioniert durch multiplizieren der Systemmatrix mit dem aktualisierten Anfangsfehler.
-Dazu wird noch die Prozessunsicherheit addiert, somit entsteht die Gleichung
-\[
-{P_{k|k-1}}=\Phi {P_{k-1|k-1}} {\Phi _{k}}^T + {Q_{k-1}}.
-\]
-Es vergeht genau $\Delta t$ Zeit, und dieser Vorgang wird wiederholt.
-Das hochgestellte T bezeichnet die transponierte Matrix.
-Dabei wird in den späteren Schritten überprüft, wie genau die letzte Anpassung von $P$ zur Messung stimmt.
-Ist der Unterschied klein, wird die Kovarianz $P$ kleiner, ist der Unterschied gross, wird auch die Kovarianz grösser.
-Das Filter passt sich selber an und korrigiert sich bei grosser Abweichung.
-
-\subsubsection*{Messen}
-Der Sensor wurde noch nicht benutz, doch genau der liefert Werte für das Filter.
-Die aktuellen Messwerte $z$ werden die Innovation $w$ mit dem Zustandsvektor $x$ und der Messmatrix $H$ zusammengerechnet.
-Hier bei wird lediglich die Messung mit dem Fehler behaftet, und die Messmatrix $H$ mit der Vorhersage multipliziert.
-\[
-{w_{k}}={z_{k}}-{H}{x_{k|k-1}}.
-\]
-Die Innovation ist der Teil der Messung, die nicht durch die Systemdynamik erklärt werden kann.
-Die Hilfsgröße Innovation beschreibt, wie genau die Vorhersage den aktuellen Messwert mittels der Systemmatrix $\Phi$ beschreiben kann.
-Für eine schlechte Vorhersage wird die dazugehörige Innovation gross, für eine genaue Vorhersage dagegen klein sein.
-Entsprechende Korrekturen müssen dann gross bzw. nur gering ausfallen.
-Innovation = Messung - Vorhersage. Dies leuchtet ein, eine Innovation von 0 bedeutet, dass die Messung nichts Neues hervorbrachte.
-
-Im nächsten Schritt wir analysiert, mit welcher Kovarianz weiter gerechnet wird.
-Hierbei wird die Unsicherheit $P$, die Messmatrix $H$ und die Messunsicherheit $R$ miteinander verrechnet.
-\[
-{S_{k}}={H}{P_{k|k-1}}{H}^T+{R_{k}}
-\]
-
-\subsubsection*{Aktualisieren}
-Im nächsten Schritt kommt nun die Wahrscheinlichkeit dazu.
-\[{K_{k}}= {P_{k|k-1}} {H^T}{S_{k}^{-1}}\]
-Dieser Vorgang wird Kalman-Gain genannt.
-Das Kalman-Gain gibt dem Zustand die Gewichtung, bzw. wie die Vorhersage auf den Zustand passt.
-Vereinfacht gesagt: Es wird das das Verhältnis zwischen der Unsicherheit der Vorhersage $P_k$ zu der zugehörigen Messunsicherheit $R_k$ gebildet.
-In unserem Fall wird werden die Elemente der Kalman-Matrix vorweg berechnet, da das Kalman-Gain ohne Messungen auskommt.
-
-Anhand der Informationen aus dem Kalman-Gain $K$ wird das System aktualisiert.
-\[
-{x_{k|k}}={x_{k|k-1}}+{K_{k}}{w_{k}}
-\]
-Dabei wird der Unterschied zwischen dem erwarteten, errechneten, Zustand und dem gemessenen Zustand berechnet.
-
-Dazu kommt eine neue Kovarianz für den nächste Vorhersageschritt:
-\[
-{P_{k|k}}=(I-{K_{k}}{H}){P_{k|k-1}}
-\]
-Der ganze Algorithmus und beginnt wieder mit der Vorhersage
-\[
-{x_{k|k-1}}=\Phi{x_{k-1|k-1}}= \exp(A\Delta t){x_{k|k-1}}.
-\]
-
\subsection{Zusammenfassung }
Zusammenfassend kann das Kalman-Filter in offizieller Typus dargestellt werden.
Dabei beginnt das Filter mit dem Anfangszustand für $k=0$