diff options
Diffstat (limited to 'buch')
-rw-r--r-- | buch/papers/erdbeben/Teil_Fabio.tex | 170 | ||||
-rw-r--r-- | buch/papers/erdbeben/references.bib | 7 | ||||
-rw-r--r-- | buch/papers/erdbeben/teil0.tex | 125 | ||||
-rw-r--r-- | buch/papers/erdbeben/teil1.tex | 311 |
4 files changed, 317 insertions, 296 deletions
diff --git a/buch/papers/erdbeben/Teil_Fabio.tex b/buch/papers/erdbeben/Teil_Fabio.tex index 2ab6052..48ec054 100644 --- a/buch/papers/erdbeben/Teil_Fabio.tex +++ b/buch/papers/erdbeben/Teil_Fabio.tex @@ -1,51 +1,73 @@ \section{Anwendung des Kalman-Filters} \subsection{Ziel} Bis jetzt haben wir gelesen, was das Kalman-Filter bewirkt und wie es funktioniert. -Nun möchten wir mit einem Beispiel herausfinden, -ob das Filter unsere gesuchte Grösse $f(t)$ bestimmen kann. +Nun möchten wir mit einem Beispiel herausfinden, ob das Filter unsere gesuchte Grösse $f(t)$ bestimmen kann. \subsection{Künstliche Erdbebendaten} -Da wir keine Rohdaten über vergangene Erdbeben zur Hand haben, müssen wir mittels Matlab künstliche Daten erzeugen und sie dann in das Filter eingeben. +Da wir keine Rohdaten über vergangene Erdbeben zur Hand haben, müssen wir mittels Matlab künstliche Daten erzeugen und sie dann in das Filter eingeben. Diese Vorgehensweise erlaubt uns das Erdbeben beliebig zu gestalten -und weil es digital simuliert wird, -haben wir keine Bauschäden zu beklagen. +und weil es digital simuliert wird, haben wir keine Bauschäden zu beklagen. \subsection{Wahl der Schwingung} Wir müssen uns überlegen, mit welcher Schwingung wir ein realitätsnahes Beben erzeugen können. + Mit einer ungedämpften harmonischen Schwingung können wir zwar die meisten Vorgänge in der Physik erklären. Da aber unser Erdbeben irgendwann abklingen muss, wählen wir die gedämpfte harmonische Schwingung. Die dazugehörige Schwingungsgleichung lautet + +\begin{equation} + y = A e^{-\lambda t} \sin(\omega t) +\end{equation} + +Für die Variablen der harmonisch gedämpften Schwingung setzen wir die Werte + \begin{equation} - y = A e^{-\lambda t} \sin(\omega t). +A = 5 \end{equation} -Dabei ist $A=5$ die anfängliche Amplitude der Schwingung, -die uns die Heftigkeit des Erdebebens beschreibt. + +ein. + +$A$ ist die Amplitude der Schwingung, die uns die Heftigkeit des Erdebebens beschreibt. Sie ist vergleichbar mit der Magnitude. -$\lambda$ bezeichnet die Bodendämpfung, für die wir $0.2$ wählen. -Sie ist dafür verantwortlich, dass unser Erdbeben abklingt -und kreiert die bei gedämpften Schwingungen typische Hüllkurve. -Wir nehmen an, dass $\lambda$ ein Materialparameter von geologischen Böden ist. -Die Kreisfrequenz $\omega$ ist durch + +$\omega$ definiert sich durch + \begin{equation} \omega = 2 \pi f \end{equation} -gegeben, -wobei die Momentanfrequenz $f = \mathcal N(\mu_f, \sigma_f) $ einer Normalverteilung mit + +wobei die Frequenz $f$ mit + \begin{equation} - \mu_f = \SI{15}{\hertz} - \qquad \text{und} \qquad - \sigma_f = \SI{10}{\hertz} + f = E(\mathrm{Frequenz}) + \sigma^2(\mathrm{Frequenz}) \end{equation} -folgt. -Zusätzlich haben wir $f$ mit einem Savitzky-Golay-Filter gefiltert. +erzeugt wird. + +Zusätzlich haben wir $f$ mit dem Savitzky-Golay-Filter gefiltert. Das Savitzky-Golay-Filter schaut sich immer eine definierte Anzahl von Datenpunkte an -und bildet darüber ein Polynom $n$-ter Ordnung. -In unserer Anwendung schaut sich das Filter, im Sinne eines verschiebbaren Fensters, -jeweils elf aufeinanderfolgende Datenpunkte an -und approximiert diese mit ein Polynom $0$-ter Ordnung, -also einer Konstanten. -Somit erhalten wir mit Matlab-Standardfunktionen einen gleitenden Mittelwert. +und bildet ein Polynom $n$-ter Ordnung. +In unserer Anwendung schaut sich das Filter, im Sinne eines verschieblichen Fensters, +jeweils zehn aufeinanderfolgende Datenpunkte an und bildet ein Polynom $0$-ter Ordnung. +Da wir den Grad $0$ gewählt haben, erhalten wir pro zehn Punkte eine Gerade mit der Steigung $0$. +Diese Art von der Filterung nennt sich gleitender Mittelwert. + +Für den Erwartungswert und die Standardabweichung setzen wir die Zahlen + +\begin{equation} +E(f) = \SI{15}{\hertz} +\end{equation} + +und +\begin{equation} +\sigma^2 = \SI{10}{\hertz} +\end{equation} + +ein. + +$\lambda$ ist die Bodendämpfung, für die wir $0.2$ wählen. +Sie ist dafür verantwortlich, dass unser Erdbeben abklingen wird und kreiert bei der gedämpften Schwingung die typische Hüllkurve der Amplitude. +Wir nehmen an, dass $\lambda$ ein Materialparameter von geologischen Böden ist. \subsection{Versuch im Standardfall} Im nächsten Schritt müssen wir sinnvolle Systemparameter für unseren Seismographen definieren. @@ -53,9 +75,7 @@ Eine kurze Recherche zeigt, dass die Masse ein Gewicht von ca.\ \SI{100}{\gram} Zur Federkonstante D und Dämpfung k konnten wir leider keine brauchbaren Grössen finden und treffen die Annahme, dass $D = 1$ und $k = 0.01$. Für die Masse definieren wir $m = 0.01$. -Da unser Seismograph von der Umgebung durch Wind, Temperatur oder menschgemachten Vibrationen beeinflusst wird, müssen wir ein Prozessrauschen definieren. -Die dazugehörige Matrix $Q$ beinhaltet die Standardabweichung für die Position, Geschwindigkeit und äussere Kraft. -Wir nehmen an, dass +Für das Prozessrauschen werden die Bedingungen \begin{equation} Q = \left( @@ -68,69 +88,56 @@ Wir nehmen an, dass {0.00001}^2& 0& 0 \\ 0 & {0.00001}^2& 0\\ 0 & 0& {1 }^2\\ - \end{array}\right). + \end{array}\right) \end{equation} +angesetzt. + Auch für die Messung setzen wir ein Rauschen voraus und definieren \begin{equation} R= ({\sigma_x}^2)= -({0.00001}^2). +({0.00001}^2) \end{equation} -Sind nun die benötigten Systemparameter und Varianzen definiert, -erzeugen wir ein Erdbeben mittels Simulation und schauen, -wie gut das Kalman-Filter die äussere Beschleunigung schätzen kann. +Sind nun die benötigten Systemparameter und das Rauschen definiert, erzeugen wir das Erdbeben und schauen, wie gut das Kalman-Filter die äussere Beschleunigung schätzen kann. -\subsubsection{Ergebnis} +\subsection*{Ergebnis} -Abbildung~\ref{erdbeben:fig:standard-alles} zeigt zuoberst unsere Messwerte, -also die Position der Masse relativ zum Seismografen. -Wir sehen, dass unsere vorher gewählten Parameter eine realistische Erdbebenaufzeichnung erzeugen. -Leiten wir die Position einmal ab, erhalten wir die Geschwindigkeit, -und die zweite Ableitung ergibt uns die Kraft, welche für unsere Aufgabenstellung relevant ist. -Sehr gut ersichtlich ist die typische Hüllkurve, wie wir sie bei einer gedämpften Schwingung erwarten. +Wie wir in Abbildung~\ref{erdbeben:fig:standard-alles} im Positions-Zeit-Diagramm sehen, erzeugen unsere vorher gewählten Parameter eine realistische Erdbebenaufzeichnung. +Leiten wir die Position einmal ab, erhalten wir die Geschwindigkeit. +Die zweite Ableitung ergibt uns die Kraft, die in unserer Aufgabenstellung gesucht ist. -Die blaue Kurve ist die geschätzte äussere Kraft des Kalman-Filters. -Erst wenn wir näher zoomen, erkennen wir in Abbildung~\ref{erdbeben:fig:standard-zoom}, -wie nahe die Schätzung an der idealen Schwingung liegt. +Zoomen wir näher ran, erkennen wir wieder im Positions-Diagramm eine Überlagerung der Massen-Eigenschwingung mit der Erdbebenschwingung. +Die Masse schwingt mit einer tiefer Frequenz und hoher Amplitude, hingegen das Erdbeben mit einer hohen Frequenz und tiefer Amplitude. -\begin{figure} - \begin{center} - \includegraphics[width=\linewidth,keepaspectratio]{papers/erdbeben/Standard_alles.PNG} - \caption{Das Position-Zeit-Diagramm zeigt uns die typische Aufzeichnung eines Seismographen während eines Erdbebens. Um die Geschwindigkeit zu erhalten müssen wir die Position einmal ableiten. Ein weiteres Ableiten erzeugt uns die Beschleunigung, respektive die Kraft.} - \label{erdbeben:fig:standard-alles} - \end{center} -\end{figure} +Vergleichen wir nun die Position mit der Kraft, stellen wir fest, dass das Kalman-Filter eine Schätzung wiedergibt, die auch eine Frequenz von \SI{15}{\hertz} hat. +Das Filter war imstande die Eigenfrequenz zu eliminieren und die tatsächliche Kraft des Erdbebens zu wiedergeben. \begin{figure} \begin{center} - \includegraphics[width=\linewidth,keepaspectratio]{papers/erdbeben/Standard_Zoom.PNG} - \caption{Erst das Vergrössern an die Datenpunkte zeigt uns auf, wie gut die Schätzung des Kalman-Filters funktioniert.} - \label{erdbeben:fig:standard-zoom} + \includegraphics[width=\linewidth,keepaspectratio]{papers/erdbeben/images/standard.PDF} + \caption{Das Position-Zeit-Diagramm zeigt uns die typische Aufzeichnung eines Seismographen während eines Erdbebens. Um die Geschwindigkeit zu erhalten müssen wir die Position einmal ableiten. Ein weiteres Ableiten erzeugt uns die Beschleunigung, respektive die Kraft. Sehr gut ersichtlich ist die Hüllkurve der Amplitude, wie wir sie bei einer gedämpften Schwingung erwarten. Erst das Vergrössern an die Datenpunkte zeigt uns auf, wie gut die Schätzung des Kalman-Filters funktioniert.} + \label{erdbeben:fig:standard-alles} \end{center} \end{figure} \subsection{Veränderung der Systemparameter} -Was wir nun testen möchten, sind die Auswirkungen wenn zum Beispiel der Seismograph andere Systemparameter aufweist. -Wir nehmen an, dass sich im Vergleich zum Standardfall die Masse erhöht, die Federkonstante schwächer und die Federdämpfung doppelt so stark wirkt. +Was wir nun austesten möchten, sind die Auswirkungen wenn z.B. der Seismograph andere Systemparameter aufweist. +Wir nehmen an, dass sich im Vergleich zum Standardfall die Masse erhöht, die Federkonstante schwächer und die Bodendämpfung doppelt so stark wirkt. Somit gilt neu \[ -m = 0.05, -\qquad +m = 0.05 +\qquad \qquad D = 0.5 \qquad \text{und} \qquad k = 0.02. \] -Da wir mit dieser Anpassung die Trägheit des Seismogrammes erhöht haben, -erwarten wir eine langsamere Bewegung der Masse, -das heisst die Frequenz wird kleiner. +Da wir mit dieser Anpassung die Trägheit des Seismogrammes erhöht haben, erwarten wir sicher eine langsamere Bewegung der Masse, das heisst die Frequenz wird sich reduzieren. -Betrachten wir Abbildung~\ref{erdbeben:fig:systemparameter-geaendert}, -können wir diese Erwartung bestätigen. -Zudem bemerken wir eine grössere Auslenkung der Position, -die wir mir durch die höhere Energie der Masse und geringeren Rücklenkkraft der Feder erklären können. +Betrachten wir die Abbildung~\ref{erdbeben:fig:systemparameter-geaendert} können wir diese Erwartung bestätigen. +Nebst dem bemerken wir eine grössere Auslenkung der Position, die wir auf die höhere Energie der Masse und geringeren Rücklenkkraft der Feder begründen können. \begin{figure} \begin{center} @@ -140,50 +147,35 @@ die wir mir durch die höhere Energie der Masse und geringeren Rücklenkkraft de \end{center} \end{figure} - \subsection{Verstärkung des Prozessrauschens} Falls wir unseren Seismographen in der Nähe einer grösseren Stadt aufstellen, so müssen wir aufgrund der Vibrationen mit einem stärkeren Prozessrauschen rechnen. Dieses Rauschen beeinflusst die Varianzen der Position und Geschwindigkeit in der Matrix $Q$. Aus diesem Grund erhöhen wir die Standardabweichungen in der Matrix $Q$ um den Faktor $100$. Die Auswertung in Abbildung~\ref{erdbeben:fig:prozessrauschen-geaendert} zeigt auf, dass das Kalman-Filter die Schätzung der Kraft nur gering an den Messwerten anpasst. +Die Theorie dazu haben wir im Kapitel \nameref{Wahrscheinlichkeit} angeschaut. \begin{figure} \begin{center} - \includegraphics[width=\linewidth,keepaspectratio]{papers/erdbeben/Prozessrauschen_geaendert.PNG} - \caption{Mit dem Erhöhen des Prozessrauschens gehen wir von einer grösseren Unsicherheit der Systemmatrix aus. Aus diesem Grund folgt das Filter vor allem den Messwerten, was sichtbare Folgen für die Schätzkurve im Kraft-Zeit-Diagramm hat. Hier möchte das Filter auch den Messwerten folgen. Da wir aber für die Kraft keine Messwerte aufzeichnen, erhalten wir eine sehr schwache Kurve} + \includegraphics[width=\linewidth,keepaspectratio]{papers/erdbeben/images/Prozessrauschen_geaendert.PDF} + \caption{Mit dem Erhöhen des Prozessrauschens gehen wir von einer grösseren Unsicherheit der Systemmatrix aus. Aus diesem Grund folgt das Filter vor allem den Messwerten, was sichtbare Folgen für die Schätzkurve im Kraft-Zeit-Diagramm hat. Hier möchte das Filter auch den Messwerten folgen. Da wir aber für die Kraft keine Messwerte aufzeichnen, erhalten wir eine sehr schwache Kurve. Die Position kann immernoch präzise geschätzt werden und die Ableitung zur Geschwindigkeit ergibt gute Resultate. Jedoch ist die Schätzkurve der Kraft sehr weit von der idealen Kurve entfernt und nicht nutzbar.} \label{erdbeben:fig:prozessrauschen-geaendert} \end{center} \end{figure} -\begin{figure} - \begin{center} - \includegraphics[width=\linewidth,keepaspectratio]{papers/erdbeben/Prozessrauschen_geaendert_zoom.PNG} - \caption{Die Position kann immernoch präzise geschätzt werden und die Ableitung zur Geschwindigkeit ergibt gute Resultate. Jedoch ist die Schätzkurve der Kraft sehr weit von der idealen Kurve entfernt und nicht nutzbar.} - \label{erdbeben:fig:prozessrauschen-geaendert-zoom} - \end{center} -\end{figure} - \subsection{Verstärkung des Messrauschens} Als letztes verstärken wir das Messrauschen um den Faktor $100$ und belassen wieder den Rest wie im Standardfall. Wie man eigentlich schon erwarten kann, zeigt uns die Abbildung~\ref{erdbeben:fig:messrauschen-geaendert}, dass das Signal des Messsensors vom Messrauschen gestört wird. -Weil die Messung somit ungenau wird, kann das Kalman-Filter nicht mehr genau arbeiten und produziert eine ungenaues Resultat. +Weil die Messung somit ungenau wird, kann das Kalman-Filter nicht mehr genau arbeiten und produziert einen ungenauen Output. +Auch hier verweisen wir auf Kapitel \nameref{Wahrscheinlichkeit}. \begin{figure} \begin{center} - \includegraphics[width=\linewidth,keepaspectratio]{papers/erdbeben/Messrauschen_geaendert.PNG} - \caption{Im Kraft-Zeit-Diagramm erhalten wir nur bis ca. $t = 10$ gute Schätzwerte. Von $t = 10$ bis $t = 30$ wirkt das Messrauschen zu stark und erhalten keine brauchbaren Werte mehr} + \includegraphics[width=\linewidth,keepaspectratio]{papers/erdbeben/images/Messrauschen_geaendert.PDF} + \caption{Im Kraft-Zeit-Diagramm erhalten wir nur bis ca. $t = 10$ gute Schätzwerte. Von $t = 10$ bis $t = 30$ wirkt das Messrauschen zu stark und erhalten keine brauchbaren Werte mehr. Im Position-Zeit-Diagramm erhielten wir bis jetzt immer genaue Schätzungen. Mit einem starken Messrauschen fällt es nun dem Filter schwerer, präzise Werte zu generieren. Die Nahaufnahme im Kraft-Zeit-Diagramm bestätigt uns aber, dass die Messfehler zu gross sind, um ein klares Bild über die äussere Kraft zu erhalten.} \label{erdbeben:fig:messrauschen-geaendert} \end{center} \end{figure} -\begin{figure} - \begin{center} - \includegraphics[width=\linewidth,keepaspectratio]{papers/erdbeben/Messrauschen_geaendert_zoom.PNG} - \caption{Im Position-Zeit-Diagramm erhielten wir bis jetzt immer genaue Schätzungen. Mit einem starken Messrauschen fällt es nun dem Filter schwerer, präzise Werte zu generieren. Die Nahaufnahme im Kraft-Zeit-Diagramm bestätigt uns aber, dass die Messfehler zu gross sind, um ein klares Bild über die äussere Kraft zu erhalten.} - \label{erdbeben:fig:messrauschen-geaendert_zoom} - \end{center} -\end{figure} - \subsection{Zusammenfassung} Wir haben uns zum Ziel gesetzt, die äussere Beschleunigung $a(t)$, bzw. die Kraft $f(t)$ eines Erdbebens zu ermitteln. @@ -192,6 +184,8 @@ Der Seismograph war fähig die Position der Masse während der Einwirkung des Er $a(t)$ kann zwar nicht mit Sensoren gemessen werden, jedoch erhalten wir $a(t)$ durch zweifaches Ableiten. Da wir so aber die innere Beschleunigung erhalten, mussten wir das Kalman-Filter anwenden. Das Kalman-Filter half uns die äussere Beschleunigung zu schätzen und lieferte erstaunlich genaue Werte. +Ausserdem hat es das Filter geschafft, die Eigenfrequenz der Masse und die Erdbebenfrequenz zu separieren. +Folglich erhielten wir eine Schätzung, die nur das Erdbeben betraf. -Schlussendlich haben wir aufgezeigt, das Veränderungen an den System- und Rauschparametern die Genauigkeit und Zuverlässigkeit des Kalman-Filters beeinträchtigen. +Zuletzt haben wir aufgezeigt, das Veränderungen an den System- und Rauschparametern die Genauigkeit und Zuverlässigkeit des Kalman-Filters beeinträchtigen können. diff --git a/buch/papers/erdbeben/references.bib b/buch/papers/erdbeben/references.bib index 444c82d..9bcf57d 100644 --- a/buch/papers/erdbeben/references.bib +++ b/buch/papers/erdbeben/references.bib @@ -28,6 +28,13 @@ title = {Kalmanfilter}, urldate = {2021-07-0}} +@article{erdbeben:skript:wrstat, + author = {Andreas Müller}, + url = {https://github.com/AndreasFMueller/WrStat}, + date = {2021-09-11}, + title = {Wahrscheinlichkeitsrechnung und Statistik} +} + @online{erdbeben:bibtex, date = {2020-02-06}, day = {6}, diff --git a/buch/papers/erdbeben/teil0.tex b/buch/papers/erdbeben/teil0.tex index d32b316..9b33e4b 100644 --- a/buch/papers/erdbeben/teil0.tex +++ b/buch/papers/erdbeben/teil0.tex @@ -3,11 +3,12 @@ % % (c) 2020 Prof Dr Andreas Müller, Hochschule Rapperswil %% -\section{Was ist ein Erdbeben? \label{erdbeben:section:teil0}} -\rhead{Erdbeben} -Für das Verständnis möchten wir zuerst erklären, was ein Erdbeben genau ist. -Das soll uns helfen, eine Verknüpfung zwischen dem Naturphänomen und der mathematischen Problemstellung herzustellen. +%\section{Was ist ein Erdbeben? \label{erdbeben:section:teil0}} +\rhead{Erdbeben} +%Für das Verständnis möchten wir zuerst erklären, was ein Erdbeben genau ist. +%Das soll uns helfen, eine Verknüpfung zwischen dem Naturphänomen und der mathematischen Problemstellung herzustellen. +\noindent Unter einem Erdbeben verstehen wir eine Erschütterung des Erdkörpers. Dabei reiben zwei tektonische Platten aneinander, welche sich durch die Gesteinsverzahnung gegenseitig blockieren. Diese Haftreibung durch die Steine wird so lange aufgebaut, bis sie nicht mehr gehalten werden kann. @@ -17,15 +18,31 @@ Vergleichbar ist, wenn man einen Stein in einen Teich wirft und die Wellen beoba \subsection{Funktion eines Seismograph} Um ein Erdbeben kenntlich zu machen, werden in der Regel Seismographen mit vielen Sensoren verwendet. -Ein Seismograph besteht im Grunde aus einer federgelagerten Masse. Wirkt eine Bodenerregung auf das Gerät ein, schwing das Gehäuse und dadurch auch die gekoppelte Masse. -Stoppt das Erdbeben, schwingt das Gehäuse nicht mehr. -Die Masse schwing jedoch in seiner Eigendynamik weiter. -Eine Relativbewegung des Bodens kann damit als Auslenkung im Zeitverlauf gemessen werden. -In modernen Seismographen wird die Bodenbewegung in alle Richtungen gemessen, sowohl Horizontal als auch Vertikal. -Wir konstruieren uns eine einfachere Version eines Seismographen mit einem Gehäuse, an dem zwei Federn und eine Masse befestigt sind. -Der Seismograph ist in Abbildung ~\ref{erdbeben:Seismograph} ersichtlich. -Ein Sensor unter der Masse misst die Position, bzw. die Auslenkung der Feder und der Masse. -Dies bedeutet, unser Seismograph kann nur in eine Dimension Messwerte aufnehmen. +Ein Seismograph besteht im Grunde aus einer federgelagerten Masse. +Bei einem Erdbeben folgt das Gehäuse direkt der Bewegung des Erdbebens. +Die federgelagerte Masse wird jedoch erst durch die Feder bewegt und folgt verzögert. +Zudem schwingt die Masse auch ohne Erdbeben weiter -- das System besitzt eine Eigendynamik. +Eine Relativbewegung des Bodens kann folglich als Auslenkung im Zeitverlauf gemessen werden. +Allerdings misst man so nicht direkt das Erbeben, sondern eine Überlagerung der Effekte aus Erdbeben- und Federkraft. + + +In modernen Seismographen wird die Bodenbewegung in alle Richtungen gemessen, +sowohl Horizontal als auch Vertikal. +Wir konstruieren hier eine einfachere Version eines Seismographen mit einem Gehäuse, +an dem zwei Federn und eine Masse befestigt sind. +Abbildung~\ref{erdbeben:Seismograph} zeigt eine schematische Darstellung unseres Systems. +Ein Sensor unter der Masse misst die Position der Masse relativ zum Gehäuse. +Unser Seismograph misst also nur eindimensional. + +Für mehrere Dimensionen würde der Satz von Pythagoras für die Auslenkung der Federn benötigt. +Die benötigten Quadrate und Wurzeln brechen jedoch die Linearität des Systems. +Die Systembeschreibung wird dann deutlich komplexer. +Der Einfachheit halber beschränken wir uns deshalb auf den linearen Fall, +welcher bereits alle wesentlichen Punkte aufgezeigen kann. + +Wir werden sehen, dass diese Art der Problemstellung effektiv mittels Kalman-Filter gelöst werden kann. +Für ein nicht-lineares System werden Extended Kalman-Filter benötigt, +bei denen die System-Matrix $A$ durch die Jacobi-Matrix ersetzt wird. \begin{figure} \begin{center} @@ -37,63 +54,67 @@ Dies bedeutet, unser Seismograph kann nur in eine Dimension Messwerte aufnehmen. \subsection{Ziel} Unser Seismograph misst nur die Position der Masse über die Zeit. -Wir wollen jedoch die Beschleunigung $a(t)$ des Boden, bzw. die Kraft $f(t)$, welche auf das Gehäuse wirkt, bestimmten. -Anhand dieser Beschleunigung, bzw. der Krafteinwirkung durch die Bodenbewegung, wird später das Bauwerk bemessen. +Wir wollen jedoch die Beschleunigung $a(t)$ des Boden, +respektive die Kraft $f(t)$, +welche auf das Gehäuse wirkt, bestimmten. +Anhand dieser Beschleunigung, +beziehungsweise der Krafteinwirkung durch die Bodenbewegung, +wird später das Bauwerk bemessen. Dies bedeutet, die für uns interessante Grösse $f(t)$ wird nicht durch einen Sensor erfasst. Jedoch können wir durch zweifaches ableiten der Positionsmessung $s(t)$ die Beschleunigung der Masse berechnen. -Das heisst: Die Messung ist zweifach Integriert die Kraft $f(t)$ inklusive der Eigendynamik der Masse. -Um die Krafteinwirkung der Masse zu berechnen, müssen wir Gleichungen für unser System finden. +Die Messung entspricht also dem zweiten Integral der Kraft $f(t)$, +wobei diese einerseits durch das Erdbeben, und andererseits durch die Federn zustande kommt. +Im Folgenden möchten wir die Erdbeben- und Federkräfte trennen. +Dafür benötigen wir zuerst eine mathematische Beschreibung unseres Systems. \subsection{Systemgleichung} Im Paper~\cite{erdbeben:mendezmueller} wurde das System gleich definiert und vorgegangen. Im Fall unseres Seismographen, handelt es sich um ein Feder-Masse-Pendel. -Dieser kann durch die Differentialgleichung zweiter Ordnung einer gedämpften Schwingung am harmonischen Oszillator beschrieben werden. -Die Gleichung lautet: +Dieses kann als gedämpfter harmonischer Oszillator beschrieben werden. +Die zugehörige Differentialgleichung lautet: \begin{equation} + \label{erdbeben:Systemgleichung} m\ddot s + 2k \dot s + Ds = f. \end{equation} wobei $m$ die Masse, $k$ die Dämpfungskonstante und $D$ die Federkonstante bezeichnet. - -Da die Differentialgleichung linear ist möchten wir diese Gleichung in die Darstellung $\dot x = Ax$ überführen, wobei $x$ der Zustandsvektor und $A$ die Systemmatrix bezeichnet. Dazu verwenden wir die Subsitution: -\[ -s_1 = s -\qquad \text{und} \qquad -s_2 = \dot s. -\] -Somit entstehen die Gleichungen für die Geschwindigkeit $ \dot s_1(t)$ der Masse : -\[ \dot {s_1} = {s_2}\] -und -\[ \dot s_2 = -\frac{D}{m} {s_1} -\frac{2k}{m} {s_2} + \frac{f} {m} \] -für die Beschleunigung $\dot s_2(t)$ der Masse. -Diese können wir nun in der Form -\[ \ddot f =-\frac{D}{m} {s_1} -\frac{2k}{m} {s_2} + \frac{f} {m} \] -als skalare Gleichung darstellen. - -Die für uns relevanten Zustände sind die Position der Masse, die Geschwindigkeit der Masse und die äussere Beschleunigung des ganzen Systems. -Unüblich ist nun, dass der Stör-Term $f$ in Gleichung (20.1) gerade das ist, was wir eigentlich bestimmen möchten. -In unserem Fall wird die äusseren Beschleunigung gesucht, da diese der Erdbebenanregung gleich kommt. +Für lineare Systeme ist eine Matrix-Darstellung handlicher. +Wir möchten diese Gleichung folglich in die Darstellung $\dot x = Ax$ überführen, +wobei $x$ der Zustandsvektor und $A$ die Systemmatrix bezeichnet. +Wir subsituieren $\dot s = v$ für die Geschwindigkeit und erhalten das Gleichungssystem +\begin{align} + \dot s &= v \\ + \dot v &= -\frac{D}{m} {s} -\frac{2k}{m} {v} + \frac{f} {m}. + \label{erdbenen:systemgleichungen} +\end{align} + +Die relevanten Zustände sind also die Position $s$ und die Geschwindigkeit $v$. +Die für uns eigentlich interessante Grösse ist jedoch der Stör-Term $f$. +Dieser entspricht der Kraft durch das Erdbeben. Deshalb nehmen wir $f$ als dritte Grösse in den Zustandsvektor auf und definieren: - \[ - x = (s_1, s_2, f)^T. + x = \begin{pmatrix} {s} \\ {v} \\ {f} \end{pmatrix} \] -Für die Standard-Form $\dot x = Ax$ brauchen wir als nächstes die Ableitungen aller Elemente von $x$. Für $\dot s_1$ und $\dot s_2$ folgen diese direkt aus Gleichung (20.1), aber über $\dot f$ wissen wir nichts. -Wir müssen also eine Annahme treffen: $\dot f = 0$. Diese Annahme ist im Allgemeinen falsch, aber etwas Besseres haben wir zurzeit nicht zur Verfügung. -Zudem treffen wir die Annahme, das sich die Kraft über die Beobachtungszeit nicht verändert. +Für die Standard-Form $\dot x = Ax$ brauchen wir als nächstes die Ableitungen aller Elemente von $x$. +Für $s$ und $v$ haben wir diese in Gleichung~\eqref{erdbenen:systemgleichungen} bereits gefunden. +Über die Kraft $f$ wissen wir jedoch nichts. +Wir müssen also eine Annahme treffen: Die Kraft ändert sich nicht, $\dot f = 0$. +Diese Annahme ist im Allgemeinen natürlich falsch, aber etwas Besseres haben wir nicht zur Verfügung. Wir werden dies in einem späteren Schritt kompensieren müssen. -Da die Kraft unbekannt ist, wird die letzte Zeile mit Nullen gefüllt, denn genau diese Werte wollen wir. - -Durch Rücksubstituion ergibt sich uns folgende Systemgleichung in Matrix schreibweise, wobei $\dot {s_1}= v$ ist. Damit haben wir nun alles, was wir für die Matrix-Darstellung von Gleichung (20.1) benötigen. Diese lautet: +Wir haben nun alles für die Matrix-Form von Gleichung~\eqref{erdbeben:Systemgleichung} zusammen. +Sie lautet: \begin{equation} -\frac{d}{dt} \left(\begin{array}{c} s(t) \\ v(t) \\ f(t) \end{array}\right) = \left( - \begin{array}{ccc} -0 & 1& 0 \\ -- \frac{D}{m} &-\frac{2k}{m} & \frac{1} {m}\\ -0 & 0 & 0\\ -\end{array}\right) \left(\begin{array}{c} s(t)\\ v(t)\\ f(t) \end{array}\right). + \frac{d}{dt} \begin{pmatrix} s(t) \\ v(t) \\ f(t) \end{pmatrix} + = + \begin{pmatrix} + \phantom- 0 & \phantom-1& 0 \\ + - \frac{D}{m} &-\frac{2k}{m} & \frac{1} {m} \\ + \phantom-0 & \phantom-0 & 0\\ + \end{pmatrix} + \begin{pmatrix} s(t) \\ v(t) \\ f(t) \end{pmatrix}. + \label{erdbeben:systemmatrix} \end{equation} diff --git a/buch/papers/erdbeben/teil1.tex b/buch/papers/erdbeben/teil1.tex index 014b53e..6c2539a 100644 --- a/buch/papers/erdbeben/teil1.tex +++ b/buch/papers/erdbeben/teil1.tex @@ -12,184 +12,207 @@ \rhead{Kalman-Filter} - \section{Kalman-Filter} -Die interessante Grösse ist also das Integral der Überlagerung zweier Kräfte. -Wir brauchen also die zweite Ableitung der Messung, ohne deren Eigendynamik. -Da wir die äussere Kraft nicht direkt messen können, benötigen wir ein Werkzeug, welches aus der gemessenen Position, die Krafteinwirkung auf unsere System schätzt. -Dies ist eine typische Anwendung für das Kalman-Filter. - -Das Filter schätzt den Zustand eines Systems anhand von Messungen und kann den nächsten Zustand errechnen und aus dieser Schätzung auch eine erwartete Messung herleiten. -Die für das Filter relevante Grösse ist dann nicht mehr die eigentliche Messung, sondern die Differenz aus Messung und Erwartung, da diese Differenz, die Innovation, eine Aussage über die nicht-deterministischen, externen Einflüsse auf das System ermöglicht. -Das Filter berücksichtigt dazu nicht nur die Messung und den Zustand, sondern auch die Unsicherheiten dieser beiden Grössen, welche als Parameter in das Modell des Systems einfliessen. - -Unser Ziel ist es, anhand der Messung die eigentlich interessante Grösse $f$ zu bestimmen. -Dabei wird durch eine deterministische Vorhersage, in dem der Zustand mit der Eigendynamik des Systems multipliziert wird. -Die Idee dahinter ist, dass das Kalman-Filter die nicht-deterministische Grösse $f$ anhand der Messung und der Vorhersage zu bestimmen. - -Für mehrere Dimensionen (x,y,z) würde der Satz von Pythagoras für das System benötigt. -Da sich der Pythagoras bekanntlich nicht linear verhält, kann kein lineares Kalman-Filter implementiert werden. -Da das Kalman-Filter besonders effektiv und einfach für lineare Abläufe geeignet ist, würde eine zweidimensionale Betrachtung den Rahmen dieser Arbeit sprengen. -Einfachheitshalber beschränken wir uns auf den linearen Fall, da dadurch die wesentlichen Punkte bereits aufgezeigt werden. -Für ein nicht-lineares System werden Extended Kalman-Filter benötigt, bei denen die System-Matrix (A) durch die Jacobi-Matrix des System ersetzt wird. - -\subsection{Geschichte} -Das Kalman-Filter wurde 1960 von Rudolf Emil Kalman entdeckt und direkt von der NASA für die Appollo Mission benutzt. -Das Filter kommt mit wenig Rechenleistung aus und war somit dafür geeignet die Rakete bei der Navigation zu unterstützen.
Eine typische Anwendungen des Kalman-Filters ist Glättung von verrauschten Daten und die Schätzung von Parametern. Dies kommt heutzutage in jedem Satellit, Navigationssystem, Smartphones und Videospielen vor. - -\subsection{Wahrscheinlichkeit} -Das Kalman-Filter schätzt den wahrscheinlichsten Wert zwischen Normalverteilungen. -Dies bedeutet, das Filter schätzt nicht nur den Mittelwert, sondern auch die Standartabweichung. -Da Normalverteilungen dadurch vollständig definiert sind, schätzt ein Kalman-Filter die gesamte Verteilungsfunktion des Zustandes. -In der Abbildung~\ref{erdbeben: Zwei Normalverteilungen} sind zwei Funktionen dargestellt. -Die eine Funktion zeigt die errechnete Vorhersage des Zustands, bzw. deren Normalverteilung. -Die andere Funktion zeigt die verrauschte Messung des nächsten Zustand, bzw. deren Normalverteilung. -Wie man am Beispiel der Gauss-Verteilungen in Abblidung~\ref{erdbeben: Zwei Normalverteilungen} sehen kann, ist sowohl der geschätzte Zustand als auch der gemessene Zustand normalverteilt und haben dementsprechend unterschiedliche Standardabweichungen $\sigma$ und Erwartungswerte $\mu$. Dies wird in~\cite{erdbeben:aragher_understanding_2012}beschrieben. +Im letzten Abschnitt haben wir Gleichungen für unser System gefunden. +Als nächstes brauchen wir also ein Werkzeug, +um aus der Messung der Position $s(t)$ den gesammten Zustand $x(t)$ zu schätzen. +Das ist genau das, was Kalman-Filter tun: Ahand von Messungen den Zustand eines Systems schätzen. + +Kalman-Filter wurde 1960 von Rudolf Emil Kalman erfunden und direkt von der NASA für die Appollo Mission benutzt. +Diese Filter kommen mit wenig Rechenleistung aus und waren somit geeignet, die Rakete bei der Navigation zu unterstützen. +Heutige, typische Anwendungen von Kalman-Filtern sind die Glättung verrauschter Daten und die Schätzung von Parametern. +Dies kommt heutzutage in jedem Satellit, Navigationssystem, Smartphones und Videospielen vor. + +Kalman-Filter funktionieren nach folgendem Zwei-Schritt-Verfahren: +Zuerst wird, +ausgehend von der aktuellen Schätzung des Zustands und der Eigendynamik des Systzems, +eine Vorhersage berechnet. +Daraus lässt sich eine erwartete Messung ableiten. +Anschliessend wird diese Vorhersage korrigiert, +wobei die Korrektur abhänging von der Differenz zwischen erwarteter und effektiver Messung ist. + +Dabei sind sowohl die Vorhersage als auch die Messung nur Schätzungen und unweigerlich fehlerbehaftet. +Unter der Annahme, dass die Fehler normalverteilt sind, +lassen sich beide Schätzungen zu einer neuen, im statistischen Sinne optimalen Schätzung kombinieren. +Die genaue Herleitung des Kalman-Filters ist relativ aufwendig +und kann unter Anderem in \cite{erdbeben:skript:wrstat} nachgelesen werden. + +\subsection{Exkurs Wahrscheinlichkeit} +\label{erdbeben:Wahrscheindlichkeit} +Das Kalman-Filter schätzt also den wahrscheinlichsten Wert zwischen zwei Normalverteilungen, +genauer gesagt zwischen einer Messung und einer Vorhersage. +In diesem Abschnitt wollen wir auffrischen, wie dies genau passiert. + +Das Folgende wird in \cite{erdbeben:aragher_understanding_2012} beschrieben. +Wir haben eine Vorhersage aus der Systemdynamik und eine Messung des Zustandes. +Diese widersprechen sich im Allgemeinen. +Jedoch kennen wir auch die Wahrscheinlichkeiten der beiden Aussagen. + \begin{figure} \begin{center} - \includegraphics[width=5cm]{papers/erdbeben/Gausskurve2.pdf} - \caption{Zwei Normalerteilungen; Die eine Funktion zeigt die Vorhersage, die andere die Messung} - \label{erdbeben: Zwei Normalverteilungen} + \includegraphics[width=5cm]{papers/erdbeben/Gausskurve3.pdf} + \caption{ + Seien blau und orange zwei normalverteilte Schätzungen eines Zustandes, etwa eine Vorhersage und eine Messung. + Dann ist die rote Kurve die optimale Schätzung. + Sie entspricht bis auf Normierung dem Produkt von blau und orange.} + \label{erdbeben:Gauss3} \end{center} \end{figure} -Wir haben eine Vorhersage aus der Systemdynamik und eine Messung des Zustandes. -Diese widersprechen sich im Allgemeinen. -Jedoch wissen wir die Wahrscheinlichkeiten der beiden Aussagen. +Abbildung~\ref{erdbeben:Gauss3} zeigt in blau und rot zwei Normalverteilungen, +je eine für die Vorhersage und eine für die Messung. +Diese unterscheiden sich sowohl in ihren Mittelwerten $\mu_{1,2}$, als auch in ihren Standardabweichungen $\sigma_{1,2}$. Um eine genauere Schätzung des Zustandes zu machen, wird nun ein Wert zwischen den beiden Verteilungen berechnet. -Nun wird eine Eigenschaft der Normalverteilung ausgenutzt. Durch das Multiplizieren zweier Normalverteilungen entsteht eine neue Normalverteilung. -Wir haben eine Normalverteilung der Vorhersage: +Nun wird eine Eigenschaft der Normalverteilung ausgenutzt: +Durch das Multiplizieren zweier Normalverteilungen entsteht eine neue Normalverteilung. + +Wir haben also eine Normalverteilung der Vorhersage \[ {y_1}(x;{\mu_1},{\sigma_1})=\frac{1}{\sqrt{2\pi\sigma_1^2}}\quad e^{-\frac{(x-{\mu_1})^2}{2{\sigma_1}^2}} \] -und der Messung: +und der Messung \[ {y_2}(x;{\mu_2},{\sigma_2})=\frac{1}{\sqrt{2\pi\sigma_2^2}}\quad e^{-\frac{(x-{\mu_2})^2}{2{\sigma_2}^2}}. \] -Diesen werden nun multipliziert und durch deren Fläche geteilt um sie wieder zu normieren, $\odot$ beschreibt dabei die Multiplikation und die Normierung auf den Flächeninhalt eins : +Diesen werden nun multipliziert und durch deren Fläche geteilt, +um sie wieder zu normieren. +$\odot$ beschreibt dabei die Multiplikation und die Normierung auf den Flächeninhalt eins: \begin{align*} - {y_f}(x; {\mu_f}, {\sigma_f}) = {y_1}(x;{ \mu_1},{ \sigma_1}) \odot {y_2}(x; {\mu_2}, {\sigma_2}) + {y_f}(x; {\mu_f}, {\sigma_f}) + &= + {y_1}(x;{ \mu_1},{ \sigma_1}) \odot {y_2}(x; {\mu_2}, {\sigma_2}) + \\ &= \frac{1}{\sqrt{2\pi\sigma_1^2}}\quad e^{-\frac{(x-{\mu_1})^2}{2{\sigma_1}^2}} \odot \frac{1}{\sqrt{2\pi\sigma_2^2}}\quad e^{-\frac{(x-{\mu_2})^2}{2{\sigma_2}^2}} \\ &= \frac{ \frac{1}{\sqrt{2\pi\sigma_1^2}}e^{-\frac{(x-{\mu_1})^2}{2{\sigma_1}^2}} \cdot \frac{1}{\sqrt{2\pi\sigma_2^2}}e^{-\frac{(x-{\mu_2})^2}{2{\sigma_2}^2}}}{\int {y_1} {y_2} dx}. \end{align*} -Diese Kombination der beiden Verteilungen resultiert wiederum in einer Normalverteilung -mit Erwartungswert +Die genaue Berechnung ist eine reine Fingerübung. +Nach einigem Aufwand findet man die Ausdrücke \[ \mu_f = \frac{\mu_1\sigma_2^2 + \mu_2 \sigma_1^2}{\sigma_1^2 + \sigma_2^2} \] -und Varianz +für den neuen Mittelwert und \[ \sigma_f^2 = \frac{\sigma_1^2 \sigma_2^2}{\sigma_1^2 + \sigma_2^2}. \] -Dadurch gleicht sich die neue Kurve den anderen an. Interessant daran ist, dass die fusionierte Kurve sich der genauere Normal-Verteilung anpasst. -Ist ${\sigma_2}$ klein und ${\sigma_1}$ gross, so wird sich die fusionierte Kurve näher an ${y_2}(x;{\mu_2},{\sigma_2})$ begeben. -Somit ist $\mu_f$ ist das gewichtete Mittel der beiden $\mu_{1,2}$, und die Varianzen sind die Gewichte! -Die neue Funktion ist die best mögliche Schätzung für zwei Verteilungen, welche den selben Zustand beschreiben. -Dies ist in der Abbildung~\ref{erdbeben:Gauss3} anhand der rote Funktion ersichtlich. -\begin{figure} - \begin{center} - \includegraphics[width=5cm]{papers/erdbeben/Gausskurve3.pdf} - \caption{Durch das Multiplizieren der blauen und der orangen Verteilung entsteht die die rote, optimale Funktion} - \label{erdbeben:Gauss3} - \end{center} -\end{figure} +für die Varianz. + +Interessant daran ist, dass sich die fusionierte Kurve der genauere Normal-Verteilung anpasst. +Ist ${\sigma_2}$ klein und ${\sigma_1}$ gross, +so wird sich die fusionierte Kurve näher an ${y_2}(x;{\mu_2},{\sigma_2})$ begeben. +$\mu_f$ ist das gewichtete Mittel der beiden $\mu_{1,2}$, und die Varianzen $\sigma_{1,2}$ sind die Gewichte. +Das Interessante an $\mu_{f}$ ist, dass ${\mu_2}$ das Gewicht für ${\sigma_1}$ ist. +Somit ist die Unsicherheit der Messung das Gewicht der Vorhersage und umgekehrt. +Diese neue Funktion ist die best mögliche Schätzung für zwei Verteilungen, welche den selben Zustand beschreiben. +Dies ist in der Abbildung~\ref{erdbeben:Gauss3} anhand der roten Funktion ersichtlich. + Was in zwei Dimensionen erklärt wurde, funktioniert auch in mehreren Dimensionen. Dieses Prinzip mach sich das Kalman Filter zu nutze, und wird von uns für die Erdbeben Berechnung genutzt. -\section{Filter-Matrizen} +\subsection{Filter-Matrizen} Da wir nun ein Werkzeug besitzen, dass die Beschleunigung, welche auf das Gehäuse wirkt, ermitteln kann, wird dieses nun Schritt für Schritt erklärt. Um den Kalman Filter zu starten, müssen gewisse Bedingungen definiert werden. In diesem Abschnitt werden die einzelnen Parameter und Matrizen erklärt und erläutert, wofür sie nützlich sind. -\subsection{Fiter-Agorithmus} -Nachdem alle Parameter aufgestellt sind, wird das Filter initialisiert. -Zuerst wird der nächste Zustand der Masse vorhergesagt, danach wird die Messung präzisiert und laufend aktualisiert. -Das Filter berechnet aufgrund der aktuellen Schätzung eine Vorhersage. -Diese wird, sobald verfügbar, mit der Messung verglichen. -Aus dieser Differenz und den Unsicherheiten des Prozesses ($Q$) und der Messung ($R$) wird der wahrscheinlichste, neue Zustand geschätzt. -Dabei muss genau auf den Index geachtet werden. Nach dem Artikel~\cite{erdbeben:wikipedia} ist die Indexierung so genormt: -Der Zeitschritt wird mit $k$ definiert, $k-1$ ist somit ein Zeitschritt vor $k$. -Auf der linken Seite von | wird der aktuelle Zustand verlangt, bzw. ausgegeben, auf der rechten Seiten den bisherigen Zustand. -Dies bedeutet, dass die Notation $x_{n|m}$ die Schätzung von $x$ zum Zeitpunkt $n$ bis und mit zur Zeitpunkt $m \leq \ n$ präsentiert. +Dabei muss genau auf den Index geachtet werden. +Wir verwenden die Standard-Notation, wie sie auch im Artikel~\cite{erdbeben:wikipedia} zu finden ist. +Sie ist an die Notation der bedingten Wahrscheinlichkeiten angelehnt. +Hierbei steht der betrachtete Zeitschritt links und der gegenwärtige reechts eines Vertikalstrichs. +Dies bedeutet, dass die Notation $x_{n|m}$ die Schätzung von $x$ zum Zeitpunkt $n$ aufgrund des Wissens bis zum und und mit dem Zeitpunkt $m$ repräsentiert. \subsubsection*{Vorhersage} Im Filterschritt Vorhersage wird der nächste Zustand anhand des Anfangszustand und der Systemmatrix berechnet. -Dies funktioniert mit dem Rechenschritt: +Die Systemmatrix $A$ aus Gleichung~\eqref{erdbeben:systemmatrix} beschreibt jedoch ein kontinuierliches System $\dot x = Ax$. +Wir benötigen jedoch ein Zeit-diskretes System $x_{k+1} = \Phi x_k$. +Die Exponentialfunktion $\exp(At)$ beschreibt die Entwicklung eine Zustandes im Laufe der Zeit. +Die Übergangs-Matrix $\Phi$ erhalten wir folglich aus der Systemdynamikmatrix $A$ durch die Exponentialfunktion +\[\Phi = \exp(A\Delta t). \] +Die Matrix $\Phi$ beschreibt die Übergänge zwischen zeitlich aufeinanderfolgenden Zuständen $x_{k-1}$ und $x_{k}$ anhand folgender Gleichung: \[ {x_{k|k-1}}=\Phi{x_{k-1|k-1}}= \exp(A\Delta t){x_{k-1|k-1}}. \] -Die Kovarianz $P_{k|k-1}$ wird ebenfalls neu berechnet. Zudem kommt noch die Prozessunsicherheit $Q$ dazu, so dass die Unsicherheit des Anfangsfehlers $P$ laufend verändert. -Dies funktioniert durch multiplizieren der Systemmatrix mit dem aktualisierten Anfangsfehler. -Dazu wird noch die Prozessunsicherheit addiert, somit entsteht die Gleichung +Damit haben wir die Systemdynamik nun in der für unser Kalman-Filter notwendigen Form und können Vorhersagen berechnen. + +Als nächstes benötigen wir die Unsicherheit der Vorhersage. +Im Abschnitt ~\ref{erdbeben:Wahrscheindlichkeit} haben wir dafür die Varianzen der Normalverteilungen verwendet. +Im mehrdimensionalen Fall übernimmt dies die Kovarinanzmatrix $P$. +Sie wird in jedem Schritt aktualisiert. +Hinzu kommt die Prozessunsicherheit $Q$, welche als Parameter in unser Modell einfliesst. +$Q$ beschreibt Unsicherheiten im Modell, +wie etwa unsere Annahme, dass die Kraft sich nicht ändert, +aber auch nicht-modellierbare Einflüsse wie Vibrationen. +$P$ wird dabei laufend aktuallisiert. +Die optimale Gleichung lautet \[ {P_{k|k-1}}=\Phi {P_{k-1|k-1}} {\Phi _{k}}^T + {Q_{k-1}}. \] -Es vergeht genau $\Delta t$ Zeit, und dieser Vorgang wird wiederholt. -Das hochgestellte T bezeichnet die transponierte Matrix. -Dabei wird in den späteren Schritten überprüft, wie genau die letzte Anpassung von $P$ zur Messung stimmt. -Ist der Unterschied klein, wird die Kovarianz $P$ kleiner, ist der Unterschied gross, wird auch die Kovarianz grösser. +Es vergeht genau $\Delta t$ Zeit, und dieser Vorgang wird wiederholt. Das Filter passt sich selber an und korrigiert sich bei grosser Abweichung. \subsubsection*{Messen} -Der Sensor wurde noch nicht benutz, doch genau der liefert Werte für das Filter. -Die aktuellen Messwerte $z$ werden die Innovation $w$ mit dem Zustandsvektor $x$ und der Messmatrix $H$ zusammengerechnet. -Hier bei wird lediglich die Messung mit dem Fehler behaftet, und die Messmatrix $H$ mit der Vorhersage multipliziert. +Der Sensor wurde noch nicht benutz, doch genau der liefert die Messwerte $z_k$ für unser Filter. +Aus der Vorhersage des Zustandes $x_{k|k-1}$ und der Messmatrix $H$ erhalten wird eine Vorhersage der Messung. +Die Innovation \[ -{w_{k}}={z_{k}}-{H}{x_{k|k-1}}. +{w_{k}}={z_{k}}-{H}{x_{k|k-1}} \] -Die Innovation ist der Teil der Messung, die nicht durch die Systemdynamik erklärt werden kann. -Die Hilfsgröße Innovation beschreibt, wie genau die Vorhersage den aktuellen Messwert mittels der Systemmatrix $\Phi$ beschreiben kann. +beschreibt, wie genau die Vorhersage $x_{k|k-1}$ zur aktuellen Messung $z_k$ passt. +Die Innovation ist also derjenige Teil der Messung, der nicht im Modell erfasst ist. +Dies leuchtet ein, eine Innovation von $0$ bedeutet, dass die Messung nichts Neues hervorbrachte. Für eine schlechte Vorhersage wird die dazugehörige Innovation gross, für eine genaue Vorhersage dagegen klein sein. -Entsprechende Korrekturen müssen dann gross bzw. nur gering ausfallen. -Innovation = Messung - Vorhersage. Dies leuchtet ein, eine Innovation von 0 bedeutet, dass die Messung nichts Neues hervorbrachte. - -Im nächsten Schritt wir analysiert, mit welcher Kovarianz weiter gerechnet wird. -Hierbei wird die Unsicherheit $P$, die Messmatrix $H$ und die Messunsicherheit $R$ miteinander verrechnet. -\[ -{S_{k}}={H}{P_{k|k-1}}{H}^T+{R_{k}} -\] +Entsprechende Korrekturen werden dann gross bzw. nur gering ausfallen. \subsubsection*{Aktualisieren} -Im nächsten Schritt kommt nun die Wahrscheinlichkeit dazu. -\[{K_{k}}= {P_{k|k-1}} {H^T}{S_{k}^{-1}}\] -Die Grösse $K$ wird Kalman-Gain genannt. -Das Kalman-Gain gibt dem Zustand die Gewichtung, bzw. wie die Vorhersage auf den Zustand passt. -Vereinfacht gesagt: Es wird das das Verhältnis zwischen der Unsicherheit der Vorhersage $P_k$ zu der zugehörigen Messunsicherheit $R_k$ gebildet. -In unserem Fall wird werden die Elemente der Kalman-Matrix vorweg berechnet, da das Kalman-Gain ohne Messungen auskommt. - -Anhand der Informationen aus der Innovation wird das Kalman-Gain $K$ gebildet. Dabei beschreibt das Kalman-Gain die Wirkung der Innovation auf den geschätzten Zustand. So wird das System aktualisiert. + +Für eine optimale Schätzung des Zustandes muss die Vorhersage entsprechend der Innovation korrigiert werden. +In der Literatur findet man für eine optimales Korrektur die Gleichungen: +\begin{align*} +{S_{k}} &={H}{P_{k|k-1}}{H}^T+{R_{k}} +\\ +{K_{k}} &= {P_{k|k-1}} {H^T}{S_{k}^{-1}} +\end{align*} +Dabei ist $K$ das Kalman-Gain. +$K$ beschreibt, wie die Vorhersage korrigiert werden muss. +Die optimale Schätzung des neuen Zustandes wird dann zu \[ -{x_{k|k}}={x_{k|k-1}}+{K_{k}}{w_{k}} +{x_{k|k}}={x_{k|k-1}}+{K_{k}}{w_{k}}. \] -Dabei wird der Unterschied zwischen dem erwarteten, errechneten, Zustand und dem gemessenen Zustand berechnet. - -Dazu kommt eine neue Kovarianz für den nächste Vorhersageschritt: +Dazu kommt eine neue Kovarianz $P$ für den nächste Vorhersageschritt: \[ {P_{k|k}}=(I-{K_{k}}{H}){P_{k|k-1}} \] -Der ganze Algorithmus und beginnt wieder mit der Vorhersage +Der ganze Algorithmus ist nun vollständig und beginnt wieder mit der Vorhersage \[ -{x_{k|k-1}}=\Phi{x_{k-1|k-1}}= \exp(A\Delta t){x_{k|k-1}}. +{x_{k+1|k}}=\Phi{x_{k|k}}= \exp(A\Delta t){x_{k|k}}. \] -\subsection{Anfangsbedingungen} +\subsection{Parameter und Anfangsbedingungen} +Die Grössen $P$, $Q$, $R$ und $\Phi$ können grundsätzlich in jedem Zeitschritt ändern. +Für die meisten Anwendungen sind sie jedoch konstant und fliessen als Parameter ins Modell ein. +Aufgrund der iterativen Arbeitsweise von Kalman-Filtern benötigen wir zudem ein paar Anfangswerte. + \subsubsection*{Anfangszustand $x$} -Das Filter benötigt eine Anfangsbedingung. +Für die erste Vorhersage benötigt das Filter einen Anfangszustand. In unserem Fall ist es die Ruhelage, die Masse bewegt sich nicht. Zudem erfährt die Apparatur keine äussere Kraft. \[ {x_0 }= \left( \begin{array}{c} {s_0}\\ {v_0}\\{f_0}\end{array}\right) = \left( \begin{array}{c} 0\\ 0\\ 0\end{array}\right) \] +\subsubsection*{Systemmatrix $A$ und $\Phi$} +Für unseren Seismographen haben wir die entsprechende Matrixdarstellung in Gleichung ~\eqref{erdbeben:Systemgleichung} bereits gefunden. +Zudem haben wir weiter oben bereits entdeckt, wie wir mittels Exponentialfunktion zu einer zeitdiskreten Beschreibung für das Kalman-Filter kommen. +Es gilt +\[ \Phi = \exp(A \Delta t) .\] + \subsubsection*{Anfangsfehler / Kovarianzmatrix $P$} -Da auch der Anfangszustand fehlerhaft sein kann, wird für das Filter ein Anfangsfehler verwendet. +Da auch der Anfangszustand fehlerhaft sein kann, wird für das Filter eine Anfangsunsicherheit verwendet. Auf der Diagonalen werden die Varianzen eingesetzt, in den restlichen Felder stehen die Kovarianzen. -Zur Erinnerung: Die Varianz ist ein Mass für die Streuung eines Wertes, die Kovarianz hingegen beschreibt die Abhängigkeit der Streuungen zweier Werte. - -Kovarianz: Cov(x, y) und Varianz: Var(x) = Cov(x, x) +Für einen gut bekannten Zustandsvektor können kleine Werte eingesetzt werden, für ungenaue Anfangsbedingungen sollten grosse Werte verwendet werden. +Grosse Werte ermöglichen dem Filter sich schnell einzupendeln. In unserem Fall ist der Anfangszustand gut bekannt. -Wir gehen davon aus, dass das System in Ruhe und in Abwesenheit eines Erdbeben startet, somit kann die Matrix mit Nullen bestückt werden. -Als Initialwert für die Kovarianzmatrix ergibt sich +Wir gehen davon aus, +dass das System in Ruhe und in Abwesenheit eines Erdbeben startet. +Somit kann die Matrix mit Nullen bestückt werden und wir starten mit \[ {P_0 }= \left( @@ -200,35 +223,13 @@ Als Initialwert für die Kovarianzmatrix ergibt sich \end{array} \right). \] -Diese Matrix beschreibt die Unsicherheit des geschätzten Zustandes und wird sowohl für die Vorhersage als auch die Korrektur benötigt. -Sie wird nach jeder Schätzung aktualisiert. -Für einen gut bekannten Zustandsvektor können kleine Werte eingesetzt werden, für ungenaue Anfangsbedingungen sollten grosse Werte verwendet werden. -Grosse Werte ermöglichen dem Filter sich schnell einzupendeln. -\subsubsection*{Dynamikmatrix $A$} -Das Kalman-Filter benötigt für die Vorhersage des nächsten Zustandes eine Beschreibung der Systemdynamik. -Die Dynamikmatrix bildet den Kern des Filters. Diese wurde weiter oben bereits beschrieben. -Dabei wollen wird die äussere Kraft des Systems ermitteln. -Da nichts über die äussere Kraft bekannt ist, müssen wir annehmen das deren Ableitung 0 ist. -Die System-Matrix lautet daher: -\[ -A = \left( - \begin{array}{ccc} -0 & 1& 0 \\ -- \frac{D}{m} &-\frac{2k}{m} & \frac{1} {m}\\ -0 & 0& 0\\ -\end{array}\right) - \] -Dabei soll der Kalman-Filter in diskreten Zeitschritten $\Delta t$ arbeiten. -$A$ beschreibt ein kontinuierliches System ($\dot x = Ax$), wir benötigen jedoch ein Zeit-diskretes System $x_{k+1} = \Phi x_k$. -Die Übergangs-Matrix erhalten wir aus der Systemdynamikmatrix mittels Exponentialfunktion: -\[\Phi = \exp(A\Delta t). \] -Die Matrix $\Phi$ beschreibt die Übergänge zwischen zeitlich aufeinanderfolgenden Zuständen $x_{k-1}$ und $x_{k}$ \subsubsection*{Prozessrauschkovarianzmatrix $Q$} Die Prozessrauschmatrix teilt dem Filter mit, wie sich der Prozess verändert. Die Matrix $Q$ beschreibt die Unsicherheit, die der Prozess mit sich bringt. -Bei unserem Modell könnte das beispielsweise ein Windstoss an die Masse sein oder auch die Ungenauigkeiten im Modell, wie die Annahme das dich die Kraft nicht ändert. +Bei unserem Modell könnte das beispielsweise ein Windstoss an die Masse sein +oder auch die Ungenauigkeiten im Modell, wie die Annahme, dass sich die Kraft nicht ändert. Für uns wäre dies: \[ Q = \left( @@ -242,8 +243,8 @@ Die Standabweichungen müssten statistisch ermittelt werden, da der Fehler nicht \subsubsection*{Messmatrix $H$} Die Messmatrix gibt an, welche Parameter gemessen werden. -$H$ ist die Matrix für die Vorhersage der Messung. -In unserem Falle ist es die Position der Massen. +$H$ ist die Matrix, welche aus der Vorhersage des Zustand eine Vorhersage der Messung erzeugt. +In unserem Falle messen wir nur die Position der Massen und verwenden deshalb \[ H = (1, 0, 0) \] @@ -258,43 +259,41 @@ Diese Messrauchen wird meistens vom Sensorhersteller angegeben. Für unsere theoretische Apparatur wird hier ein kleiner Fehler eingesetzt da heutige Sensoren sehr genau messen können. \subsection{Zusammenfassung } -Zusammenfassend kann das Kalman-Filter in offizieller Typus dargestellt werden. -Dabei beginnt das Filter mit dem Anfangszustand für $k=0$ -1. Nächster Zustand vorhersagen +Das Filter beginnt mit dem Anfangszustand für $k=0$ + +\begin{itemize} +\item Nächster Zustand vorhersagen \[ {x_{k|k-1}}=\Phi{x_{k-1|k-1}}= \exp(A\Delta t){x_{k-1|k-1}}. \] -2. Nächste Fehlerkovarianz vorhersagen + \item Nächste Fehlerkovarianz vorhersagen \[ {P_{k|k-1}}=\Phi {P_{k-1|k-1}} {\Phi _{k}}^T + {Q_{k-1}}. \] -3. Zustand wird gemessen +\item Innovation (= Messung - Vorhersage) \[ {w_{k}}={z_{k}}-{H}{x_{k|k-1}}. \] -4. Innovation (= Messung - Vorhersage) -\[ -{S_{k}}={H}{P_{k|k-1}}{H}^T+{R_{k}} -\] - -5. Das Kalman Filter anwenden -\[ -{K_{k}}= {P_{k|k-1}} {H^T}{S_{k}^{-1}} -\] +\item Optimales Kalman-Gain berechnen +\begin{align*} +{S_{k}} &={H}{P_{k|k-1}}{H}^T+{R_{k}}\\ +{K_{k}} &= {P_{k|k-1}} {H^T}{S_{k}^{-1}} +\end{align*} -6. Schätzung aktualisieren +\item Schätzung aktualisieren \[ {x_{k|k}}={x_{k|k-1}}+{K_{k}}{w_{k}} \] -7. Fehlerkovarianz aktualisieren +\item Fehlerkovarianz aktualisieren \[ {P_{k|k}}=(I-{K_{k}}{H}){P_{k|k-1}} \] -8. Die Outputs von $k$ werden die Inputs für ${k-1}$ und werden wieder im Schritt 1 verwendet +\item Die Outputs von $k$ werden die Inputs für ${k-1}$ und werden wieder in Schritt 1 verwendet +\end{itemize} |