% % linear.tex % % (c) 2021 Prof Dr Andreas Müller, OST Ostschweizer Fachhochschule % \section{Lineare Algebra \label{buch:grundlagen:section:linearealgebra}} \rhead{Lineare Algebra} In diesem Abschnitt tragen wir die bekannten Resultate der linearen Algebra zusammen. Meistens lernt man diese zuerst für Vektoren und Gleichungssysteme mit reellen Variablen. In der linearen Algebra werden aber nur die arithmetischen Grundoperationen verwendet, es gibt also keinen Grund, warum sich die Theorie nicht über einem beliebigen Zahlenkörper entwickeln lassen sollte. Die in Kapitel~\ref{buch:chapter:endliche-koerper} untersuchten endlichen Körper sind zum Beispiel besser geeignet für Anwendungen in der Kryptographie, der Codierungstheorie oder für die diskrete schnelle Fourier-Transformation. Daher geht es in diesem Abschnitt weniger darum alles herzuleiten, sondern vor allem darum, die Konzepte in Erinnerung zu rufen und so zu formulieren, dass offensichtlich wird, dass alles mit einem beliebigen Zahlkörper $\Bbbk$ funktioniert. % % Vektoren % \subsection{Vektoren \label{buch:grundlagen:subsection:vektoren}} Koordinatensysteme haben ermöglicht, Punkte als Zahlenpaare zu beschreiben. Dies ermöglicht, geometrische Eigenschaften als Gleichungen auszudrücken. Das bedeutet aber nur, dass man mit den Koordinaten rechnen kann, mit den Punkten selbst kann man trotzdem noch nicht rechnen. Ein Vektor fasst die Koordinaten eines Punktes in einem Objekt zusammen, mit dem man auch rechnen und zum Beispiel Parallelverschiebungen algebraisieren kann. Um auch Streckungen ausdrücken zu können, wird zudem eine Menge von Streckungsfaktoren benötigt, mit denen alle Komponenten eines Vektors multipliziert werden können. Sie heissen auch {\em Skalare} und liegen in $\Bbbk$. \subsubsection{Zeilen- und Spaltenvektoren} Vektoren sind Tupel von Elementen aus $\Bbbk$. \index{Vektor}% \begin{definition} Ein $n$-dimensionaler {\em Spaltenvektor} ist ein $n$-Tupel von Zahlen aus \index{Spaltenvektor}% $\Bbbk$ geschrieben als \[ v = \begin{pmatrix} v_1\\v_2\\\vdots\\v_n\end{pmatrix} \in \Bbbk^n. \] Ein $m$-dimensionaler {\em Zeilenvektor} wird geschrieben als \index{Zeilenvektor}% \[ u = \begin{pmatrix}u_1&u_2&\dots&u_m\end{pmatrix} \in \Bbbk^m. \] \end{definition} Für Vektoren gleicher Dimension sind zwei Rechenoperationen definiert. Die {\em Addition von Vektoren} $a,a\in\Bbbk^n$ und die Multiplikation \index{Addition von Vektoren}% eines Vektors mit einem Skalar $\lambda\in\Bbbk$ erfolgt elementweise: \[ a+b = \begin{pmatrix}a_1\\\vdots\\a_n\end{pmatrix} + \begin{pmatrix}b_1\\\vdots\\b_n\end{pmatrix} = \begin{pmatrix}a_1+b_1\\\vdots\\a_n+b_n\end{pmatrix}, \qquad \lambda a = \lambda \begin{pmatrix}a_1\\\vdots\\a_n\end{pmatrix} = \begin{pmatrix}\lambda a_1\\\vdots\\\lambda a_n\end{pmatrix}. \] Die üblichen Rechenregeln sind erfüllt, nämlich \begin{equation} \index{Kommutativgesetz}% \index{Assoziativgesetz}% \index{Distributivgesetz}% \begin{aligned} &\text{Kommutativität:} & a+b&=b+a && &&\forall a,b\in V \\ &\text{Assoziativgesetze:} & (a+b)+c&=a+(b+c) & (\lambda\mu)a&=\lambda(\mu a) &&\forall a,b,c\in V,\; \lambda,\mu\in\Bbbk \\ &\text{Distributivgesetze:} & \lambda(a+b)&=\lambda a + \lambda b & (\lambda+\mu)a&=\lambda a + \mu a &&\forall a,b\in V,\; \lambda,\mu\in\Bbbk. \\ \end{aligned} \label{buch:vektoren-und-matrizen:eqn:vrgesetze} \end{equation} Diese Gesetze drücken aus, dass man mit Vektoren so rechnen kann, wie man das in der Algebra gelernt hat, mit der einzigen Einschränkung, dass man Skalare immer links von Vektoren schreiben muss. Die Distributivgesetze zum Beispiel sagen, dass man Ausmultipilizieren oder Ausklammern kann genauso wie in Ausdrücken, die nur Zahlen enthalten. Man beachte, dass es im Allgemeinen kein Produkt von Vektoren gibt. Das aus der Vektorgeometrie bekannte Vektorprodukt ist eine Spezialität des dreidimensionalen Raumes, es gibt keine Entsprechung dafür in anderen Dimensionen. \subsubsection{Standardbasisvektoren} \index|{Standardbasisvektor}% In $\Bbbk^n$ findet man eine Menge von speziellen Vektoren, durch die man alle anderen Vektoren ausdrücken kann. Mit den sogenannten {\em Standardbasisvektoren} \[ e_1=\begin{pmatrix}1\\0\\\vdots\\0\end{pmatrix}, e_2=\begin{pmatrix}0\\1\\\vdots\\0\end{pmatrix}, \dots, e_n=\begin{pmatrix}0\\0\\\vdots\\1\end{pmatrix} \] kann der Vektor $a\in\Bbbk^n$ als \[ a = \begin{pmatrix}a_1\\a_2\\\vdots\\a_n\end{pmatrix} = a_1 \begin{pmatrix}1\\0\\\vdots\\0\end{pmatrix} + a_2 \begin{pmatrix}0\\1\\\vdots\\0\end{pmatrix} + \dots + a_n \begin{pmatrix}0\\0\\\vdots\\1\end{pmatrix} = a_1e_1+a_2e_2+\dots+a_ne_n \] ausgedrückt werden. Dies ist ein Speziallfall des Begriffs der Linearkombination, der weiter unten in Definition~\ref{buch:vektoren-und-matrizen:def:linearkombination} eingeführt wird. \subsubsection{Vektorraum} Die Rechnungen, die man gemäss der Rechengesetze \eqref{buch:vektoren-und-matrizen:eqn:vrgesetze} anstellen kann, verlangen nicht, dass Elemente $a$ und $b$, mit denen man da rechnet, Zeilen- oder Spaltenvektoren sind. Jede Art von mathematischem Objekt, mit dem man so rechen kann, kann als (abstrakter) Vektor betrachtet werden. \begin{definition} Eine Menge $V$ von Objekten, auf der zwei Operationen definiert sind, nämlich die Addition, geschrieben $a+b$ für $a,b\in V$ und die Multiplikation mit Skalaren, geschrieben $\lambda a$ für $a\in V$ und $\lambda\in \Bbbk$, heisst ein {\em $\Bbbk$-Vektorraum} oder {\em Vektorraum über $\Bbbk$} (oder einfach nur {\em Vektorraum}, wenn $\Bbbk$ aus dem Kontext klar sind), wenn die Rechenregeln~\eqref{buch:vektoren-und-matrizen:eqn:vrgesetze} gelten \index{Vektorraum}% \index{k-Vektorraum@$\Bbbk$-Vektorraum}% \end{definition} Die Mengen von Spaltenvektoren $\Bbbk^n$ sind ganz offensichtlich Vektorräume. Die in Kapitel~\ref{buch:chapter:polynome} studierten Mengen von Polynomen mit Koeffizienten in $\Bbbk$ sind ebenfalls Vektorräume. \begin{beispiel} Die Zahlenmenge $\mathbb{C}$ ist ein $\mathbb{R}$-Vektorraum. \index{C als R-Vektorraum@$\mathbb{C}$ als $\mathbb{R}$-Vektorraum}% Elemente von $\mathbb{C}$ können addiert und mit reellen Zahlen multipliziert werden. Die Rechenregeln für die komplexen Zahlen umfassen auch alle Regeln \eqref{buch:vektoren-und-matrizen:eqn:vrgesetze}, also ist $\mathbb{C}$ ein Vektorraum über $\mathbb{R}$. \end{beispiel} \begin{beispiel} Die Menge $C([a,b])$ der stetigen Funktionen $[a,b]\to\mathbb{Re}$ bildet ein Vektorraum. \index{stetige Funktionen}% Funktionen können addiert und mit reellen Zahlen multipliziert werden: \[ (f+g)(x) = f(x) + g(x) \qquad\text{und}\qquad (\lambda f)(x) = \lambda f(x). \] Dies reicht aber noch nicht ganz, denn $f+g$ und $\lambda f$ müssen ausserdem auch {\em stetige} Funktionen sein. Das dem so ist, lernt man in der Analysis. Die Vektorraum-Rechenregeln \eqref{buch:vektoren-und-matrizen:eqn:vrgesetze} sind ebenfalls erfüllt. \end{beispiel} Die Beispiele zeigen, dass der Begriff des Vektorraums die algebraischen Eigenschaften eine grosse Zahl sehr verschiedenartiger mathematischer Objekte beschreiben kann. Alle Erkenntnisse, die man ausschliesslich aus Vektorraumeigenschaften gewonnen hat, sind auf alle diese Objekte übertragbar. Im folgenden werden wir alle Aussagen für einen Vektorraum $V$ formulieren, wenn wir die Darstellung als Tupel $\Bbbk^n$ nicht brauchen. \subsubsection{Gleichungssysteme in Vektorform} Die Vektorraum-Operationen erlauben nun auch, lineare Gleichungssysteme \index{lineares Gleichungssytem}% \index{Gleichungssytem, lineares}% \index{Vektorform}% in {\em Vektorform} zu schreiben: \index{Vektorform eines Gleichungssystems}% \begin{equation} \left. \begin{linsys}{4} a_{11} x_1 &+& \dots &+& a_{1n}x_n &=& b_1\\ \vdots & & \ddots& & \vdots & & \vdots \\ a_{m1} x_1 &+& \dots &+& a_{1n}x_n &=& b_m\\ \end{linsys} \quad \right\} \qquad \Rightarrow \qquad x_1 \begin{pmatrix}a_{11}\\\vdots\\a_{m1} \end{pmatrix} + \dots + x_n \begin{pmatrix}a_{1n}\\\vdots\\a_{mn} \end{pmatrix} = \begin{pmatrix}b_1\\\vdots\\b_m\end{pmatrix} \label{buch:vektoren-und-matrizen:eqn:vektorform} \end{equation} Die linke Seite der Gleichung rechts in~\eqref{buch:vektoren-und-matrizen:eqn:vektorform} \index{Linearkombination}% ist, wie man sagt, eine Linearkombination der Spaltenvektoren. \begin{definition} \label{buch:vektoren-und-matrizen:def:linearkombination} Eine {\em Linearkombination} der Vektoren $v_1,\dots,v_n\in V$ ist ein Ausdruck der Form \[ v = \lambda_1v_1+\dots + \lambda_n v_n \] mit $\lambda_1,\dots,\lambda_n\in \Bbbk$. \end{definition} Die Menge aller Vektoren, die sich als Linearkombinationen einer gegebenen Menge ausdrücken lässt, heisst der aufgespannte Raum. \begin{definition} \index{aufgespannter Raum}% Sind $a_1,\dots,a_n\in V$ Vektoren, dann heisst die Menge \[ \langle a_1,\dots,a_n\rangle = \{x_1a_1+\dots+x_na_n\;|\; x_1,\dots,x_n\in\Bbbk\} \] aller Vektoren, die sich durch Linearkombination aus den Vektoren $a_1,\dots,a_n$ gewinnen lassen, der von $a_1,\dots,a_n$ {\em aufgespannte Raum}. \end{definition} \subsubsection{Lineare Abhängigkeit} Die Gleichung~\eqref{buch:vektoren-und-matrizen:eqn:vektorform} drückt aus, dass sich der Vektor $b$ auf der rechten Seite als Linearkombination der Spaltenvektoren ausdrücken lässt. Oft ist eine solche Darstellung auf nur eine Art und Weise möglich. Betrachten wir daher jetzt den Fall, dass es zwei verschiedene Linearkombinationen der Vektoren $a_1,\dots,a_n$ gibt, die beide den Vektor $b$ ergeben. Deren Differenz ist \begin{equation} \left. \begin{linsys}{4} x_1 a_1 &+& \dots &+& x_n a_n &=& b \\ x_1'a_1 &+& \dots &+& x_n'a_n &=& b \\ \end{linsys} \quad\right\} \qquad \Rightarrow \qquad (\underbrace{x_1-x_1'}_{\lambda_1}) a_1 + \dots + (\underbrace{x_n-x_n'}_{\lambda_n}) a_n = 0. \label{buch:vektoren-und-matrizen:eqn:linabhkomb} \end{equation} Die Frage, ob ein Gleichungssystem genau eine Lösung hat, hängt also damit zusammen, ob es Zahlen $\lambda_1,\dots,\lambda_n$ gibt, für die die Gleichung~\label{buch:vektoren-und-matrizen:eqn:linabhkomb} erfüllt ist. \begin{definition} Die Vektoren $a_1,\dots,a_n$ heissen linear abhängig, wenn es Zahlen $\lambda_1,\dots,\lambda_n\in\Bbbk$ gibt, die nicht alle $0$ sind, so dass \begin{equation} \lambda_1a_1+\dots+\lambda_na_n = 0. \label{buch:vektoren-und-matrizen:eqn:linabhdef} \end{equation} Die Vektoren heissen linear abhängig, wenn aus \eqref{buch:vektoren-und-matrizen:eqn:linabhdef} folgt, dass alle $\lambda_1,\dots,\lambda_n=0$ sind. \end{definition} Lineare Abhängigkeit der Vektoren $a_1,\dots,a_n$ bedeutet auch, dass man einzelne der Vektoren durch andere ausdrücken kann. Hat man nämlich eine Linearkombination~\eqref{buch:vektoren-und-matrizen:eqn:linabhdef} und ist der Koeffizient $\lambda_k\ne 0$, dann kann man nach $a_k$ auflösen: \[ a_k = -\frac{1}{\lambda_k}(\lambda_1a_1+\dots+\widehat{\lambda_ka_k}+\dots+\lambda_na_n). \] Darin bedeutet der Hut, dass der entsprechende Term weggelassen werden muss. Da dies für jeden von $0$ verschiedenen Koeffizienten möglich ist, sagt man eben nicht, $a_k$ ist linear abhängig von den anderen, sondern man sagt $a_1,\dots,a_n$ sind (untereinander) linear abhängig. \subsubsection{Basis} Ein lineares Gleichungssystem fragt danach, ob und wie ein Vektor $b$ als Linearkombination der Vektoren $a_1,\dots,a_n$ ausgedrückt werden kann. Wenn dies eindeutig möglich ist, dann haben die Vektoren $a_1,\dots,a_n$ offenbar eine besondere Bedeutung. \begin{definition} \index{Basis}% \index{Dimension}% Eine linear unabhängig Menge von Vektoren $\mathcal{B}=\{a_1,\dots,a_n\}\subset V$ heisst {\em Basis} von $V$. Die maximale Anzahl linear unabhängiger Vektoren in $V$ heisst {\em Dimension} von $V$. \end{definition} Die Standardbasisvektoren bilden eine Basis von $V=\Bbbk^n$. \subsubsection{Unterräume} Die Mengen $\langle a_1,\dots,a_n\rangle$ sind Teilmengen von $V$, in denen die Addition von Vektoren und die Multiplikation mit Skalaren immer noch möglich ist. \begin{definition} Eine Teilmenge $U\subset V$ heisst ein {\em Unterraum} von $V$, wenn \index{Unterraum}% $U$ selbst ein $\Bbbk$-Vektorraum ist, also \[ \begin{aligned} a,b&\in U &&\Rightarrow &a+b&\in U \\ a&\in U, \lambda\in\Bbbk &&\Rightarrow & \lambda a&\in U \end{aligned} \] gilt. \end{definition} % % Matrizen % \subsection{Matrizen \label{buch:grundlagen:subsection:matrizen}} Die Koeffizienten eines linearen Gleichungssystems finden in einem Zeilen- oder Spaltenvektor nicht Platz. Wir erweitern das Konzept daher in einer Art, dass Zeilen- und Spaltenvektoren Spezialfälle sind. \subsubsection{Definition einer Matrix} \begin{definition} Eine {\em $m\times n$-Matrix} $A$ (über $\Bbbk$) ist ein rechteckiges Schema \index{Matrix}% \[ A = \begin{pmatrix} a_{11}&a_{12}&\dots &a_{1n}\\ a_{21}&a_{22}&\dots &a_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ a_{m1}&a_{m2}&\dots &a_{mn}\\ \end{pmatrix} \] mit $a_{i\!j}\in\Bbbk$. Die Menge aller $m\times n$-Matrizen wird mit \[ M_{m\times n}(\Bbbk) = M_{m,n}(\Bbbk) = \{ A\;|\; \text{$A$ ist eine $m\times n$-Matrix}\}. \] Falls $m=n$ gilt, heisst die Matrix $A$ auch {\em quadratisch} \index{quadratische Matrix}% Man kürzt die Menge der quadratischen Matrizen als $M_n(\Bbbk) = M_{n\times n}(\Bbbk)$ ab. \end{definition} Die $m$-dimensionalen Spaltenvektoren $v\in \Bbbk^m$ sind $m\times 1$-Matrizen $v\in M_{n\times 1}(\Bbbk)$, die $n$-dimensionalen Zeilenvetoren $u\in\Bbbk^n$ sind $1\times n$-Matrizen $v\in M_{1\times n}(\Bbbk)$. Eine $m\times n$-Matrix $A$ mit den Koeffizienten $a_{i\!j}$ besteht aus den $n$ Spaltenvektoren \[ a_1 = \begin{pmatrix} a_{11} \\ a_{21} \\ \vdots \\ a_{m1} \end{pmatrix},\quad a_2 = \begin{pmatrix} a_{12} \\ a_{22} \\ \vdots \\ a_{m2} \end{pmatrix},\dots, a_n = \begin{pmatrix} a_{1n} \\ a_{2n} \\ \vdots \\ a_{mn} \end{pmatrix}. \] Sie besteht auch aus den $m$ Zeilenvektoren \[ \begin{pmatrix} a_{k1} & a_{k2} & \dots & a_{kn} \end{pmatrix} \] mit $k=1,\dots,m$. \subsubsection{Addition und Multiplikation mit Skalaren} Die $m\times n$-Matrizen $M_{m\times n}(\Bbbk)$ bilden eine Vektorraum, die Addition von Matrizen und die Multiplikation wird wie folgt definiert. \begin{definition} Sind $A,B\in M_{m\times n}(\Bbbk)$ und $\lambda\in\Bbbk$, dann setzt man \[ A+B = \begin{pmatrix} a_{11}+b_{11}&a_{12}+b_{12}&\dots &a_{1n}+b_{1n}\\ a_{21}+b_{21}&a_{22}+b_{22}&\dots &a_{2n}+b_{2n}\\ \vdots &\vdots &\ddots&\vdots \\ a_{m1}+b_{m1}&a_{m2}+b_{m2}&\dots &a_{mn}+b_{mn} \end{pmatrix} \qquad\text{und}\qquad \lambda A = \begin{pmatrix} \lambda a_{11}&\lambda a_{12}&\dots &\lambda a_{1n}\\ \lambda a_{21}&\lambda a_{22}&\dots &\lambda a_{2n}\\ \vdots &\vdots &\ddots&\vdots \\ \lambda a_{m1}&\lambda a_{m2}&\dots &\lambda a_{mn} \end{pmatrix}. \] \end{definition} \subsubsection{Multiplikation} Will man ein lineares Gleichungssystem wie~\eqref{buch:vektoren-und-matrizen:eqn:vektorform} mit Hilfe der Matrix $A$ der Koeffizienten schreiben, bekommt es die Form $Ax=b$, wobei der Vektor der rechten Seiten ist, und $x$ ein Vektor von unbekannten Zahlen. Dies ist jedoch nur sinnvoll, wenn das Produkt $Ax$ sinnvoll definiert werden kann. \begin{definition} \label{buch:vektoren-und-matrizen:def:matrixmultiplikation} Eine $m\times n$-Matrix $A\in M_{m\times n}(\Bbbk)$ und eine $n\times l$-Matrix $B\in M_{n\times l}(\Bbbk)$ haben als Produkt eine $m\times l$-Matrix $C=AB\in M_{m\times l}(\Bbbk)$ mit den Koeffizienten \begin{equation} c_{i\!j} = \sum_{k=1}^n a_{ik} b_{k\!j}. \label{buch:vektoren-und-matrizen:eqn:matrixmultiplikation} \end{equation} \end{definition} Die Koeffizienten $a_{ik}$ kommen aus der Zeile $i$ von $A$, die Koeffizienten $b_{k\!j}$ stehen in der Spalte $j$ von $B$, die Multiplikationsregel \eqref{buch:vektoren-unbd-matrizen:eqn:matrixmultiplikation} besagt also, dass das Element $c_{i\!j}$ entsteht als das Produkt der Zeile $i$ von $A$ mit der Spalte $j$ von $C$. \subsubsection{Einheitsmatrix} Welche $m\times m$-Matrix $I\in M_{m}(\Bbbk)$ hat die Eigenschaft, dass $IA=A$ für jede beliebige Matrix $A\in M_{m\times n}(\Bbbk)$. Wir bezeichnen die Einträge von $I$ mit $\delta_{i\!j}$. Die Bedingung $IA=A$ bedeutet \[ a_{i\!j} = \delta_{i1}a_{1j} + \dots + \delta_{im}a_{mj}, \] Da auf der linken Seite nur $a_{i\!j}$ vorkommt, müssen alle Terme auf der rechten Seite verschwinden ausser dem Term mit $a_{i\!j}$, dessen Koeffizient $\delta_{ii}=1$ sein muss. Die Koeffizienten sind daher \[ \delta_{i\!j} = \begin{cases} 1&\qquad i=j\\ 0&\qquad\text{sonst} \end{cases} \] Die Zahlen $\delta_{i\!j}$ heissen auch das {\em Kronecker-Symbol} oder {\em Kronecker-Delta}. \index{Kronecker-$\delta$}% \index{Kronecker-Symbol}% Die Matrix $I$ hat die Einträge $\delta_{i\!j}$ und heisst die {\em Einheitsmatrix} \index{Einheitsmatrix}% \[ I = \begin{pmatrix} 1 &0 &\dots &0 \\ 0 &1 &\dots &0 \\[-2pt] \vdots&\vdots&\ddots&\vdots\\ 0 &0 &\dots &1 \end{pmatrix}. \] \subsubsection{Transponierte Matrix} \index{transponierte Matrix}% \index{Matrix, transponiert}% Die zu einer $m\times n$-Matrix $A$ {\em transponierte} Matrix ist die $n\times m$-Matrix \[ A^t=\begin{pmatrix} a_{11}&a_{21}&\dots&a_{m1}\\ a_{12}&a_{22}&\dots&a_{m2}\\ \vdots&\vdots&\ddots&\vdots\\ a_{1n}&a_{2n}&\dots&a_{mn} \end{pmatrix}. \] Sie entsteht aus der Matrix $A$ durch Vertauschung von Zeilen und Spalten. Aus der Definition~\ref{buch:vektoren-und-matrizen:def:matrixmultiplikation} folgt unmittelbar die Rechenregel $(AB)^t = B^tA^t$. Eine Matrix $A$ heisst {\em symmetrisch}, wenn $A^t=A$ ist, sie heisst {\em antisymmetrisch}, wenn $A^t=-A$ gilt. \index{symmetrische Matrix}% \index{antisymmetrische Matrix}% % % Gleichungssysteme % \subsection{Gleichungssysteme \label{buch:grundlagen:subsection:gleichungssyteme}} Lineare Gleichungssysteme haben wir bereits in Vektorform geschrieben. Matrizen wurden eingeführt, um sie noch kompakter in der Matrixform $Ax=b$ zu schreiben. In diesem Abschnitt sollen die bekannten Resultate über die Lösung von linearen Gleichungssytemen zusammengetragen werden. \subsubsection{Eindeutige Lösung} Mit Hilfe der Vektorform eines linearen Gleichungssystems wurde gezeigt, dass die Lösung genau dann eindeutig ist, wenn die Spaltenvektoren der Koeffizientenmatrix linear unabhängig sind. Dies bedeutet, dass das Gleichungssystem \begin{equation} \begin{linsys}{3} a_{11}x_1 &+& \dots &+& a_{1n}x_n &=& 0 \\ \vdots & & \ddots& & \vdots & & \vdots \\ a_{m1}x_1 &+& \dots &+& a_{mn}x_n &=& 0 \end{linsys} \label{buch:grundlagen:eqn:homogenessystem} \end{equation} eine nichttriviale Lösung haben muss. Das Gleichungssystem $Ax=b$ ist also genau dann eindeutig lösbar, wenn das homogene Gleichungssystem $Ax=0$ nur die Nulllösung hat. \subsubsection{Inhomogene und homogene Gleichungssysteme} Ein Gleichungssystem mit $0$ auf der rechten Seite ist also bereits ausreichend um zu entscheiden, ob die Lösung eindeutig ist. Ein Gleichungssystem mit rechter Seite $0$ heisst {\em homogen}. \index{homogenes Gleichungssystem}% Zu jedem {\em inhomogenen} Gleichungssystem $Ax=b$ mit $b\ne 0$ ist $Ax=0$ das zugehörige homogene Gleichungssystem. \index{inhomogenes Gleichungssystem}% Ein homogenes Gleichungssytem $Ax=0$ hat immer mindestens die Lösung $x=0$, man nennt sie auch die {\em triviale} Lösung. \index{triviale Lösung}% Eine Lösung $x\ne 0$ heisst auch eine nichttriviale Lösung. Die Lösungen eines inhomgenen Gleichungssystem $Ax=b$ ist also nur dann eindeutig, wenn das zugehörige homogene Gleichungssystem eine nichttriviale Lösung hat. \subsubsection{Gauss-Algorithmus} Der Gauss-Algorithmus oder genauer Gausssche Eliminationsalgorithmus löst ein lineares Gleichungssystem der \index{Gauss-Algorithmus}% \index{Gausscher Eliminationsalgorithmus}% Form~\eqref{buch:vektoren-und-matrizen:eqn:vektorform}. Die Koeffizienten werden dazu in das Tableau \[ \begin{tabular}{|>{$}c<{$}>{$}c<{$}>{$}c<{$}|>{$}c<{$}|} \hline a_{11}&\dots &a_{1n}&b_1 \\[-2pt] \vdots&\ddots&\vdots&\vdots\\ a_{m1}&\dots &a_{mn}&b_m \\ \hline \end{tabular} \] geschrieben. Die vertikale Linie erinnert an die Position des Gleichheitszeichens. Das Tableau beinhaltet alle Informationen zur Durchführung des Algorithmus. Der Algorithmus is so gestaltet, dass er nicht mehr Speicher als das Tableau benötigt, alle Schritte operieren direkt auf den Daten des Tableaus. In jedem Schritt des Algorithmus wird zunächst eine Zeile $i$ und Spalte $j$ ausgewählt, das Elemente $a_{i\!j}$ heisst das {\em Pivotelement}. \index{Pivotelement}% Die {\em Pivotdivision} \index{Pivotdivision} \[ \begin{tabular}{|>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}|>{$}c<{$}|} \hline a_{11}&\dots &a_{1j}&\dots &a_{1n}&b_1 \\[-2pt] \vdots& &\vdots&\ddots&\vdots&\vdots\\ a_{i1}&\dots &{\color{red}a_{i\!j}}&\dots &a_{in}&b_i \\[-2pt] \vdots& &\vdots&\ddots&\vdots&\vdots\\ a_{m1}&\dots &a_{mj}&\dots &a_{mn}&b_m \\ \hline \end{tabular} \rightarrow \begin{tabular}{|>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}|>{$}c<{$}|} \hline a_{11}&\dots &a_{1j}&\dots &a_{1n}&b_1 \\[-2pt] \vdots& &\vdots&\ddots&\vdots&\vdots\\ {\color{red}\frac{a_{i1}}{a_{i\!j}}}&\dots &{\color{red}1}&\dots &{\color{red}\frac{a_{in}}{a_{i\!j}}}&{\color{red}\frac{b_i}{a_{i\!j}}}\\[-2pt] \vdots& &\vdots&\ddots&\vdots&\vdots\\ a_{m1}&\dots &a_{mj}&\dots &a_{mn}&b_m \\ \hline \end{tabular} \] stellt sicher, dass das Pivot-Element zu $1$ wird. \index{Pivotdivision} Dies ist gleichbedeutend mit der Auflösung der Gleichung $i$ noch der Variablen $x_j$. Mit der {\em Zeilensubtraktion} auf Zeile $k>i$ können die Einträge in der \index{Zeilenoperation}% Spalte $j$ zu Null gemacht werden. Dazu wird das $a_{k\!j}$-fache der Zeile $i$ von Zeile $k$ subtrahiert: \[ \begin{tabular}{|>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}|>{$}c<{$}|} \hline \vdots& &\vdots&\ddots&\vdots&\vdots\\ a_{i1}&\dots &{\color{red}1}&\dots &a_{in}&b_i \\[-2pt] \vdots& &\vdots&\ddots&\vdots&\vdots\\ a_{k1}&\dots &a_{k\!j}&\dots &a_{kn}&b_m \\[-2pt] \vdots& &\vdots&\ddots&\vdots&\vdots\\ \hline \end{tabular} \rightarrow \begin{tabular}{|>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}|>{$}c<{$}|} \hline \vdots& &\vdots&\ddots&\vdots&\vdots\\ a_{i1}&\dots &{\color{red}1}&\dots &a_{in}&b_i \\[-2pt] \vdots& &\vdots&\ddots&\vdots&\vdots\\ {\color{blue}a_{k1}-a_{k\!j}a_{i1}}&\dots &{\color{blue}0}&\dots &{\color{blue}a_{kn}-a_{k\!j}a_{in}}&{\color{blue}b_m-a_{k\!j}b_{n}}\\[-2pt] \vdots& &\vdots&\ddots&\vdots&\vdots\\ \hline \end{tabular} \] Typischerweise werden nach jeder Pivotdivision mehrer Zeilensubtraktionen durchgeführt um alle anderen Elemente der Pivotspalte ausser dem Pivotelement zu $0$ zu machen. Beide Operationen können in einem Durchgang durchgeführt werden. Die beiden Operationen Pivotdivision und Zeilensubtraktion werden jetzt kombiniert, um im linken Teil des Tableaus möglichst viele Nullen und Einsen zu erzeugen. Dabei kann es nötig werden, Zeilen zu vertauschen, um ein von $0$ verschiedenes Pivotelement zu finden. Im Idealfall wird ein Tableau der Form \[ \begin{tabular}{|>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}|>{$}c<{$}|} \hline 1& 0&\dots & 0&u_1 \\ 0& 1&\dots & 0&u_2 \\[-2pt] \vdots&\vdots&\ddots&\vdots&\vdots\\ 0& 0&\dots & 1&u_m \\ \hline \end{tabular} \] erreicht, was natürlich nur $m=n$ möglich ist. Interpretiert man die Zeilen dieses Tableaus wieder als Gleichungen, dann liefert die Zeile $i$ den Wert $x_i=u_i$ für die Variable mit Nummer $i$. Der Lösungsvektor kann also in der Spalte rechts abgelesen werden. \begin{figure} \centering \includegraphics[width=\textwidth]{chapters/10-vektorenmatrizen/images/rref.pdf} \caption{Zweckmässiger Ablauf der Berechnung des Gauss-Algorithmus. Falls in einer Spalte kein weiteres von $0$ verschiedenes Pivotelement zur Verfügung steht, wird die Zeile übersprungen. Weisse Felder enthalten $0$, dunkelgraue $1$. Die roten Kreise bezeichnen Pivot-Elemente, die blauen Felder die mit einer Zeilensubtraktion zu $0$ gemacht werden sollen. \label{buch:grundlagen:fig:gaussalgorithmus}} \end{figure} Die effizienteste Strategie für die Verwendung der beiden Operationen ist in Abbildung~\ref{buch:grundlagen:fig:gaussalgorithmus} dargestellt. In der Phase der {\em Vorwärtsreduktion} werden Pivotelemente von links nach rechts möglichst auf der Diagonale gewählt und mit Zeilensubtraktionen die darunterliegenden Spalten freigeräumt. \index{Vorwärtsreduktion}% Während des Rückwärtseinsetzens werden die gleichen Pivotelemente von rechts nach links genutzt, um mit Zeilensubtraktionen auch die Spalten über den Pivotelemnten frei zu räumen. \index{Rückwärtseinsetzen}% Wenn in einer Spalte kein von $0$ verschiedenes Element als Pivotelement zur Verfügung steht, wird diese Spalte übersprungen. Die so erzeugte Tableau-Form heisst auch die {\em reduzierte Zeilenstufenform} ({\em reduced row echelon form}, RREF). \index{reduzierte Zeilenstufenform}% \index{reduced row echelon form}% Da der Ablauf des Gauss-Algorithmus vollständig von den Koeffizienten der Matrix $A$ bestimmt ist, kann er gleichzeitig für mehrere Spalten auf der rechten Seite oder ganz ohne rechte Seite durchgeführt werden. \subsubsection{Lösungsmenge} \index{Lösungsmenge}% Die Spalten, in denen im Laufe des Gauss-Algorithmus kein Pivotelement gefunden werden kann, gehören zu Variablen, nach denen sich das Gleichungssystem nicht auflösen lässt. Diese Variablen sind daher nicht bestimmt, sie können beliebig gewählt werden. Alle anderen Variablen sind durch diese frei wählbaren Variablen bestimmt. Für ein Gleichungssystem $Ax=b$ mit Schlusstableau \index{Schlusstableau}% \begin{equation} \begin{tabular}{|>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}|>{$}c<{$}|} \hline x_1& x_2&\dots &x_{j_i-1}&{\color{darkgreen}x_{j_1}}&x_{j_1+1}&\dots &x_{j_2-1}&{\color{darkgreen}x_{j_2}}&\dots&{\color{darkgreen}x_{j_k}}& \\ \hline 1& 0&\dots & 0&c_{1j_1} & 0&\dots & 0&c_{1j_2} &\dots &c_{1j_k} &d_1 \\ 0& 1&\dots & 0&c_{2j_1} & 0&\dots & 0&c_{2j_2} &\dots &c_{1j_k} &d_2 \\[-2pt] \vdots&\vdots&\ddots&\vdots &\vdots &\vdots&\ddots&\vdots&\vdots &\ddots&\vdots &\vdots \\ 0& 0&\dots & 1&c_{i_1,j_1}& 0&\dots & 0&c_{i_1,j_2} &\dots &c_{i_1j_k} &d_{i_1} \\ 0& 0&\dots & 0& 0& 1&\dots & 0&c_{i_1+1,j_2}&\dots &c_{i_1+1,j_k}&d_{i_1+1}\\[-2pt] \vdots&\vdots&\ddots&\vdots &\vdots &\vdots&\vdots&\vdots&\vdots &\ddots&\vdots &\vdots \\ 0& 0&\dots & 0& 0& 0&\dots & 1&c_{i_2,j_2} &\dots &c_{i_2j_k} &d_{i_2} \\ 0& 0&\dots & 0& 0& 0&\dots & 0& 0&\dots &c_{i_2+1,j_k}&d_{i_2+1}\\[-2pt] \vdots&\vdots&\ddots&\vdots &\vdots &\vdots&\ddots&\vdots&\vdots &\ddots&\vdots &\vdots \\ 0& 0&\dots & 0& 0& 0&\dots & 0& 0&\dots & 0&d_{m} \\ \hline \end{tabular} \end{equation} mit den $k$ frei wählbaren Variablen $x_{j_1}, x_{j_2},\dots, x_{j_k}$ kann die Lösungsmenge als \[ \mathbb{L} = \left\{ \left. \begin{pmatrix} x_1\\ x_2\\ \vdots\\ {\color{darkgreen}x_{i_1}}\\ x_{i_1+1}\\ \vdots\\ {\color{darkgreen}x_{i_2}}\\ x_{i_2+1}\\ \vdots\\ x_m \end{pmatrix} = \begin{pmatrix} d_1\\ d_2\\ \vdots\\ d_{i_1}\\ d_{i_1+1}\\ \vdots\\ d_{i_2}\\ d_{i_2+1}\\ \vdots\\ d_{m} \end{pmatrix} + {\color{darkgreen}x_{j_1}} \begin{pmatrix} -c_{1j_1}\\ -c_{2j_1}\\ \vdots\\ -c_{i_1,j_1}\\ {\color{darkgreen}1}\\ \vdots\\ 0\\ 0\\ \vdots\\ 0\\ \end{pmatrix} + {\color{darkgreen}x_{j_1}} \begin{pmatrix} -c_{1j_2}\\ -c_{2j_2}\\ \vdots\\ -c_{j_1,j_2}\\ -c_{j_1+1,j_2}\\ \vdots\\ -c_{i_2,j_2}\\ {\color{darkgreen}1}\\ \vdots\\ 0\\ \end{pmatrix} + \dots + {\color{darkgreen}x_{j_k}} \begin{pmatrix} -c_{1j_k}\\ -c_{2j_k}\\ \vdots\\ -c_{j_1,j_k}\\ -c_{j_1+1,j_k}\\ \vdots\\ -c_{i_2,j_k}\\ -c_{i_2+1,j_k}\\ \vdots\\ 0\\ \end{pmatrix} \; \right| {\color{darkgreen}x_{i_1}},{\color{darkgreen}x_{i_2}},\dots,{\color{darkgreen}x_{i_k}}\in\Bbbk \right\} \] geschrieben werden. Insbesondere ist die Lösungsmenge $k$-dimensional. \subsubsection{Inverse Matrix} Zu jeder quadratischen Matrix $A\in M_n(\Bbbk)$ kann man versuchen, die Gleichungen \[ Ac_1 = e_1,\quad Ac_2 = e_2, \dots, Ac_n = e_n \] mit den Standardbasisvektoren $e_i$ als rechten Seiten zu lösen, wobei die $c_i$ Vektoren in $\Bbbk^n$ sind. Diese Vektoren kann man mit Hilfe des Gauss-Algorithmus finden: \[ \begin{tabular}{|>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}|>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}|} \hline a_{11}&a_{12}&\dots &a_{1n}&1 &0 &\dots &0 \\ a_{21}&a_{22}&\dots &a_{2n}&0 &1 &\dots &0 \\ \vdots&\vdots&\ddots&\vdots&\vdots&\vdots&\ddots&\vdots\\ a_{n1}&a_{n2}&\dots &a_{nn}&0 &0 &\dots &1 \\ \hline \end{tabular} \rightarrow \begin{tabular}{|>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}|>{$}c<{$}>{$}c<{$}>{$}c<{$}>{$}c<{$}|} \hline 1 &0 &\dots &0 &c_{11}&c_{12}&\dots &c_{1n}\\ 0 &1 &\dots &0 &c_{21}&c_{22}&\dots &c_{2n}\\ \vdots&\vdots&\ddots&\vdots&\vdots&\vdots&\ddots&\vdots\\ 0 &0 &\dots &1 &c_{n1}&c_{n2}&\dots &c_{nn}\\ \hline \end{tabular} \] Die Vektoren $c_k$ sind die Spaltenvektoren der Matrix $C$ mit den Einträgen $c_{i\!j}$. Mit den Vektoren $c_k$ können jetzt beliebige inhomogene Gleichungssysteme $Ax=b$ gelöst werden. Da $b = b_1e_1 + b_2e_2 + \dots + b_ne_n$, kann man die Lösung $x$ als $x = b_1c_1+b_2c_2+\dots+b_nc_n$ konstruieren. Tatsächlich gilt \begin{align*} Ax &= A( b_1c_1+b_2c_2+\dots+b_nc_n) \\ &= b_1Ac_1 + b_2Cc_2 + \dots + b_nAc_n \\ &= b_1e_1 + b_2e_2 + \dots + b_ne_n = b. \end{align*} Die Linearkombination $x=b_1c_1+\dots+b_nc_n$ kann in Vektorform als $x=Cb$ geschrieben werden, wenn die Vektoren $c_i$ als Spalten einer Matrix $C$ interpretiert werden. Die Konstruktion von $C$ bedeutet auch, dass $AC=E$, daher heisst $C$ auch die zu $A$ {\em inverse Matrix}. \index{inverse Matrix} Sie wird auch $C=A^{-1}$ geschrieben. Die Definition der inversen Matrix stellt sicher, dass $AA^{-1}=I$ gilt, daraus folgt aber noch nicht, dass auch $A^{-1}A=I$ ist. Diese Eigenschaft kann man jedoch wie folgt erhalten. Sei $C$ die inverse Matrix von $A$, also $AC=I$. Sei weiter $D$ die inverse Matrix von $C$, also $CD=I$. Dann ist zunächst $A=AI=A(CD)=(AC)D=ID=D$ und weiter $CA=CD=I$. Mit der Bezeichnung $C=A^{-1}$ erhalten wir also auch $A^{-1}A=I$. Die Eigenschaften der Matrizenmultiplikation stellen sicher, dass die Menge der invertierbaren Matrizen eine Struktur bilden, die man Gruppe nennt, die in Abschnitt~\ref{buch:grundlagen:subsection:gruppen} genauer untersucht wird. In diesem Zusammenhang wird dann auf Seite~\pageref{buch:vektorenmatrizen:satz:gruppenregeln} die Eigenschaft $A^{-1}A=I$ ganz allgemein gezeigt. \subsubsection{Determinante} Ein Gleichungssystem mit $n$ Gleichungen und $n$ Unbekannten ist genau dann lösbar, wenn sich der Gauss-Algorithmus bis zum Ende durchführen lässt. Das ist gleichbedeutend damit, dass keines der Pivot-Elemente verschwindet. Das Produkt der Pivot-Elemente ist also eine aus der Koeffizientenmatrix $A$ berechnete Kennzahl, die zu entscheiden erlaubt, ob ein Gleichungssystem lösbar ist. \begin{definition} \label{buch:linear:determinate:def} Das Produkt der Pivot-Elemente bei der Durchführung des Gauss-Algorithmus für eine Gleichungssystem mit quadratischer Koeffizientenmatrix $A$ heisst die {\em Determinante} $\det(A)$ der Matrix $A$. \index{Determinante}% \end{definition} Aus den Regeln für die Durchführung des Gauss-Algorithmus kann man die folgenden Regeln für die Determinante ableiten. Wir stellen die Eigenschaften hier nur zusammen, detaillierte Herleitungen kann man in jedem Kurs zur linearen Algebra finden, zum Beispiel im Kapitel~2 des Skripts \cite{buch:linalg}. \begin{enumerate} \item \label{buch:linear:determinante:einheitsmatrix} Die Determinante der Einheitsmatrix ist $\det(I)=1$. \item Sind zwei Zeilen einer Matrix gleich, dann tritt beim Gauss-Algorithmus eine Nullzweile auf, die Matrix kann also nicht regulär sein und die Determinante ist $0$. \item \label{buch:linear:determinante:vorzeichen} Vertauscht man zwei Zeilen einer Matrix, dann kehrt das Vorzeichen der Determinante. \item Addiert man ein Vielfaches einer Zeile der Matrix zu einer anderen Zeile, dann ändert der Wert der Determinante nicht. \item Wird eine Zeile der Matrix mit einer Zahl $\lambda$ multipliziert, dann wird auch der Wert der Determinanten mit $\lambda$ multipliziert. \item \label{buch:linear:determinante:asymetrisch} Die Determinante ist eine lineare Funktion der Zeilen von $A$. Zusammen mit der Eigeschaft~\ref{buch:linear:determinante:vorzeichen} folgt, dass die Determinante eine antisymmetrische lineare Funktion der Zeilen ist. \item Die Determinante ist durch die Eigenschaften \ref{buch:linear:determinante:einheitsmatrix} und \ref{buch:linear:determinante:asymetrisch} eindeutig bestimmt. \item Der Entwicklungssatz von Laplace: \index{Entwicklungssatz Laplace}% Die Determinante der $n\times n$-Matrix $A$ kann mit der Formel \begin{equation} \det(A) = \sum_{i=1}^n (-1)^{i+j} a_{i\!j} \cdot \det(A_{i\!j}) \end{equation} berechnet werden, wobei die $(n-1)\times(n-1)$-Matrix $A_{i\!j}$ die Matrix $A$ ist, aus der man Zeile $i$ und Spalte $j$ entfernt hat. $A_{i\!j}$ heisst ein {\em Minor} der Matrix $A$. \label{buch:linear:def:minor} \index{Minor einer Matrix}% \end{enumerate} Die bekannte Formel $\det\begin{pmatrix}a&b\\c&d\end{pmatrix}=ad-bc$ ist ein Spezialfall des Entwicklungssatzes von Laplace. Auch für $3\times 3$-Matrizen ist eine übersichtliche Form möglich, die als die Sarrus-Formel bekannt ist. \index{Sarrus-Formel}% \begin{satz}[Sarrus] \label{buch:linear:determinate:sarrus} Die Determinante einer $3\times 3$-Matrix ist \[ \left|\begin{matrix} a&b&c\\ d&e&f\\ g&h&i \end{matrix}\right| = aei + bfg + cdh - ceg - bdi - afh. \] \end{satz} \subsubsection{Die Regel von Cramer} Die Determinanten ermöglicht auch, eine Formel für die Lösung eines Gleichungssystems zu geben. Dies ist bekannt als die {\em Regel von Cramer}. \index{Cramer, Regel von}% \index{Cramersche Regel}% \index{Regel von Cramer}% \begin{satz} \label{buch:linear:determinante:cramer} Die Lösung $x_k$ eines $n\times n$-Gleichungssystem $Ax=b$ mit Koeffizientenmatrix $A$ und rechter Seite $b$ hat die Lösungen \begin{equation} x_k = \frac{ \left|\begin{matrix} a_{11}&a_{12}&\dots &b_1 &\dots &a_{1n}\\ a_{21}&a_{22}&\dots &b_2 &\dots &a_{2n}\\ \vdots&\vdots&\ddots&\vdots&\vdots&\vdots\\ a_{n1}&a_{n2}&\dots &b_n &\dots &a_{nn} \end{matrix}\right| }{ \det(A), } \end{equation} wobei im Zähler die Spalte $k$ der Matrix $A$ durch den Vektor $b$ der rechten Seiten ersetzt worden ist. \end{satz} Die Cramersche Formel ist besonders nützlich, wenn die Abhängigkeit einer Lösungsvariablen von den Einträgen der Koeffizientenmatrix untersucht werden soll. Für die Details der Herleitung sei wieder auf \cite{buch:linalg} verwiesen. \subsubsection{Die inverse Matrix mit Hilfe der Determinanten} Die inverse Matrix löst ein quadratisches Gleichungssystem $Ax=b$ mit Hilfe der Formel $x=A^{-1}b$. Man kann daher auch erwarten, dass sich die inverse Matrix dank der Cramerschen Regel mit Hilfe von Determinanten ausdrücken lässt. Tatsächlich gilt der folgende Satz. \begin{satz} \label{buch:linalg:inverse:adjunkte} Die Inverse der $n\times n$-Matrix $A$ ist gegeben durch \index{Formel für die inverse Matrix}% \index{inverse Matrix, Formel für}% \begin{equation} (A^{-1})_{i\!j} = \frac{1}{\det(A)} \begin{pmatrix} \phantom{(-1)^{1+1}}\det(A_{11}) & \phantom{()^{1+1}}-\det(A_{21}) & \dots & (-1)^{i+1}\det(A_{i1}) & \dots & (-1)^{1+n} \det(A_{n1}) \\ \phantom{()^{1+1}}-\det(A_{12}) & \phantom{(-1)^{1+1}}\det(A_{22}) & \dots & (-1)^{i+2}\det(A_{i2}) & \dots & (-1)^{2+n} \det(A_{n2}) \\ \vdots & \vdots & \ddots & \vdots & \ddots & \vdots \\ (-1)^{1+j}\det(A_{1j}) & (-1)^{2+j}\det(A_{2j}) & \dots & (-1)^{i+j} \det(A_{ji}) & \dots & (-1)^{j+n} \det(A_{nj}) \\ \vdots & \vdots & \ddots & \vdots & \ddots & \vdots \\ (-1)^{1+n}\det(A_{1n}) & (-1)^{2+n}\det(A_{2n}) & \dots & (-1)^{i+n}\det(A_{in}) & \dots & \phantom{(-1)^{n+n}}\det(A_{nn}) \end{pmatrix} \label{buch:linalg:inverse:formel} \end{equation} Die Transponierte der Matrix auf der rechten Seite (ohne den Vorfaktor $1/\det(A)$ heisst die {\em Adjunkte} $\operatorname{adj}A$ von $A$. \index{Adjunkte}% \end{satz} Der Satz~\ref{buch:linalg:inverse:adjunkte} liefert eine algebraische Formel für die Elemente der inversen Matrix. Für kleine Matrizen wie im nachfolgenden Beispiel ist die Formel~\eqref{buch:linalg:inverse:formel} oft einfachter anzuwenden. Besonders einfach wird die Formel für eine $2\times 2$-Matrix, wo man \[ \begin{pmatrix} a&b\\c&d \end{pmatrix}^{-1} = \frac{1}{ad-bc}\begin{pmatrix} d&-b\\ -c&a \end{pmatrix} \] erhält. \begin{beispiel} Die Matrix \begin{equation} A=\begin{pmatrix} 1&a&a\\ a&1&a\\ a&a&1 \end{pmatrix} \label{buch:vektoren-und-matrizen:abeispiel:eqn1} \end{equation} ist mit Hilfe von Determinanten besonders einfach zu invertieren. Die Determinante von $A$ ist nach der Sarrus-Formel Satz~\ref{buch:linear:determinate:sarrus} \[ \operatorname{det}A = 1 + 2a^3 - 3a^2. \] Die Adjunkte ist \begin{align*} (\operatorname{adj}A)^t &= %\frac{1}{\det{A}} \begin{pmatrix*}[r] \det A_{11} & -\det A_{21} & \det A_{31} \\ -\det A_{12} & \det A_{22} & -\det A_{32} \\ \det A_{13} & -\det A_{23} & \det A_{33} \end{pmatrix*} \intertext{und damit ist die inverse Matrix} A^{-1} &= \frac{1}{2a^3-3a^2+1} \renewcommand\arraystretch{1.1} \begin{pmatrix*}[r] \left|\begin{matrix}1&a\\a&1\end{matrix}\right| & -\left|\begin{matrix}a&a\\a&1\end{matrix}\right| & \left|\begin{matrix}a&a\\1&a\end{matrix}\right| \\[10pt] -\left|\begin{matrix}a&a\\a&1\end{matrix}\right| & \left|\begin{matrix}1&a\\a&1\end{matrix}\right| & -\left|\begin{matrix}1&a\\a&a\end{matrix}\right| \\[10pt] \left|\begin{matrix}a&1\\a&a\end{matrix}\right| & -\left|\begin{matrix}1&a\\a&a\end{matrix}\right| & \left|\begin{matrix}1&a\\a&1\end{matrix}\right| \end{pmatrix*} \\ &= \frac{1}{2a^3-3a^2+1} \begin{pmatrix} 1-a^2 & a^2-a & a^2-a\\ a^2-a & 1-a^2 & a^2-a\\ a^2-a & a^2-a & 1-a^2 \end{pmatrix}. \end{align*} Mit $1-a^2=(1+a)(1-a)$ und $a^2-a=a(a-1)$ kann man dies noch etwas vereinfachen, indem man den gemeinsamen Faktor $1-a$ ausklammert. Man erhält so die Form \begin{equation} A^{-1} = \frac{1-a}{2a^3-3a^2+1} \begin{pmatrix} 1+a & -a & -a \\ -a & 1+a & -a \\ -a & -a & 1+a \end{pmatrix}. \label{buch:vektoren-und-matrizen:abeispiel:eqn2} \end{equation} für die Inverse einer Matrix der Form \eqref{buch:vektoren-und-matrizen:abeispiel:eqn1}. \end{beispiel} \subsubsection{Produktregel für die Determinante} Aus der Charakterisierung der Determinanten kann man auch ableiten, dass die Produktregel \index{Produktregel}% \[ \det (AB) = \det(A) \cdot \det(B) \] gilt. Daraus folgt auch, dass $\det(A^{-1})=\det(A)^{-1}$. % % Lineare Abbildungen % \subsection{Lineare Abbildungen \label{buch:grundlagen:subsection:lineare-abbildungen}} Der besondere Nutzen der Matrizen ist, dass sie auch lineare Abbildungen zwischen Vektorräumen beschreiben können. In diesem Abschnitt werden lineare Abbildungen abstrakt definiert und die Darstellung als Matrix mit Hilfe einer Basis eingeführt. \subsubsection{Definition} Eine lineare Abbildung zwischen Vektorräumen muss so gestaltet sein, dass die Operationen des Vektorraums erhalten bleiben. Dies wird von der folgenden Definition erreicht. \begin{definition} \index{lineare Abbildung}% Eine Abbildung $f\colon V\to U$ zwischen Vektorräumen $V$ und $U$ heisst {\em linear}, wenn \[ \begin{aligned} f(v+w) &= f(v) + f(w)&&\forall v,w\in V \\ f(\lambda v) &= \lambda f(v) &&\forall v\in V,\lambda \in \Bbbk \end{aligned} \] gilt. \end{definition} Lineare Abbildungen sind in der Mathematik weit verbreitet, wie die folgenden Beispiele zeigen. \begin{beispiel} Sie $V=C^1([a,b])$ die Menge der stetig differenzierbaren Funktionen auf dem Intervall $[a,b]$ und $U=C([a,b])$ die Menge der stetigen Funktion auf $[a,b]$. Die Ableitung $\frac{d}{dx}$ macht aus einer Funktion $f(x)$ die Ableitung $f'(x)$. Die Rechenregeln für die Ableitung stellen sicher, dass \[ \frac{d}{dx} \colon C^1([a,b]) \to C([a,b]) : f \mapsto f' \] eine lineare Abbildung ist. \end{beispiel} \begin{beispiel} Sei $V$ die Menge der Riemann-integrierbaren Funktionen auf dem Intervall $[a,b]$ und $U=\mathbb{R}$. Das bestimmte Integral \[ \int_a^b \;\colon V \to U : f \mapsto \int_a^b f(x)\,dx \] ist nach den bekannten Rechenregeln für bestimmte Integrale eine lineare Abbildung. \end{beispiel} \subsubsection{Matrix} Um mit linearen Abbildungen rechnen zu können, ist eine Darstellung mit Hilfe von Matrizen nötig. Sei also $\mathcal{B}=\{b_1,\dots,b_n\}$ eine Basis von $V$ und $\mathcal{C} = \{ c_1,\dots,c_m\}$ eine Basis von $U$. Das Bild des Basisvektors $b_i$ kann als Linearkombination der Vektoren $c_1,\dots,c_m$ dargestellt werden. Wir verwenden die Bezeichnung \[ f(b_i) = a_{1i} c_1 + \dots + a_{mi} c_m. \] Die lineare Abbildung $f$ bildet den Vektor $x$ mit Koordinaten $x_1,\dots,x_n$ ab auf \begin{align*} f(x) &= f(x_1b_1 + \dots x_nb_n) \\ &= x_1 f(b_1) + \dots x_nf(b_n) \\ &= x_1(a_{11} c_1 + \dots + a_{m1} c_m) + \dots + x_n(a_{1n} c_1 + \dots + a_{mn} c_m) \\ &= ( a_{11} x_1 + \dots + a_{1n} x_n ) c_1 + \dots + ( a_{m1} x_1 + \dots + a_{mn} x_n ) c_m \end{align*} Die Koordinaten von $f(x)$ in der Basis $\mathcal{C}$ in $U$ sind also gegeben durch das Matrizenprodukt $Ax$, wenn $x$ der Spaltenvektor aus den Koordinaten in der Basis $\mathcal{B}$ in $V$ ist. Die Matrix $A$ heisst die Matrix der linearen Abbildung $f$ in den Basen $\mathcal{B}$ bzw.~$\mathcal{C}$. \index{Matrix einer linearen Abbildung}% Die Matrix einer linearen Abbildung macht Aussagen über eine lineare Abbilung der rechnerischen Untersuchung zugänglich. Allerdings hängt die Matrix einer linearen Abbildung von der Wahl der Basis ab. Gleichzeitig ist dies eine Chance, durch Wahl einer geeigneten Basis kann man eine Matrix in eine Form bringen, die zur Lösung eines Problems optimal geeignet ist. \subsubsection{Basiswechsel} In einem Vektorraum $V$ seien zwei Basen $\mathcal{B}=\{b_1,\dots,b_n\}$ und $\mathcal{B}'=\{b_1',\dots,b_n'\}$ gegeben. Ein Vektor $v\in V$ kann in beiden Basen dargestellt werden. Wir bezeichnen mit dem Spaltenvektor $x$ die Koordinaten von $v$ in der Basis $\mathcal{B}$ und mit dem Spaltenvektor $x'$ die Koordinaten in der Basis $\mathcal{B}'$. Um die Koordinaten umzurechnen, muss man die Gleichung \begin{equation} x_1b_1 + \dots + x_nb_n = x_1'b_1' + \dots + x_n'b_n' \label{buch:vektoren-und-matrizen:eqn:basiswechselgleichung} \end{equation} lösen. Stellt man sich die Vektoren $b_i$ und $b_j'$ als $m$-dimensionale Spaltenvektoren mit $m\ge n$ vor, dann bekommt \eqref{buch:vektoren-und-matrizen:eqn:basiswechselgleichung} die Form eines Gleichungssystems \[ \begin{linsys}{6} b_{11}x_1&+& \dots &+&b_{1n}x_n&=&b_{11}'x_1'&+& \dots &+&b_{1n}'x_n'\\ \vdots & & \ddots& &\vdots & &\vdots & & \ddots& &\vdots \\ b_{m1}x_1&+& \dots &+&b_{mn}x_n&=&b_{m1}'x_1'&+& \dots &+&b_{mn}'x_n' \end{linsys} \] Dieses Gleichungssystem kann man mit Hilfe eines Gauss-Tableaus lösen. Wir schreiben die zugehörigen Variablen in die Kopfzeile der Tableaus. Die Durchführung des Gauss-Algorithmus liefert \[ \renewcommand{\arraystretch}{1.1} \begin{tabular}{|>{$}c<{$} >{$}c<{$} >{$}c<{$}|>{$}c<{$}>{$}c<{$}>{$}c<{$}|} \hline x_1&\dots&x_n&x_1'&\dots&x_n'\\ \hline b_{11}&\dots &b_{1n}&b_{11}'&\dots &v_{1n}'\\ \vdots&\ddots&\vdots&\vdots &\ddots&\vdots \\ b_{n1}&\dots &b_{nn}&b_{n1}'&\dots &v_{nn}'\\ \hline b_{n+1,1}&\dots &b_{n+1,n}&b_{n+1,1}'&\dots &v_{n+1,n}'\\ \vdots&\ddots&\vdots&\vdots &\ddots&\vdots \\ b_{m1}&\dots &b_{mn}&b_{m1}'&\dots &v_{mn}'\\ \hline \end{tabular} \rightarrow \begin{tabular}{|>{$}c<{$} >{$}c<{$} >{$}c<{$}|>{$}c<{$}>{$}c<{$}>{$}c<{$}|} \hline x_1&\dots&x_n&x_1'&\dots&x_n'\\ \hline 1 &\dots &0 &t_{11} &\dots &t_{1n} \\ \vdots&\ddots&\vdots&\vdots &\ddots &\vdots \\ 0 &\dots &1 &t_{n1} &\dots &t_{nn} \\ \hline 0 &\dots &0 &{\color{red}0} &{\color{red}\dots} &{\color{red}0}\\ \vdots&\ddots&\vdots&{\color{red}\vdots}&{\color{red}\ddots}&{\color{red}\vdots}\\ 0 &\dots &0 &{\color{red}0} &{\color{red}\dots} &{\color{red}0}\\ \hline \end{tabular} \] Das rechte untere Teiltableau enthält lauter Nullen genau dann, wenn jeder Vektor in $V$ sich in beiden Mengen $\mathcal{B}$ und $\mathcal{B}'$ ausdrücken lässt. Dies folgt aber aus der Tatsache, dass $\mathcal{B}$ und $\mathcal{B}'$ beide Basen sind, also insbesondere den gleichen Raum aufspannen. Die $n\times n$-Matrix $T$ mit Komponenten $t_{i\!j}$ rechnet Koordinaten in der Basis $\mathcal{B}'$ um in Koordinaten in der Basis $\mathcal{B}$. \subsubsection{Basiswechselformel für die Matrix einer linearen Abbildung} Die Matrix einer linearen Abbildung $f\colon U\to V$ ist abhängig von den in $U$ bzw.~$V$ gewählten Basen $\mathcal{B}$ bzw.~$\mathcal{C}$. Wechselt man die Basis und verwendet in $U$ die Basis $\mathcal{B}'$ und in $V$ die Basis $\mathcal{C}'$, dann gibt es Matrizen $T_U$ und $T_V$, die die Koordinaten in $U$ bzw.~$V$ von der gestrichenen Basis in die gestrichen umzurechnen gestattet. Ist $A$ die Matrix von $A$ in den Basen $\mathcal{B}$ und $\mathcal{C}$, dann ist Matrix der gleichen Abbildung in den Basen $\mathcal{B}'$ und $\mathcal{C}'$ gegeben durch die Matrix \begin{equation} A' = T_VAT_U^{-1}. \label{buch:vektoren-und-matrizen:eqn:basiswechselabb} \end{equation} \subsubsection{Umkehrabbbildung} Sei $f$ eine umkehrbare lineare Abbildung $U\to V$ und $g\colon V\to U$. die zugehörige Umkehrabbildung. \index{Umkehrabbildung}% Für zwei Vektoren $u$ und $w$ in $U$ gibt es daher Vektoren $a=g(u)$ und $b=g(w)$ in $V$ derart, dass $f(a)=u$ und $f(b)=w$. Weil $f$ linear ist, folgt daraus $f(a+b)=u+w$ und $f(\lambda a)=\lambda a$ für jedes $\lambda\in\Bbbk$. Damit kann man jetzt \begin{align*} g(u+w)&=g(f(a)+f(b)) = g(f(a+b)) = a+b = g(u)+g(w) \\ g(\lambda u) &= g(\lambda f(a))=g(f(\lambda a)) = \lambda a = \lambda g(u) \end{align*} berechnen, was zeigt, dass auch $g$ eine lineare Abbildung ist. Hat $f$ in geeignet gewählten Basen die Matrix $F$, dann hat die Umkehrabbildung $g=f^{-1}$ die Matrix $G=F^{-1}$. Da auch $f(g(y))=y$ gilt für jeden Vektor $y\in V$ folgt, dass $FF^{-1}=E$ und $F^{-1}F=E$. \subsubsection{Kern und Bild} Für die Eindeutigkeit der Lösung eines linearen Gleichungssytems ist entscheidend, ob das zugehörige homogene Gleichungssystem $Ax=0$ eine nichttriviale Lösung hat. Seine Lösungmenge spielt also eine besondere Rolle, was rechtfertigt, ihr einen Namen zu geben. \begin{definition} \index{Kern}% Ist $f$ eine lineare Abbildung $U\to V$, dann heisst die Menge \[ \ker f = \{x\in U\;|\; f(x)=0\} \] der {\em Kern} oder {\em Nullraum} der linearen Abbildung $f$. \index{Kern}% \index{Nullraum}% Ist $A \in M_{m\times n}(\Bbbk)$ Matrix, dann gehört dazu eine lineare Abbildung $f\colon\Bbbk^n\to\Bbbk^m$. Der Kern oder Nullraum der Matrix $A$ ist die Menge \[ \ker A = \{ x\in\Bbbk^m \;|\; Ax=0\}. \] \end{definition} Der Kern ist ein Unterraum, denn für zwei Vektoren $u,w\in \ker f$ \[ \begin{aligned} f(u+v)&=f(u) + f(v) = 0+0 = 0 &&\Rightarrow& u+v&\in\ker f\\ f(\lambda u)&=\lambda f(u) = \lambda\cdot 0=0&&\Rightarrow& \lambda u&\in\ker f \end{aligned} \] gilt. Ob ein Gleichungssystem $Ax=b$ überhaupt eine Lösung hat, hängt davon, ob der Vektor $b$ als Bild der durch $A$ beschriebenen linearen Abbildung $\Bbbk^n \to \Bbbk^m$ dargestellt werden kann. Wir definieren daher das Bild einer linearen Abbildung oder Matrix wie folgt. \begin{definition} Ist $f\colon V\to U$ eine lineare Abbildung dann ist das Bild von $f$ der Unterraum \[ \operatorname{im}f = \{ f(v)\;|\;v\in V\} \subset U \] von $U$. Das {\em Bild} einer $m\times n$-Matrix $A$ ist die Menge \[ \operatorname{im}A = \{ Av \;|\; v\in\Bbbk^n\} \subset \Bbbk^m. \] \end{definition} \index{Bild}% Zwei Vektoren $a,b\in\operatorname{im} f$ haben Urbilder $u,w\in V$ mit $f(u)=a$ und $f(w)=b$. Für Summe und Multiplikation mit Skalaren folgt \[ \begin{aligned} a+b &= f(u)+f(v)=f(u+v) & \Rightarrow & a+b &\in\operatorname{im}f\\ \lambda a &=\lambda f(u) = f(\lambda u) & \Rightarrow & \lambda a &\in\operatorname{im}f, \end{aligned} \] also ist auch das Bild $\operatorname{im}f$ ein Unterraum von $U$. Das Bild der Matrix $A$ ist der Unterraum \[ \{ x_1f(b_1) + \dots x_n f(b_n) \,|\, x_i\in\Bbbk\} = \langle f(b_1),\dots,f(b_n)\rangle = \langle a_1,\dots,a_n\rangle \] von $\Bbbk^m$, aufgespannt von den Spaltenvektoren $a_i$ von $A$. \subsubsection{Rang und Defekt} Die Dimensionen von Bild und Kern sind wichtige Kennzahlen einer Matrix. \begin{definition} Sei $A$ eine Matrix $A\in M_{m\times n}(\Bbbk)$. Der {\em Rang} der Matrix $A$ ist die Dimension des Bildraumes von $A$: $\operatorname{rank}A=\dim\operatorname{im} A$. \index{Rang einer Matrix}% \index{rank@$\operatorname{rank}A$}% Der {\em Defekt} der Matrix $A$ ist die Dimension des Kernes von $A$: $\operatorname{def}A=\dim\ker A$. \index{Defekt einer Matrix}% \end{definition} Da der Kern mit Hilfe des Gauss-Algorithmus bestimmt werden kann, können Rang und Defekt aus dem Schlusstableau eines homogenen Gleichungssystems mit $A$ als Koeffizientenmatrix abgelesen werden. \begin{satz} Ist $A\in M_{m\times n}(\Bbbk)$ eine $m\times n$-Matrix, dann gilt \[ \operatorname{rank}A = n-\operatorname{def}A. \] \end{satz} \begin{proof}[Beweis] Der Defekt der Matrix $A$ ist die Dimension des Kernes, also die Dimension des Lösungsraumes des homogenen Gleichungssystems mit Koeffizientenmatrix $A$. Dies ist auch die Anzahl der frei wählbaren Variablen nach der Durchführung des Gaussalgorithmus Die behauptete Bezieung kann man jetzt unmittelbar aus dem Schlusstableau \begin{center} \begin{tikzpicture}[>=latex,thick,scale=0.5] \draw (0,0) rectangle (8,7); \draw (0,3) -- (8,3); \draw (4,0) -- (4,7); \node at (0.5,6.5) {$1$}; \node at (2,5.25) {$\ddots$}; \node at (3.5,3.5) {$1$}; \node at (4.5,6.5) {$*$}; \node at (4.5,3.5) {$*$}; \node at (7.5,6.5) {$*$}; \node at (7.5,3.5) {$*$}; \node at (4.5,5.25) {$\vdots$}; \node at (7.5,5.25) {$\vdots$}; \node at (6,3.5) {$\cdots$}; \node at (6,6.5) {$\cdots$}; \node at (6,5.25) {$\ddots$}; \node at (2,1.5) {$0$}; \node at (6,1.5) {$0$}; \draw[<->] (-0.3,7) -- (-0.3,3); \node at (-0.3,5) [left] {$\operatorname{rank}A$}; \draw[<->] (4,7.3) -- (8,7.3); \node at (6,7.3) [above] {$\operatorname{def}A\mathstrut$}; \node at (2,7.3) [above] {$n-\operatorname{def}A\mathstrut$}; \draw[<->] (0,7.3) -- (4,7.3); \draw[<->] (0,-0.3) -- (8,-0.3); \node at (4,-0.3) [below] {$n$}; \end{tikzpicture} \end{center} ablesen. \end{proof} \subsubsection{Gauss-Algorithmus und Basiswechsel} Die Zeilenoperationen des Gauss-Algorithmus können durch Multiplikation mit Matrizen der Form \[ \begin{pmatrix} 1& & & & & & & \\ &\ddots& & & & & & \\ & &1& & & & & \\ & & &{\color{red}1} & & & & \\ & & &{\color{blue}-a_{i+1,i}}&1& & & \\ & & &{\color{blue}-a_{i+2,i}}& &1& & \\ & & &\vdots & & &\ddots& \\ & & &{\color{blue}-a_{n,i}} & & & &1 \end{pmatrix} \] ausgedrückt werden. Diese Matrizen sind alle invertiertbar. Man kann die Zeilenoperationen also als ein Basiswechsel im Bildraum verstehen. \subsubsection{Quotient} Ist $U\subset V$ ein Unterraum, dann kann man einen neuen Vektorraum $V/U$ bilden, dessen Vektoren Äquivalenzklassen von Vektoren aus $V$ sind, die sich nur um einen Vektor aus $U$ unterscheiden. Wir können solche Vektoren als $v+U$ schreiben. Diese abstrakte Definition des Quotienten kann im Falle des Quotienten $\Bbbk^n / \ker A$ mit Hilfe des Gauss-Algorithmus wesentlich anschaulicher realisiert werden, wie im folgenden Abschnitt gezeigt wird. \subsubsection{Realisierung des Quotienten} Der Quotient besteht aus den Vektoren, die ``übrig'' bleiben, wenn man die Vektoren im Kern mit $0$ identifiziert. Man kann ihn sich als das Bild vorstellen. Etwas konkreter erlaubt der Gauss-Algorithmus, für das Bild $\operatorname{im}A$ eine Basis zu finden. Aus dem Schlusstableau lässt sich zunächst eine Basis des Kernes ablesen, dies sind die ``grünen'' Spalten. Die Pivotspalten bilden dagegen eine Basis für den Bildraum nach dem im vorangegangenen Abschnitt angesprochenen Basiswechsel. Die Pivotspalten beschreiben Vektoren, die durch die Abbildung {\em nicht} zu $0$ gemacht werden. Wendet man $A$ auf die Standardbasisvektoren ab, die zu den Pivospalten gehören, erhält man also eine Basis für da Bild von $A$.