From 679ddbd15f09283aad606f443f3c38361f0ff9cc Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Andreas=20M=C3=BCller?= Date: Sun, 16 Jan 2022 16:51:47 +0100 Subject: many changes in the orthogonality chapter --- buch/chapters/070-orthogonalitaet/orthogonal.tex | 571 +++++++++++------------ 1 file changed, 282 insertions(+), 289 deletions(-) (limited to 'buch/chapters/070-orthogonalitaet/orthogonal.tex') diff --git a/buch/chapters/070-orthogonalitaet/orthogonal.tex b/buch/chapters/070-orthogonalitaet/orthogonal.tex index 9447c6f..d06f46e 100644 --- a/buch/chapters/070-orthogonalitaet/orthogonal.tex +++ b/buch/chapters/070-orthogonalitaet/orthogonal.tex @@ -176,7 +176,7 @@ C([a,b]) \times C([a,b]) \to \mathbb{R} das {\em gewichtete Skalarprodukt} mit {\em Gewichtsfunktion $w(x)$}. \end{definition} -\subsubsection{Gram-Schmidt-Orthonormalisierung} +\subsection{Gram-Schmidt-Orthonormalisierung} In einem reellen Vektorraum $V$ mit Skalarprodukt $\langle\;\,,\;\rangle$ kann aus einer beleibigen Basis $b_1,\dots,b_n$ mit Hilfe des Gram-Schmidtschen Orthogonalisierungsverfahrens immer eine @@ -274,105 +274,16 @@ b_n \end{align*} berücksichtigen dies. -\subsubsection{Selbstadjungierte Operatoren und Eigenvektoren} -Symmetrische Matrizen spielen eine spezielle Rolle in der -endlichdimensionalen linearen Algebra, weil sie sich immer -mit einer orthonormierten Basis diagonalisieren lassen. -In der vorliegenden Situation undendlichdimensionaler Vektorräume -brauchen wir eine angepasste Definition. - -\begin{definition} -Eine lineare Selbstabbildung $A\colon V\to V$ -eines Vektorrraums mit Skalarprodukt -heisst {\em selbstadjungiert}, wenn für alle Vektoren $u,v\in V$ -heisst $\langle Au,v\rangle = \langle u,Av\rangle$. -\end{definition} - -Es ist wohlbekannt, dass Eigenvektoren einer symmetrischen Matrix -zu verschiedenen Eigenwerten orthogonal sind. -Der Beweis ist direkt übertragbar, wir halten das Resultat hier -für spätere Verwendung fest. - -\begin{satz} -Sind $f$ und $g$ Eigenvektoren eines selbstadjungierten Operators $A$ -zu verschiedenen Eigenwerten $\lambda$ und $\mu$, dann sind $f$ und $g$ -orthogonal. -\end{satz} - -\begin{proof}[Beweis] -Im vorliegenden Zusammenhang möchten wir die Eigenschaft nutzen, -dass Eigenfunktionen eines selbstadjungierten Operatores zu verschiedenen -Eigenwerten orthogonal sind. -Dazu seien $Df = \lambda f$ und $Dg=\mu g$ und wir rechnen -\begin{equation*} -\renewcommand{\arraycolsep}{2pt} -\begin{array}{rcccrl} -\langle Df,g\rangle &=& \langle \lambda f,g\rangle &=& \lambda\phantom{)}\langle f,g\rangle -&\multirow{2}{*}{\hspace{3pt}$\biggl\}\mathstrut-\mathstrut$}\\ -=\langle f,Dg\rangle &=& \langle f,\mu g\rangle &=& \mu\phantom{)}\langle f,g\rangle& -\\[2pt] -\hline - 0 & & &=& (\lambda-\mu)\langle f,g\rangle& -\end{array} -\end{equation*} -Da $\lambda-\mu\ne 0$ ist, muss $\langle f,g\rangle=0$ sein. -\end{proof} - -\begin{beispiel} -Sei $C^1([0,2\pi], \mathbb{C})=C^1(S^1,\mathbb{C})$ -der Vektorraum der $2\pi$-periodischen differenzierbaren Funktionen mit -dem Skalarprodukt -\[ -\langle f,g\rangle -= -\frac{1}{2\pi}\int_0^{2\pi} \overline{f(t)}g(t)\,dt -\] -enthält die Funktionen $e_n(t) = e^{int}$. -Der Operator -\[ -D=i\frac{d}{dt} -\] -ist selbstadjungiert, denn mit Hilfe von partieller Integration erhält man -\[ -\langle Df,g\rangle -= -\frac{1}{2\pi} -\int_0^{2\pi} -\underbrace{ -\overline{i\frac{df(t)}{dt}} -}_{\uparrow} -\underbrace{g(t)}_{\downarrow} -\,dt -= -\underbrace{ -\frac{-i}{2\pi} -\biggl[ -\overline{f(t)}g(t) -\biggr]_0^{2\pi} -}_{\displaystyle=0} -+ -\frac{1}{2\pi} -\int_0^{2\pi} -\overline{f(t)}i\frac{dg(t)}{dt} -\,dt -= -\langle f,Dg\rangle -\] -unter Ausnützung der $2\pi$-Periodizität der Funktionen. - -Die Funktionen $e_n(t)$ sind Eigenfunktionen des Operators $D$, denn -\[ -De_n(t) = i\frac{d}{dt}e^{int} = -n e^{int} = -n e_n(t). -\] -Nach obigem Satz sind die Eigenfunktionen von $D$ orthogonal. -\end{beispiel} - -Das Beispiel illustriert, dass orthogonale Funktionenfamilien -ein automatisches Nebenprodukt selbstadjungierter Operatoren sind. - - -% XXX Orthogonalisierungsproblem so formulieren, dass klar wird, -% XXX dass man ein "Normierungskriterium braucht. +% +% Legendre-Polynome +% +\subsection{Legendre-Polynome +\label{buch:orthogonal:subsection:legendre-polynome}} +Der Gram-Schmidtsche Orthogonalisierungsprozess kann für jedes beliebige +Skalarprodukt aus der Folge $1$, $x$, $x^2,\dots$ der Monome ein +Folge von orthogonalisierten Polynomen machen. +In diesem Abschnitt rechnen wir den Fall konstanter Gewichtsfunktione +$w(x)=1$ durch, er führt auf die sogenannten {\em Legendre-Polynome}. Da wir auf die Normierung verzichten, brauchen wir ein anderes Kriterium, welches die Polynome eindeutig festlegen kann. @@ -380,6 +291,10 @@ Wir bezeichnen das Polynom vom Grad $n$, das bei diesem Prozess entsteht, mit $P_n(x)$ und legen willkürlich aber traditionskonform fest, dass $P_n(1)=1$ sein soll. +% +% Symmetrie-Eigenschaften +% +\subsubsection{Symmetrieeigenschaften} Das Skalarprodukt berechnet ein Integral eines Produktes von zwei Polynomen über das symmetrische Interval $[-1,1]$. Ist die eine gerade und die andere ungerade, dann ist das @@ -403,6 +318,7 @@ dargestellt. \end{figure} \begin{lemma} +\label{buch:orthogonal:lemma:symmetrie} Die Polynome $P_{2n}(x)$ sind gerade, die Polynome $P_{2n+1}(x)$ sind ungerade Funktionen von $x$. \end{lemma} @@ -435,6 +351,10 @@ $P_{n-4}(x)$ ist, die die gleiche Parität wie $x^n$ haben. Also hat auch $P_n(x)$ die gleiche Parität, was das Lemma beweist. \end{proof} +% +% Orthogonalisierung nach Gram-Schmidt +% +\subsubsection{Orthogonalisierung mit Gram-Schmidt} Die Ortogonalisierung von $x^2$ liefert daher \[ p(x) = x^2 @@ -476,7 +396,7 @@ Für $P_3(x)$ brauchen wir nur die Skalaprodukte \qquad \Rightarrow \qquad -p(x) = x^3 - \frac{\frac25}{\frac23}x=x^3-\frac{3}{5}x +p(x) = x^3 - \frac{\;\frac25\;}{\frac23}x=x^3-\frac{3}{5}x \] Die richtige Standardisierung ergibt sich, indem man durch $p(1)=\frac25$ dividiert, also @@ -516,7 +436,7 @@ Die Skalarprodukte sind = \int_{-1}^1 \frac14(9x^4-6x^2+1)\,dx = -\frac14(\frac{18}{5}-4+2) +\frac14\biggl(\frac{18}{5}-4+2\biggr) =\frac25. \end{align*} Daraus folgt für $p(x)$ @@ -604,219 +524,292 @@ dass die die beiden Polynome $P_4(x)$ und $P_7(x)$ orthogonal sind. Das Produkt $P_4(x)\cdot P_7(x)$ hat Integral $=0$. % -% Rekursionsrelation +% Verschiedene Gewichtsfunktionen +% +\subsection{Gewichtsfunktionen +\label{buch:orthogonal:subsection:gewichtsfunktionen}} +Das Standardskalarprodukt auf dem Raum der Funktionen auf dem +Interval $[-1,1]$ ist das Skalarprodukt mit der Gewichtsfunktion +$w(x)=1$, es führt auf die Legendre-Polynome. +Die Wahl einer anderen Gewichtsfunktion ändert natürlich +das Resultat der Orthogonalisierung. +Nullstellen und Pole der Gewichtsfunktion ändern die Menge der +Funktionen, für die das Skalarprodukt definiert. +Diesem Zusammenhang soll im ersten Unterabschnitt nachgegangen werden. +Danach sollen verschiedene für die Praxis relevante Gewichtsfunktionen +vorgestellt werden. + +\begin{figure} +\centering +\includegraphics{chapters/070-orthogonalitaet/images/weight.pdf} +\caption{Nullstellen und Pole der Gewichtsfunktion (rot) legen Ort +und Grad von Polen und Nullstellen der Funktionen fest, die beschränkte +$\|\,\cdot\,\|_w$-Norm haben. +An den Stellen $\pm 1$ und $\pm\frac12$ hat die Gewichtsfunktion +Pole bzw.~Nullstellen mit Grad $\alpha$. +Der blaue Bereich deutet an, wie schnell die Funktion $f$ in diesem +Bereich anwachsen kann, bzw.~wie schnell nahe der Polstelle gegen $0$ +gehen muss. +\label{buch:orthogonalitaet:fig:gewicht}} +\end{figure} +% +% Pole und Nullstellen der Gewichtsfunktion % -\subsection{Drei-Term-Rekursion -\label{buch:orthogonal:subsection:rekursionsrelation}} -Die Berechnung der Legendre-Polynome mit Hilfe des Gram-Schmidt-Verfahrens -ist ausserordentlich mühsame wenig hilfreich, wenn es darum geht, Werte -der Polynome zu berechnen. -Glücklicherweise erfüllen orthogonale Polynome automatisch eine -Rekursionsbeziehung mit nur drei Termen. -Zum Beispiel kann man zeigen, dass für die Legendre-Polynome die -Relation +\subsubsection{Pole und Nullstellen +\label{buch:orthogonal:pole-und-nullstellen}} +Das Skalarprodukt $\langle\,\;,\;\rangle_w$ ist nur sinnvoll +für Funktionen $f(x)$, für die die Norm $\|f\|_w$ definiert ist. +An einer Nullstelle $x_0$ der Gewichtsfunktion $w$ darf die Funktion $f$ +einen Pol haben. +Solange $f(x)$ für $x\to x_0$ nicht zu schnell divergiert, kann +das Produkt $|f(x)|^2 w(x)$ immer noch integrierbar sein. + +Um dies etwas genauer zu quantifizieren, nehmen wir an, dass +$w(x)$ an der Stelle $x_0$ eine Nullstelle vom Grad $\alpha$ hat. +Dies bedeutet, dass $w(x) \approx C|x-x_0|^\alpha$ ist für eine geeignete +Konstante $C$ und für $|x-x_0|<\varepsilon$. +Ein Pol von $f$ vom Grad $a$ an der Stelle $x_0$ führt entsprechend auf +eine Abschätzung $|f(x)| \approx D|f(x)|^{-a}$ für $|x-x_0|<\varepsilon$. +Dann ist +\[ +|f(x)|^2 w(x) \approx CD |x-x_0|^{\alpha-2a}. +\] +Für das Integral in der Nähe von $x_0$ ist \begin{align*} -nP_n(x) &= (2n-1)xP_{n-1}(x) - (n-1)P_{n-2}(x),\;\forall n\ge 2, +\int_{x_0-\varepsilon}^{x_0+\varepsilon} +|f(x)|^2 w(x)\,dx +&\approx +CD +\int_{x_0-\varepsilon}^{x_0+\varepsilon} +|x-x_0|^{\alpha-2a}\,dx \\ -P_1(x) &= x, -\\ -P_0(x) &= 1. +&= +2CD +\int_0^\varepsilon +t^{\alpha-2a} +\,dt += +2CD +\begin{cases} +\displaystyle +\; +\biggl[\frac{t^{\alpha-2a+1}}{\alpha-2a+1}\biggr]_0^\varepsilon +&\qquad +\alpha-2a\ne-1 +\\[7pt] +\displaystyle +\; +\biggl[ \log t \biggr]_0^\varepsilon +&\qquad +\text{sonst.} +\end{cases} \end{align*} -Mit so einer Rekursionsbeziehung ist es sehr einfach, die Funktionswerte -für alle $P_n(x)$ zu berechnen. +Der Zähler $t^{\alpha-2a+1}$ divergiert für $t\to 0$ genau dann, +wenn $\alpha-2a+1<0$ oder $\alpha<2a-1$. +Auch im zweiten Fall, für $\alpha-2a+1=0$, divergiert das Integral. +Damit die Norm $\|f\|_w$ definiert ist, muss also $a<\frac12(\alpha+1)$ +sein. + +Ganz ähnlich führt eine Polstelle von $w$ vom Grad $\alpha$ +an der Stelle $x_0$ dazu, dass $f$ dort eine Nullstelle vom Grad +$a$ haben muss. +Das Normintegral konvergiert nur, wenn $2a-\alpha > -1$ ist +oder $a > \frac12(\alpha+1)$. + +Pole der Gewichtsfunktion schränken also ein, welche Funktionen +überhaupt der Untersuchung mit Hilfe des Skalarproduktes +$\langle\,\;,\;\rangle_w$ zugänglich sind +(Abbildung~\ref{buch:orthogonalitaet:fig:gewicht}). +Ist die Ordnung $\alpha$ des Poles grösser als $1$, dann müssen die Funktionen +eine Nullstelle mindestens vom Grad $\frac12(a+1)$ haben. +Nullstellen der Gewichtsfunktion erweitern die Klasse der Funktionen. +Ist die Ordnung der Nullstelle $\alpha$, dann dürfen die Funktionen einen +Pol der Ordnung kleiner als $\frac12(\alpha+1)$ haben. -\begin{definition} -Eine Folge von Polynomen $p_n(x)$ heisst orthogonal bezüglich des -Skalarproduktes $\langle\,\;,\;\rangle_w$, wenn +\begin{lemma} +\label{buch:orthogonal:lemma:gewichtsfunktion} +Sei $w(x)\ge 0$ auf dem Intervall $(a,b)$. +Der Vektorraum $H_w$ von auf $(a,b)$ definierten Funktionen sei \[ -\langle p_n,p_m\rangle_w = h_n \delta_{nm} +H_w += +\biggl\{ +f:\colon(a,b) \to \mathbb{R} +\;\bigg|\; +\int_a^b |f(x)|^2 w(x)\,dx +\biggr\}. \] -für alle $n$, $m$. -\end{definition} +Die Funktionen $f\in H_w$ haben folgende Eigenschaften +\begin{enumerate} +\item +Ist $\xi\in[a,b]$ eine Nullstelle vom Grad $\alpha$ der Funktion $w(x)$, +dann +\item +Ist $\xi\in[a,b]$ eine Polstelle vom Grad $a$ der Funktion $w(x)$, +dann hat $f$ eine Nullstelle mindestens from Grad +\end{enumerate} +\end{lemma} -\subsubsection{Allgemeine Drei-Term-Rekursion für orthogonale Polynome} -Der folgende Satz besagt, dass $p_n$ eine Rekursionsbeziehung erfüllt. -\begin{satz} -\label{buch:orthogonal:satz:drei-term-rekursion} -Eine Folge bezüglich $\langle\,\;,\;\rangle_w$ orthogonaler Polynome $p_n$ -mit dem Grade $\deg p_n = n$ erfüllt eine Rekursionsbeziehung der Form -\begin{equation} -p_{n+1}(x) -= -(A_nx+B_n)p_n(x) - C_np_{n-1}(x) -\label{buch:orthogonal:eqn:rekursion} -\end{equation} -für $n\ge 0$, wobei $p_{-1}(x)=0$ gesetzt wird. -Die Zahlen $A_n$, $B_n$ und $C_n$ sind reell und es ist -$A_{n-1}A_nC_n\ge 0$ für $n>0$. -Wenn $k_n>0$ der Leitkoeffizient von $p_n(x)$ ist, dann gilt -\begin{equation} -A_n=\frac{k_{n+1}}{k_n}, -\qquad -C_{n+1} = \frac{A_{n+1}}{A_n}\frac{h_{n+1}}{h_n}. -\label{buch:orthogonal:eqn:koeffizientenrelation} -\end{equation} -\end{satz} - -\subsubsection{Multiplikationsoperator mit $x$} -Man kann die Relation auch nach dem Produkt $xp_n(x)$ auflösen, dann -wird sie -\begin{equation} -xp_n(x) -= -\frac{1}{A_n}p_{n+1}(x) -- -\frac{B_n}{A_n}p_n(x) -+ -\frac{C_n}{A_n}p_{n-1}(x). -\label{buch:orthogonal:eqn:multixrelation} -\end{equation} -Die Multiplikation mit $x$ ist eine lineare Abbildung im Raum der Funktionen. -Die Relation~\eqref{buch:orthogonal:eqn:multixrelation} besagt, dass diese -Abbildung in der Basis der Polynome $p_k$ tridiagonale Form hat. - -\subsubsection{Drei-Term-Rekursion für die Tschebyscheff-Polynome} -Eine Relation der Form~\eqref{buch:orthogonal:eqn:multixrelation} -wurde bereits in -Abschnitt~\ref{buch:potenzen:tschebyscheff:rekursionsbeziehungen} -hergeleitet. -In der Form~\eqref{buch:orthogonal:eqn:rekursion} geschrieben lautet -sie +% +% Die Jacobische Gewichtsfunktion +% +\subsubsection{Jacobische Gewichtsfunktion} +Die Gewichtsfunktion für die Legendre-Polynome war $w(x)=1$, alle +Punkte im Intervall $(-1,1)$ hatten das gleiche Gewicht. +Diese soll jetzt ersetzt werden durch eine Gewichtsfunktion, die +den Punkten an den Intervallenden mehr oder weniger Gewicht gibt, +wobei auch zugelassen sein soll, dass die Gewichtung nicht symmetrisch +ist. + +\begin{definition} +\label{buch:orthogonal:def:jacobi-gewichtsfunktion} +Die {\em Jacobi-Gewichtsfunktion} ist die Funktion +\index{Jacobi-Gewichtsfunktion}% \[ -T_{n+1}(x) = 2x\,T_n(x)-T_{n-1}(x). +w^{(\alpha,\beta)} +\colon (-1,1)\to\mathbb{R} +: +x\mapsto w^{(\alpha,\beta)}(x) = (1-x)^\alpha(1+x)^\beta \] -also -$A_n=2$, $B_n=0$ und $C_n=1$. - -\subsubsection{Beweis von Satz~\ref{buch:orthogonal:satz:drei-term-rekursion}} -Die Relation~\eqref{buch:orthogonal:eqn:multixrelation} zeigt auch, -dass der Beweis die Koeffizienten $\langle xp_k,p_j\rangle_w$ -berechnen muss. -Dabei wird wiederholt der folgende Trick verwendet. -Für jede beliebige Funktion $f$ mit $\|f\|_w^2<\infty$ ist +mit $\alpha,\beta\in\mathbb{R}$. +Das Skalarprodukt zugehörige Skalarprodukt wird auch als \[ -\langle fp_k,p_j\rangle_w +\langle\,\;,\;\rangle_{w^{(\alpha,\beta)}} = -\langle p_k,fp_j\rangle_w. +\langle\,\;,\;\rangle_{(\alpha,\beta)} \] -Für $f(x)=x$ kann man weiter verwenden, dass $xp_k(x)$ ein Polynom -vom Grad $k+1$ ist. -Die Gleichheit $\langle xp_k,p_j\rangle_w=\langle p_k,xp_j\rangle_w$ -ermöglicht also, den Faktor $x$ dorthin zu schieben, wo es nützlicher ist. - -\begin{proof}[Beweis des Satzes] -Multipliziert man die rechte Seite von -\eqref{buch:orthogonal:eqn:rekursion} aus, dann ist der einzige Term -vom Grad $n+1$ der Term $A_nxp_n(x)$. -Der Koeffizient $A_n$ ist also dadurch festgelegt, dass -\begin{equation} -b(x) +bezeichnet und die zugehörige Norm mit +\[ +\|f\|_{(\alpha,\beta)} += +\langle f,f\rangle_{(\alpha,\beta)} = -p_{n+1}(x) - A_nxp_n(x) -\label{buch:orthogonal:rekbeweis} -\end{equation} -Grad $\le n$ hat. -Dazu müssen sich die Terme vom Grad $n+1$ in den Polynomen wegheben, -d.~h.~$k_{n+1}-A_nk_n=0$, woraus die erste Beziehung in -\eqref{buch:orthogonal:eqn:koeffizientenrelation} folgt. - -Die Polynome $p_k$ sind durch Orthogonalisierung der Monome -$1$, $x$,\dots $x^{k}$ entstanden. -Dies bedeutet, dass $\langle p_n,x^k\rangle_w=0$ für alle $kj+1$ folgt, dass der zweite Term verschwindet. -Somit sind alle $b_j=0$ mit $j