diff options
18 files changed, 2135 insertions, 316 deletions
diff --git a/buch/chapters/010-potenzen/potenzreihen.tex b/buch/chapters/010-potenzen/potenzreihen.tex index 7fe03eb..932e1e4 100644 --- a/buch/chapters/010-potenzen/potenzreihen.tex +++ b/buch/chapters/010-potenzen/potenzreihen.tex @@ -5,12 +5,452 @@ % \section{Potenzreihen \label{buch:potenzen:section:potenzreihen}} +Nach dem Satz von Weierstrass können +Polynome beliebige stetige Funktionen approximieren. +Die Ableitungen werden dabei meistens nicht gut wiedergegeben. +Die Partialsummen einer Potenzreihe sind ebenfalls Polynome, +die aber nicht nur die Funktion sondern auch alle ihre Ableitungen +gut approximieren. +% +% Definition +% \subsection{Definition \label{buch:potenzen:potenzreihen:section:definition}} +Eine Folge von Polynomen, deren Terme niedrigen Grades sich nicht +mehr ändern, bei der also immer nur neue Terme höheren Grades +hinzukommen, heisst eine Potenzreihe. -\subsection{Konvergenzkriterien -\label{buch:potenzen:potenzreihen:section:konvergenzkriterien}} +\begin{definition} +\label{buch:polynome:def:potenzreihe} +\index{Potenzreihe}% +Eine {\em Potenzreihe} an der Stelle $z_0$ ist eine unendliche Reihe +der Form +\[ +f(z) += +\sum_{k=0}^\infty a_k (z-z_0)^k +\] +mit Koeffizienten $a_k\in \mathbb{R}$ oder $a_k\in\mathbb{C}$. +\end{definition} + +Die Berechnung einer Potenzreihe ist möglich, wenn die Terme höheren +Grades an Bedeutung verlieren. + +\begin{definition} +\index{Partialsumme}% +\index{konvergent, Potenzreihe}% +Eine Potenzreihe heisst {\em konvergent}, die Folge der {\em Partialsummen} +\[ +s_n = \sum_{k=0}^n a_k(z-z_0)^k +\] +konvergiert. +Sie heisst absolut konvergent, wenn die Reihe +\[ +\sum_{k=0}^\infty |a_k (z-z_0)^k| +\] +konvergiert. +\end{definition} +Die Koeffizienten $a_k$ dürfen also nicht schnell anwachsen +werden, denn normalerweise wird bei Polynomen das Verhalten von den +Termen höheren Grades dominiert. +Die Tschebyscheff-Polynome waren ja so konstruiert worden, dass +es nicht zu unzweckmässig starken Oszillationen im Intervall $(-1,1)$ +kommt. + +% +% Geometrische Reihe +% \subsection{Die geometrische Reihe \label{buch:potenzen:potenzreihen:section:geometrische}} +Die wohl einfachste Potenzreihe ist die Reihe mit Koeffizienten +$a_k=a$ für alle $k$, also +\[ +f(z) += +\sum_{k=0}^\infty az^k += +a+az+az^2+az^3+az^4+\dots +\] +Sie ist charakterisiert durch die Eigenschaft, dass aufeinanderfolgende +Reiheglieder den konstanten Quotienten $z$ haben. +Diese Idee wird +in Abschnitt~\ref{buch:rekursion:section:hypergeometrische-funktion} +auf Quotienten verallgemeinert, die rationale Funktionen sind. +Sie heissen hypergeometrische Funktionen. +\index{hypergeometrische Funktion}% + +Sie ist konvergent für $|z|<1$ und divergent für $|z|\ge 1$. +Sie heisst die {\em geometrische Reihe}. +Sie wird gerne als ``Vergleichsreihe'' eingesetzt um die +Konvergenz oder Divergenz anderer Reihen nachzuweisen. + +Die geometrische Reihe lässt sich direkt summieren. +Dazu betrachtet man die Differenz der Partialsumme $s_n$ und $zs_n$: +\[ +\renewcommand{\arraycolsep}{2pt} +\begin{array}{rcrcrcrcrcrcrl} + s_n &=& a&+&az&+&az^2&+&\dots&+&az^n& & &\multirow{2}{*}{\hspace{3pt}$\biggl\}\mathstrut-\mathstrut$}\\ +z\phantom{)}s_n &=& & &az&+&az^2&+&\dots&+&az^n&+&az^{n+1\phantom{.}}&\\ +\hline +(1-z)s_n&=& a& & & & & & & & &-&az^{n+1}.& +\end{array} +\] +Durch Auflösen nach $s_n$ erhält man die Summenformel +\[ +s_n = a\frac{1-z^{n+1}}{1-z}. +\] +Für $|z|<1$ geht $z^n\to 0$ für $n\to\infty$, die Partialsummen +konvergieren und wir erhalten das Resultat des folgenden Satzes. + +\begin{satz} +\label{buch:polynome:satz:geometrischereihe} +Die geometrische Reihe $a+az+az^2+\dots$ konvergiert für $|z|<1$ und hat +die Summe +\[ +\sum_{k=0}^\infty az^k = \frac{a}{1-z}. +\] +Für $|z|\ge 1$ divergiert die geometrische Reihe. +\end{satz} + +% +% Konvergenzkriterien +% +\subsection{Konvergenzkriterien +\label{buch:potenzen:potenzreihen:section:konvergenzkriterien}} +Die Konvergenz von Reihen ist oft durch Vergleich mit anderen, bereits +als konvergent erkannten Reihen nachweisbar. +Dies ist der Inhalt des folgenden, wohlbekannten Majorantenkriteriums. + +\begin{satz}[Majorantenkriterium] +\label{buch:polynome:satz:majorantenkriterium} +\index{Majorantenkriterium} +Seien $a_k$ und $b_k$ die Glieder zweier unendlicher Reihen. +Es sei zudem $b_k\ge 0$ für alle $k$ und die Reihe +$\sum_{k=0}^\infty b_k$ sei konvergent. +Wenn $|a_k|\ge b_k$ ist für fast alle $k$, dann ist die Reihe +\( +\sum_{k=}^\infty a_k +\) +absolut konvergent. +\end{satz} + +\subsubsection{Quotienten- und Wurzelkriterium} +Der Satz~\ref{buch:polynome:satz:geometrischereihe} ermöglicht, +Potenzreihen mit der geometrischen Reihe zu vergleichen und +liefert damit einfach anzuwende Kriterien für die Konvergenz. + +\begin{satz}[Quotientenkriterium] +\label{buch:polynome:satz:quotientenkriterium} +\index{Quotientenkriterium}% +Eine Reihe +\( +\sum_{k=0}^\infty a_k +\) +ist absolut konvergent, wenn es eine Zahl $q<1$ gibt derart, dass +\begin{equation} +\biggl|\frac{a_{k+1}}{a_k}\biggr|\le q. +\label{buch:polynome:eqn:quotienten-kriterium} +\end{equation} +Die Reihe ist divergent, wenn für fast alle $k$ +\[ +\biggl|\frac{a_{k+1}}{a_k}\biggr| \ge 1 +\] +gilt. +\end{satz} + +\begin{proof}[Beweis] +Wenn \eqref{buch:polynome:eqn:quotienten-kriterium} erfüllt ist, dann +gilt +\[ +|a_k| \le |a_0| q^k +\] +und damit ist die Reihe majorisiert durch die geometrische Reihe +\[ +\sum_{k=0}^\infty +|a_0|q^k, +\] +die unter der gegebenen Voraussetzung konvergiert. +\end{proof} + +\begin{satz}[Wurzelkriterium] +\label{buch:polynome:satz:wurzelkriterium} +\index{Wurzelkriterium} +Falls +\begin{equation} +\limsup_{n\to\infty} \root{n}\of{|a_n|} = C < 1 +\label{buch:polynome:eqn:wurzel-kriterium} +\end{equation} +ist die Reihe +\( +\sum_{k=0}^\infty a_k +\) +absolut konvergent. +\end{satz} + +\begin{proof}[Beweis] +Falls $\root{k}\of{|a_k|}\le q<1$, dann gilt +$|a_k|<q^k$ für alle $k$. +Somit wird die Reihe majorisiert durch die geometrische Reihe +mit Quotient $q$ und ist damit konvergent. + +Das Kriterium \eqref{buch:polynome:eqn:wurzel-kriterium} bedeutet, +dass es zu einem gegebenen $\varepsilon > 0$ ein $N$ gibt derart, +dass $\root{n}\of{|a_k|} < C+\varepsilon$ für $n>N$. +Wählt man $\varepsilon = (1-C)/2$ wird $q=C+\varepsilon=(1+C)/2<1$, +das Reststück der Reihe ab Index $N$ ist daher wieder majorisiert +durch eine konvergente geometrische Reihe. +\end{proof} + +\subsubsection{Konvergenzradius} +Das Quotienten- und das Wurzel-Kriterium ist auf beliebige Reihen +anwendbar, es berücksichtigt nicht, dass in einer Potenzreihe +die Faktoren $(z-z_0)^k$ für kleine $|z-z_0|$ das Kleiner werden +der Reihenglieder und damit die Konvergenz begünstigen. +Diese Eigenschaft wird vom Konvergenzradius eingefangen, der wie +folgt definiert ist. + +\begin{definition} +\label{buch:polynome:definition:konvergenzradius} +\index{Konvergenzradius}% +Der {\em Konvergenzradius} einer Potenzreihe $\sum_{k=0}^\infty a_k(z-z_0)^k$ +um den Punkt $z_0$ ist +\[ +\varrho = \sup \biggl\{ |z-z_0|\;\bigg|\; +\text{$\displaystyle\sum_{k=0}^\infty a_k(z-z_0)^k$ konvergiert} +\biggr\}. +\] +\end{definition} + +\begin{satz} +\label{buch:polynome:satz:konvergenzradius} +Der Konvergenzradius $\varrho$ einer Potenzreihe +$\sum_{k=0}^\infty a_k(z-z_0)^k$ ist +\begin{equation} +\frac{1}{\varrho} += +\limsup_{k\to\infty} \root{n}\of{|a_k|}. +\label{buch:polynome:eqn:konvergenzradius} +\end{equation} +\end{satz} + +\begin{proof}[Beweis] +Wir wenden das Wurzelkriterium auf ein $z$ mit $|z-z_0|<\varrho$ an. +Es gilt +\[ +\root{k}\of{|a_k(z-z_0)^k|} += +|z-z_0|\root{k}\of{|a_k|} +\qquad +\Rightarrow +\qquad +\limsup_{k\to\infty}\root{k}\of{|a_k(z-z_0)^k|} += +|z-z_0| \underbrace{\limsup_{k\to\infty}\root{k}\of{|a_k|}}_{\displaystyle=\frac{1}{\varrho}} +< +1. +\] +Nach dem Wurzelktrierium folgt daher, dass die Reihe +$\sum_{k=0}^\infty a_k(z-z_0)^k$ absolut konvergent ist. +\end{proof} + +\begin{beispiel} +Der Konvergenzradius der geometrischen Reihe $1+z+z^2+\dots$ ist +\[ +\frac{1}{\varrho} += +\limsup_{n\to\infty} \root{n}\of{|a_n|} += +\limsup_{n\to\infty} \root{n}\of{1} += +1. +\] +Dies deckt sich mit der bereits bekannten Tatsache, dass die +geometrische Reihe für $|z|<1$ konvergiert. +Man beachte auch, dass der Konvergenzradius genau die Entfernung +vom Entwicklungspunkt $z_0=0$ und dem Pol der Summe $1/(1-z)$ bei +$z=1$ ist. +Auf diese allgemeingültige Eigenschaft wird in Abschnitt +\ref{buch:funktionentheorie:subsection:konvergenzradius} +eingegangen. +\end{beispiel} + +% +% Tayler-Reihe +% +\subsection{Die Taylor-Reihe +\label{buch:polynome:subsection:taylor-reihe}} +Nicht nur der Funktionswert eines Polynoms, sondern auch alle +seine Ableitungen sind sehr einfach zu berechnen. +Dies macht Potenzreihen besonders nützlich im Zusammenhang +mit Lösungen von Differentialgleichungen, wie in Abschnitt +\ref{buch:differentialgleichungen:section:potenzreihenmethode} +untersucht werden wird. +In diesem Abschnitt wird die Taylor-Reihe motiviert, die sich +aus den Ableitungen einer differenzierbaren Funktion konstruieren +lässt. + +\subsubsection{Ableitung einer Potenzreihe} +Eine Potenzreihe +$f(z)=\sum_{k=0}^n a_kz^k$ +kann gliedweise abgeleitet werden. +Die $k$-te Ableitung ist +\[ +f^{(k)}(z) += +\sum_{n=0}^\infty n(n-1)\cdots(n-k+1) a_nz^{n-k}, +\] +aufeinanderfolgende Terme dieser Reihe haben den Quotienten +\[ +\frac{ +(n+1)n(n-1)\cdots(n-k+2)\phantom{(n-k+1)} +}{ +\phantom{(n+1)}n(n-1)\cdots(n-k+2)(n-k+1) +} +\cdot +\biggl| +\frac{a_{n+1}z^{n+1}}{a_nz^n} +\biggr| += +\frac{n+1}{n-k+1} +\cdot +\biggl| +\frac{a_{n+1}}{a_n} +\biggr| +\cdot|z|. +\] +Da der Quotient $(n+1)/(n-k+1)\to 1$ für $n\to\infty$, ist das +Quotientenkriterium für die Ableitung erfüllt, wenn $|z|$ klein genug ist +und das Kriterium für die Potenzreihe $f(z)$ erfüllt ist. + +\subsubsection{Konvergenzradius der abgeleiteten Reihe} +Der Konvergenzradius $\varrho^{(k)}$ der $k$-fach abgeleiteten Reihe ist +\begin{align*} +\root{n}\of{\mathstrut(n+k)(n+k-1)\cdots(n+1) |a_{n+k}|} +&= +\root{n}\of{\mathstrut(n+k)(n+k-1)\cdots(n+1)} +\cdot +\root{n}\of{|a_{n+k}|} +\end{align*} +mit Limes superior +\begin{align*} +\frac{1}{\varrho^{(k)}} +&= +\limsup_{n\to\infty} +\root{n}\of{\mathstrut(n+k)(n+k-1)\cdots(n+1) |a_{n+k}|} +\\ +&= +\underbrace{ +\lim_{n\to\infty} +\root{n}\of{\mathstrut(n+k)(n+k-1)\cdots(n+1)} +}_{\displaystyle\to 1} +\cdot +\underbrace{ +\limsup_{n\to\infty} +\root{n}\of{\mathstrut|a_{n+k}|} +}_{\displaystyle\to\frac{1}{\varrho}} += +\frac{1}{\varrho}, +\end{align*} +die abgeleitet Reihe hat also den gleichen Konvergenzradius wie die +Reihe für $f(z)$. + +\subsubsection{Berührung $k$-ten Grades} +Man sagt, die Graphen zweier Funktionen $f(z)$ und $g(z)$ berühren +sich im Punkt $z=z_0$ vom Grade $k$, wenn Funktionswerte und +Ableitungen bis zum Grad $k$ beider Funktionen in $z_0$ übereinstimmen. +Die Ableitungen der Potenzfunktion $(z-z_0)^n$ sind nacheinander +\begin{align*} +\frac{d}{dz}(z-z_0)^n&= n(z-z_0)^{n-1}, +\\ +\frac{d^2}{dz^2}(z-z_0)^n&=n(n-1)(z-z_0)^{n-2}, +\\ +\frac{d^3}{dz^3}(z-z_O)^n&=n(n-1)(n-2)(z-z_0)^{n-3}, +\\ +&\vdots +\\ +\frac{d^k}{dz^k}(z-z_0)^n&=n(n-1)(n-2)\dots(n-k+1)(z-z_0)^{n-k}, +\\ +&\vdots +\\ +\frac{d^n}{dz^n}(z-z_0)^n&=n!, +\\ +\frac{d^l}{dz^l}(z-z_0)^n&=0\qquad\forall l>n. +\end{align*} +An der Stelle $z=0$ ist nur genau die $n$-te Ableitung von $0$ verschieden +und hat den Wert $n!$. +Zwei Funktionen $f(z)$ und $g(z)$, die als Potenzreihen im Punkt $z_0$ +geschrieben werden, berühren sich also genau dann vom Grad $k$, wenn +die Funktionswerte und Ableitungen übereinstimmen, d.~h. +\begin{equation} +\left. +\begin{aligned} +f(z)&=\sum_{l=0}^\infty a_l(z-z_0)^l \\ +g(z)&=\sum_{l=0}^\infty b_l(z-z_0)^l +\end{aligned} +\right\} +\quad\Rightarrow\quad +f^{(l)}(z_0) = g^{(l)}(z_0) +\quad\Rightarrow\quad +l!a_l = l!b_l +\quad\Rightarrow\quad +a_l=b_l +\end{equation} +für $l\le k$. +Das Taylor-Polynom ist ein Polynom, welches die gegeben Funktion +von hohem Grad berührt. + +\begin{definition} +\label{buch:polynome:definition:taylor-reihe} +\index{Taylor-Polynom}% +Sie $f(z)$ eine beliebig oft stetig differenzierbare Funktion. +Das {\em Taylor-Polynome} vom Grad $n$ von $f(z)$ an der Stelle +$z_0$ ist die Summe +\begin{equation} +\mathscr{T}_{z_0}^nf (z) += +\sum_{k=0}^n +\frac{f^{(k)}(z_0)}{k!} (z-z_0)^k +\label{buch:polynome:eqn:taylor-polynom} +\end{equation} +\index{Taylor-Reihe} +Die {\em Taylor-Reihe} der Funktion $f(z)$ ist die Reihe +\begin{equation} +\mathscr{T}_{z_0}f (z) += +\sum_{k=0}^\infty +\frac{f^{(k)}(z_0)}{k!} (z-z_0)^k. +\label{buch:polynome:eqn:taylor-reihe} +\end{equation} +\end{definition} + + +\subsubsection{Analytische Funktionen} +Das Taylor-Polynom $\mathscr{T}_{z_0}^nf(z)$ hat an der Stelle $z_0$ +die gleichen Funktionswerte und Ableitungen wie die Funktion $f(z)$, +dies bedeutet aber nicht, dass die Taylorreihe gegen die Funktion +konvergiert. +Das Beispiel auf +Seite~\pageref{buch:funktionentheorie:beispiel:nichtanalytisch} +zeigt, dass dies nicht immer zutrifft. +Von besonderem Interesse sind die Funktionen, die sich durch eine +konvergente Taylor-Reihe ausdrücken lassen. + +\begin{definition} +\label{buch:polynome:def:analytisch} +\index{analytisch}% +Eine Funktion heisst analytisch, wenn sie sich durch eine +konvergente Potenzreihe darstellen lässt. +\end{definition} + +Die Klasse der analytischen Funktionen umfasst also nicht alle +differenzierbaren Funktionen. +Da aber Potenzreihen Gleidweise differenziert und integriert werden +dürfen, können die meisten Konstruktionen der Analysis bis hin zur +Lösung partieller Differentialgleichungen innerhalb der analytischen +Funktionen durchgeführt werden. +Es ist daher nicht überraschend, dass alle in diesem Buch studierten +speziellen Funktionen analytisch sind. + + diff --git a/buch/chapters/050-differential/hypergeometrisch.tex b/buch/chapters/050-differential/hypergeometrisch.tex index 18f1267..e187b68 100644 --- a/buch/chapters/050-differential/hypergeometrisch.tex +++ b/buch/chapters/050-differential/hypergeometrisch.tex @@ -796,24 +796,144 @@ tatsächlich die Kosinus-Funktion als Lösung hat. Wir setzen wieder $w(z) = \mathstrut_1F_1(a;b;z)$. Es sind die Operatoren $D_a$ und $D_{b-1}$ anzuwenden. Es ergibt sich die Differentialgleichung -\begin{align*} +\begin{align} \biggl(z\frac{d}{dz}+a\biggr)w &= \frac{d}{dz}\biggl(z\frac{d}{dz} +b-1\biggr)w +\notag \\ zw'+a w &= \frac{d}{dz} (zw'+b w - w) +\notag \\ zw'+a w &= zw'' +w'+b w' - w' +\notag \\ 0 &= zw'' + (b - z)w' - a w. +\label{buch:differentialgleichungen:1f1} +\end{align} +Die hypergeometrische Funktion $\mathstrut_1F_1$ ist eine Lösung +den Anfangsbedingungen $w(0)=1$, $w'(0)=a/b$. +Eine zweite, linear unabhängige Lösung der Differentialgleichung +\eqref{buch:differentialgleichungen:1f1} kann als verallgemeinerte +Potenzreihe $w(z) = z^\varrho v(z)$ gefunden werden. +Die Ableitungen dieses Ansatzes sind +\begin{align*} +w'(z) +&= +\varrho z^{\varrho-1} v(z) + z^\varrho v'(z) +\\ +w''(z) +&= +\varrho(\varrho-1) z^{\varrho-2} v(z) ++ +2\varrho z^{\varrho-1} v'(z) ++ +z^\varrho v''(z). +\end{align*} +Einsetzen derselben in~\eqref{buch:differentialgleichungen:1f1} +ergibt die Gleichung +\begin{align*} +z\bigl( +\varrho(\varrho-1)z^{\varrho-2}v + 2\varrho z^{\varrho-1}v'+z^\varrho v'' +\bigr) ++ +(b-z)\bigl(\varrho z^{\varrho-1}v+z^\varrho v'\bigr) +- +a z^\varrho v +&= +0 +\\ +z^{\varrho+1} v'' ++ +z^\varrho +(2\varrho + b-z) +v' ++ +(\varrho(\varrho-1)z^{\varrho-1} ++(b-z) +\varrho +z^{\varrho-1} +- +az^\varrho +) +v +&= +0 +\\ +z^{\varrho+1} v'' ++ +z^\varrho(2\varrho+b-z)v' ++ +(\varrho(\varrho-1+b) z^{\varrho-1} v ++ +(\varrho-a)z^\varrho v +&= +0 \end{align*} +Die letzte Gleichung wird wieder zu einer Differentialgleichung +der Form~\eqref{buch:differentialgleichungen:1f1}, wenn der erste +der Koeffizienten von $v$ verschwindet, wenn also +$\varrho-1+b=0$ ist, oder $\varrho=1-b$. +Setzt man diesen Wert ein, entsteht die Differentialgleichung +\[ +zv'' + (2(1-b)+b-z) v' - (a+b-1)v = 0 +\qquad\Rightarrow\qquad +zv'' + (2-b-z) v' - (a+b-1)v = 0. +\] +Dies ist eine hypergeometrische Differentialgleichung für +$\mathstrut_1F_1$ mit den Parametern $2-b$ und $1-b-a$. +Es folgt, dass +\[ +w_2(z) += +x^{1-b} \mathstrut_1F_1\biggl( +\begin{matrix} +a+b-1\\ +2-b +\end{matrix} +;z +\biggr). +\] +Falls $2-b$ keine negative ganze Zahl ist, ist die hypergeometrische +Funktion wohldefiniert. + +Wir fassen diese Resultat zusammen: +\begin{satz} +\label{buch:differentialgleichungen:satz:1f1-dgl-loesungen} +Die Differentialgleichung +\[ +zw'' + (b-z)w' - aw = 0 +\] +hat die Funktion +\[ +w_1(z) += +\mathstrut_1F_1\biggl( +\begin{matrix}a\\b\end{matrix};z +\biggr) +\] +als Lösung. +Falls $b-2\not\in\mathbb{N}$ ist, ist +\[ +w_2(z) += +z^{1-b} +\cdot +\mathstrut_1F_1\biggl( +\begin{matrix}a+b-1\\2-b\end{matrix} +;z +\biggr) +\] +eine zweite Lösung. +Für $b=1$ ist $w_2(z)=w_1(z)$. +\end{satz} % % Die hypergeometrische Differentialgleichung für 2F1 @@ -1521,10 +1641,10 @@ n\frac{x}{(1-x^2)^{\frac32}} \sin(n\arccos x) \end{align*} Multipliziert man $T_n''(x)$ mit $(1-x^2)$ und subtrahiert man $xT_n'(x)$, fällt der Term $\sin(n\arccos x)$ weg und es bleibt -\begin{equation} +\begin{equation*} (1-x^2)T''_n(x) -xT'_n(x) = -n^2 T_n(x), -\label{buch:differential:tschebyscheff:Tdgl} -\end{equation} +%\label{buch:differential:tschebyscheff:Tdgl} +\end{equation*} die Tschebyscheff-Polynome sind also Lösungen der Differentialgleichung \begin{equation} (1-x^2)y'' -xy' +n^2 y=0, @@ -1532,7 +1652,111 @@ die Tschebyscheff-Polynome sind also Lösungen der Differentialgleichung \end{equation} sie heisst die {\em Tschbeyscheff-Differentialgleichung}. -\subsubsection{Tschebyscheff-Differentialgleichung und hypergeometrische Differentialgleichung} -TODO +\subsubsection{Tschebyscheff-Differentialgleichung und hypergeometrische +Differentialgleichung} +Die hypergeometrische Differentialgleichung hat eine ähnliche Struktur +wie die Tschebyscheff-Differentialgleichung +\eqref{buch:differential:tschebyscheff:Tdgl}. +Der Koeffizient der zweiten Ableitung hat jedoch die Nullstellen +$\pm 1$ bei der Tschebyscheff-Differentialgleichung, während es bei +der hypergeometrischen Differentialgleichung die Nullstellen +$0$ und $1$ sind. +Wir verwenden daher die Substitution $z = \frac12(1-x)$ und +$w(z)=y(1-2z)$ und formen damit die hypergeometrische +Differentialgleichung um. +Der Faktor $z(1-z)$ wird damit zu +\[ +z(1-z) += +\frac12(1-x)\biggl(1-\frac12(1-x)\biggr) += +\frac12(1-x) \frac12(1+x) += +\frac14 (1-x^2). +\] +Die Ableitungen sind +\begin{align*} +w'(z) &= -2y'(1-2z) \\ +w''(z) &= 4y''(1-2z), +\end{align*} +wir setzen sie in die hypergeometrische Differentialgleichung ein +\begin{align*} +0 +&= +z(1-z) w'(z) ++ +(c-(a+b+1)z) w'(z) - ab w(z) +\\ +&= +\frac14(1-x^2) 4y''(x) +- +2 +\biggl(c-(a+b+1)\frac12(1-x)\biggr) +y'(x) +-aby(x). +\\ +&= +(1-x^2)y'' ++ +(a+b+1-2c-(a+b+1)x) y' +- +aby +\end{align*} +Diese Differentialgleichung kann tatsächlich in die Form der +Tschebyscheff-Differentialgleichung gebracht werden, wenn man setzt +\begin{equation} +\left. +\begin{aligned} +a&=\phantom{-}n\\ +b&=-n\\ +c&=\frac{a+b+1}2 +\end{aligned} +\right\} +\; +\quad\Rightarrow\quad +(1-x^2)y''+ +\biggl(\underbrace{a+b+1-2\frac{a+b+1}2}_{\displaystyle=0}-(\underbrace{n-n+1}_{\displaystyle=1})x\biggr)y' +-n(-n)y=0. +\end{equation} +Die letzte Gleichung ist identisch mit +\eqref{buch:differential:tschebyscheff:Tdgl}. +Die beiden Parameter $a$ und $b$ dürfen natürlich auch vertauscht +werden. + +\subsubsection{Tschebyscheff-Polynome als hypergeometrische Funktionen} +Aus der Umformung der eulerschen hypergeometrischen Differentialgleichung +in die Tschebyscheff-Differntialgleichung kann man jetzt ablesen, dass +eine Lösung der Tschebyscheff-Differentialgleichung auch mit der +hypergeometrischen Funktion $\mathstrut_2F_1$ geschrieben werden kann, +nämlich +\[ +y(x) += +\mathstrut_2F_1\biggl( +\begin{matrix} +n,-n\\ +\frac12 +\end{matrix};\frac{1-x}2 +\biggr). +\] +Wegen $b=-n$ ist diese Funktion ein Polynom mit den Werten +\[ +\begin{aligned} +y(1) &= 1 \\ +y'(1)&= n^2, +\end{aligned} +\] +den gleichen Werten, die auch das Tschbescheff-Polynome $T_n(x)$ annimmt. +Es folgt daher +\begin{equation} +T_n(x) += +\mathstrut_2F_1\biggl( +\begin{matrix}n,-n\\\frac12\end{matrix}; +\frac{1-x}2 +\biggr). +\end{equation} +Auch die Tschebyscheff-Polynome lassen sich also mit Hilfe einer +hypergeometrischen Funktion schreiben. -\url{https://en.wikipedia.org/wiki/Chebyshev_polynomials} +%\url{https://en.wikipedia.org/wiki/Chebyshev_polynomials} diff --git a/buch/chapters/070-orthogonalitaet/Makefile.inc b/buch/chapters/070-orthogonalitaet/Makefile.inc index 3202936..48e5356 100644 --- a/buch/chapters/070-orthogonalitaet/Makefile.inc +++ b/buch/chapters/070-orthogonalitaet/Makefile.inc @@ -6,6 +6,7 @@ CHAPTERFILES = $(CHAPTERFILES) \ chapters/070-orthogonalitaet/orthogonal.tex \ + chapters/070-orthogonalitaet/rekursion.tex \ chapters/070-orthogonalitaet/rodrigues.tex \ chapters/070-orthogonalitaet/legendredgl.tex \ chapters/070-orthogonalitaet/bessel.tex \ diff --git a/buch/chapters/070-orthogonalitaet/chapter.tex b/buch/chapters/070-orthogonalitaet/chapter.tex index 86a5d47..5ebb795 100644 --- a/buch/chapters/070-orthogonalitaet/chapter.tex +++ b/buch/chapters/070-orthogonalitaet/chapter.tex @@ -9,18 +9,17 @@ \lhead{Orthogonalität} \rhead{} \input{chapters/070-orthogonalitaet/orthogonal.tex} -\input{chapters/070-orthogonalitaet/jacobi.tex} +\input{chapters/070-orthogonalitaet/rekursion.tex} \input{chapters/070-orthogonalitaet/rodrigues.tex} +%\input{chapters/070-orthogonalitaet/jacobi.tex} \input{chapters/070-orthogonalitaet/legendredgl.tex} \input{chapters/070-orthogonalitaet/bessel.tex} \input{chapters/070-orthogonalitaet/sturm.tex} \input{chapters/070-orthogonalitaet/gaussquadratur.tex} -\section{TODO} -\begin{itemize} -\item Jacobi-Polynome -\item Tschebyscheff-Polynome -\end{itemize} +%\section{TODO} +%\begin{itemize} +%\end{itemize} \section*{Übungsaufgaben} \rhead{Übungsaufgaben} diff --git a/buch/chapters/070-orthogonalitaet/gaussquadratur.tex b/buch/chapters/070-orthogonalitaet/gaussquadratur.tex index 870c8a8..55f9700 100644 --- a/buch/chapters/070-orthogonalitaet/gaussquadratur.tex +++ b/buch/chapters/070-orthogonalitaet/gaussquadratur.tex @@ -482,4 +482,81 @@ Dies zeigt auch der Graph in Abbildung~\ref{buch:integral:gaussquadratur:fehler}. \subsection{Skalarprodukte mit Gewichtsfunktion} +Die Nullstellen der Legendre-Polynome ergaben ein gutes +Integrationsverfahren für Polynome auf einem beschränkten +Intervall. +Die Beispiele haben aber auch gezeigt, dass Stellen, wo die +Ableitung des Integranden divergiert, die Genauigkeit stark +beeinträchtigen können. +Ausserdem ist das Verfahren nicht anwendbar auf uneigentliche +Integrale. + +\subsubsection{Umgang mit Singularitäten} +Die Lösung des Problems mit Stellen mit divergenter Ableitung +besteht darin, die Stützstellen in der Nähe dieser Stellen +zu konzentrieren. +Die Verwendung einer Gewichtsfunktion $w(x)$ kann genau dies +erreichen. +Statt das Integral einer Funktion $f(x)$ zu bestimmen, +kann man $f(x)=g(x)w(x)$ schreiben, wobei $w(x)$ so +gewählt werden soll, dass das Verhalten der Steigung an +den Intervallenden gut wiedergibt. +Dies ist mit einer Jacobischen Gewichtsfunktion immer möglich. +Statt der Nullstellen der Legendre-Polynome sind dann die +Nullstellen der Jacobi-Polynome und die Funktionswete von $g(x)$ +an diesen Stellen zu verwenden, die Gewichte sind +die Integrale von $l_i(x) P^{(\alpha,\beta)}(x)$. + +\subsubsection{Uneigentliche Integrale} +Die Berechnung eines uneigentlichen Integrals auf dem Intervall +$(0,\infty)$ oder $(-\infty,\infty)$ ist aus mehreren Gründen nicht +direkt mit dem früher beschriebenen Gauss-Quadraturverfahren +möglich. + +Die Stützstellen, die bei der Gauss-Quadratur in einem Intervall +$(a,b)$ verwendet werden, entstehen dadurch, dass man die Nullstellen +der Legendre-Polynome in $(-1,1)$ auf das Intervall $(a,b)$ +skaliert. +Dies führt offensichtlich nicht zum Erfolg, wenn ein oder beide +Intervallgrenzen unendlich sind. +Dieses Problem kann dadurch gelöst werden, dass man das unendliche +Intervall $(a,\infty)$ mit +\[ +x = a + \frac{1-t}{t} +\] +auf das Intervall $[0,1]$ transformiert. + +Will man beim Intervall $(0,\infty)$ bleiben, dann ist zu beachten, +dass das Integral eines Polynomes immer divergent ist, es ist also +auf jeden Fall nötig, den Integranden durch Funktionen zu approximieren, +die genügend schnell gegen $0$ gehen. +Polynome beliebigen Grades können verwendet werden, wenn sie mit +einer Funktion multipliziert werden, die schneller als jedes Polynom +gegen $0$ geht, so dass das Integral immer noch konvergiert. +Die Funktionen $e^{-x}$ für das Intervall $(0,\infty)$ oder +$e^{-x^2}$ für das Intervall $(-\infty,\infty)$ kommen dafür in Frage. + +Um das Integral von $f(x)$ im Intervall $(0,\infty)$ zu berechnen, +schreibt man daher zunächst +\[ +\int_0^\infty f(x)\,dx += +\int_0^\infty g(x)e^{-x}\,dx += +\int_0^\infty g(x) w(x)\,dx +\quad\text{mit}\quad +w(x)=e^{-x} +\text{ und } +g(x)=f(x)e^x. +\] +Dann approximiert $g(x)$ man durch ein Interpolationspolynom, +so wie man das bei der Gauss-Quadratur gemacht hat. +Als Stützstellen müssen dazu die Nullstellen der Laguerre-Polynome +verwendet werden. +Als Gewichte $w_i$ sind die Integrale der $l_i(x)e^{-x}$ +zu verwenden. + + + + diff --git a/buch/chapters/070-orthogonalitaet/images/Makefile b/buch/chapters/070-orthogonalitaet/images/Makefile index efe5d36..83f6762 100644 --- a/buch/chapters/070-orthogonalitaet/images/Makefile +++ b/buch/chapters/070-orthogonalitaet/images/Makefile @@ -4,7 +4,7 @@ # # (c) 2021 Prof Dr Andreas Müller, OST Ostschweizer Fachhochschule # -all: legendre.pdf orthogonal.pdf weight.pdf jacobi.pdf +all: legendre.pdf orthogonal.pdf weight.pdf jacobi.pdf laguerre.pdf legendrepaths.tex: legendre.m octave legendre.m @@ -22,6 +22,11 @@ weightfunction.tex: weight.m jacobi: jacobi.cpp g++ --std=c++11 -O -Wall -g -o jacobi jacobi.cpp +laguerre.pdf: laguerre.tex laguerrepaths.tex + pdflatex laguerre.tex +laguerrepaths.tex: laguerre.m + octave laguerre.m + jacobipaths.tex: jacobi Makefile ./jacobi --a=0 --b=0 --prefix=legendre --outfile=jacobipaths.tex ./jacobi --a=1 --b=0 --degree=14 --prefix=aone >> jacobipaths.tex diff --git a/buch/chapters/070-orthogonalitaet/images/jacobi.pdf b/buch/chapters/070-orthogonalitaet/images/jacobi.pdf Binary files differindex d1977f0..7fdc702 100644 --- a/buch/chapters/070-orthogonalitaet/images/jacobi.pdf +++ b/buch/chapters/070-orthogonalitaet/images/jacobi.pdf diff --git a/buch/chapters/070-orthogonalitaet/images/laguerre.m b/buch/chapters/070-orthogonalitaet/images/laguerre.m new file mode 100644 index 0000000..0a9c18c --- /dev/null +++ b/buch/chapters/070-orthogonalitaet/images/laguerre.m @@ -0,0 +1,55 @@ +# +# laguerre.m +# +# (c) 2021 Prof Dr Andreas Müller, OST Ostschweizer Fachhochschule +# +pkg load miscellaneous +global N; +N = 120; + +function retval = laguerre(n, x) + s = 1; + p = 1; + if (n == 0) + retval = p; + else + for k = (1:n) + p = p * x * (-n-1+k) / (k * k); + s = s + p; + endfor + retval = s; + end +endfunction + +function retval = laguerrepath(fn, n, name) + global N; + h = 12 / N; + fprintf(fn, "\\def\\laguerre%s{\n", name) + fprintf(fn, "\t ({%.5f*\\dx},{%.5f*\\dy})", 0, 1); + for i = (1:N) + x = h * i; + y = laguerre(n, x); + if (abs(y) > 100) + y = 100 * sign(y); + end + fprintf(fn, "\n\t-- ({%.5f*\\dx},{%.5f*\\dy})", x, y); + endfor + fprintf(fn, "\n}\n"); +endfunction + +fn = fopen("laguerrepaths.tex", "w"); + +laguerrepath(fn, 0, "zero"); +laguerrepath(fn, 1, "one"); +laguerrepath(fn, 2, "two"); +laguerrepath(fn, 3, "three"); +laguerrepath(fn, 4, "four"); +laguerrepath(fn, 5, "five"); +laguerrepath(fn, 6, "six"); +laguerrepath(fn, 7, "seven"); +laguerrepath(fn, 8, "eight"); +laguerrepath(fn, 9, "nine"); + +fclose(fn); + + diff --git a/buch/chapters/070-orthogonalitaet/images/laguerre.pdf b/buch/chapters/070-orthogonalitaet/images/laguerre.pdf Binary files differnew file mode 100644 index 0000000..c16698e --- /dev/null +++ b/buch/chapters/070-orthogonalitaet/images/laguerre.pdf diff --git a/buch/chapters/070-orthogonalitaet/images/laguerre.tex b/buch/chapters/070-orthogonalitaet/images/laguerre.tex new file mode 100644 index 0000000..537c4af --- /dev/null +++ b/buch/chapters/070-orthogonalitaet/images/laguerre.tex @@ -0,0 +1,87 @@ +% +% laguerre.tex -- Laguerre-Polynome +% +% (c) 2021 Prof Dr Andreas Müller, OST Ostschweizer Fachhochschule +% +\documentclass[tikz]{standalone} +\usepackage{amsmath} +\usepackage{times} +\usepackage{txfonts} +\usepackage{pgfplots} +\usepackage{csvsimple} +\usetikzlibrary{arrows,intersections,math} +\begin{document} +\def\dx{1} +\def\dy{0.33333} +\input{laguerrepaths.tex} + +\definecolor{fone}{rgb}{1,0,0} +\definecolor{ftwo}{rgb}{1.0,0,0.8} +\definecolor{fthree}{rgb}{0.8,0,1} +\definecolor{ffour}{rgb}{0,0,1} +\definecolor{ffive}{rgb}{0,0.8,1} +\definecolor{fsix}{rgb}{0,1,1} +\definecolor{fseven}{rgb}{0,0.6,0} +\definecolor{feight}{rgb}{0.2,1,0.6} +\definecolor{fnine}{rgb}{0.6,0.8,0.2} +\definecolor{ften}{rgb}{1,0.4,0} + +\def\skala{1} +\begin{tikzpicture}[>=latex,thick,scale=\skala] + + +\begin{scope} +\clip (0,-5) rectangle (12,5); + +\draw[color=fone] \laguerrezero; +\draw[color=ftwo] \laguerreone; +\draw[color=fthree] \laguerretwo; +\draw[color=ffour] \laguerrethree; +\draw[color=ffive] \laguerrefour; +\draw[color=fsix] \laguerrefive; +\draw[color=fseven] \laguerresix; +\draw[color=feight] \laguerreseven; +\draw[color=fnine] \laguerreeight; +\draw[color=ften] \laguerrenine; + +\end{scope} + +\draw[->] (-0.1,0) -- (12.4,0) coordinate[label={$x$}]; +\draw[->] (0,{-5.1}) -- (0,{5.3}) coordinate[label={$y$}]; + +\def\marke#1#2{ + \node[color=#1] at (0.5,{5-0.42*#2}) [right] {$n=#2$}; +} + +\marke{fone}{0} +\marke{ftwo}{1} +\marke{fthree}{2} +\marke{ffour}{3} +\marke{ffive}{4} +\marke{fsix}{5} +\marke{fseven}{6} +\marke{feight}{7} +\marke{fnine}{8} +\marke{ften}{9} + +\foreach \x in {1,...,12}{ + \draw ({\x},-0.05) -- ({\x},0.05); +} +\node at (5,-0.05) [below] {$5$}; +\node at (10,-0.05) [below] {$10$}; + +\foreach \y in {1,...,15}{ + \draw (-0.05,{\y*\dy}) -- (0.05,{\y*\dy}); + \draw (-0.05,{-\y*\dy}) -- (0.05,{-\y*\dy}); +} +\node at (-0.05,{1*\dy}) [left] {$1$}; +\node at (-0.05,{5*\dy}) [left] {$5$}; +\node at (-0.05,{10*\dy}) [left] {$10$}; +\node at (-0.05,{15*\dy}) [left] {$15$}; +\node at (-0.05,{-5*\dy}) [left] {$-5$}; +\node at (-0.05,{-10*\dy}) [left] {$-10$}; +\node at (-0.05,{-15*\dy}) [left] {$-15$}; + +\end{tikzpicture} +\end{document} + diff --git a/buch/chapters/070-orthogonalitaet/legendredgl.tex b/buch/chapters/070-orthogonalitaet/legendredgl.tex index 073b004..de8f63f 100644 --- a/buch/chapters/070-orthogonalitaet/legendredgl.tex +++ b/buch/chapters/070-orthogonalitaet/legendredgl.tex @@ -367,3 +367,93 @@ Q_1(x) = x \operatorname{artanh}x-1 \] verwendet werden. +% +% +% +\subsection{Laguerre-Differentialgleichung +\label{buch:orthogonal:subsection:laguerre-differentialgleichung}} +Die Laguerre-Gewichtsfunktion $w_{\text{Laguerre}}(x)=e^{-x}$ +\index{Laguerre-Gewichtsfunktion}% +führte auf die Laguerre-Polynome $L_n(x)$, die in +\eqref{buch:orthogonal:eqn:laguerre-polynom-hypergeometrisch} +als hypergeometrische Funktionen erkannt wurden. +Sie sind daher auch Lösungen der Differentialgleichung +der hypergeometrischen Funktion $\mathstrut_1F_1$, die in +\eqref{buch:differentialgleichungen:1f1} dargestellt ist. + +Die Parameter der Darstellung von $L_n(x)$ als hypergeometrische +Funktion sind +\[ +L_n(x) = \mathstrut_1F_1\biggl( +\begin{matrix}-n\\1\end{matrix} +;x +\biggr) +\qquad\Rightarrow\qquad +\left\{ +\begin{aligned} +a&=-n\\ +b&=1. +\end{aligned} +\right. +\] +Einsetzen dieser Parametrer in die Differentialgleichung +\eqref{buch:differentialgleichungen:1f1} +\begin{equation} +zw'' + (1-z)w'+nw=0 +\label{buch:differentialgleichungen:eqn:laguerre-dgl} +\end{equation} +Dies ist die {\em Laguerre-Differentialgleichung}. +\index{Laguerre-Differentialgleichung}% +\index{Differentialgleichung!Laguerre}% +Die Laguerre-Polynome sind also Lösungen der Laguerre-Differentialgleichung, +wenn der Parameter $n$ nicht-negativ ganzzahlig ist. + +Die allgemeine Laguerre-Differentialgleichung lässt beliebige reelle +Werte für den Koeffizienten von $y$ zu, sie lautet +\[ +zw''+(1-z)w'+\lambda w=0. +\] +Die Anfangsbedingungen für die hypergeometrische Funktion als Lösung +\begin{align*} +L_n(0) &= \mathstrut_1F_1(-\lambda; 1; 0) = 1\\ +\\ +L'_n(0) &= +\frac{d}{dx} +\mathstrut_1F_1(-\lambda;1;0) = \frac{-\lambda}{1} +\end{align*} +Der Satz +\ref{buch:differentialgleichungen:satz:1f1-dgl-loesungen} +schlägt eine zweite Lösung vor, im vorliegenden Fall mit $b=1$ +ist die zweite Lösung jedoch identisch zu ersten, es muss daher +ein anderer Weg zu einer zweiten Lösung gesucht werden. + +XXX TODO: zweite Lösung der Differentialgleichung. + +\subsubsection{Die assoziierte Laguerre-Differentialgleichung} +\index{assoziierte Laguerre-Differentialgleichung}% +\index{Laguerre-Differentialgleichung, assoziierte}% +Die {\em assoziierte Laguerre-Differentialgleichung} ist die +Differentialgleichung +\begin{equation} +zw'' + (\nu +1-z)w' + \lambda w = 0, +\label{buch:differentialgleichungen:eqn:assoziierte-laguerre-dgl} +\end{equation} +also die Differentialgleichung für die hypergeometrische Funktion +$\mathstrut_1F_1$ mit Parametern $a=-\lambda$ und $b=\nu+1$. +Die Gleichung +\eqref{buch:differentialgleichungen:eqn:assoziierte-laguerre-dgl} +hat daher die Lösung +\( +\mathstrut_1F_1(-\lambda;\nu+1;x). +\) +Für natürliches $\lambda$ sind diese Lösungen Polynome +\[ +L_n^{(\nu)}(x) += +\mathstrut_1F_1\biggl( +\begin{matrix}-n\\\nu+1\end{matrix} +;x\biggr), +\] +sie heissen die {\em assoziierten Laguerre-Polynome}. +\index{assoziierte Laguerre-Polynome}% +\index{Laguerre-Polynome, assoziierte}% diff --git a/buch/chapters/070-orthogonalitaet/orthogonal.tex b/buch/chapters/070-orthogonalitaet/orthogonal.tex index 9447c6f..d06f46e 100644 --- a/buch/chapters/070-orthogonalitaet/orthogonal.tex +++ b/buch/chapters/070-orthogonalitaet/orthogonal.tex @@ -176,7 +176,7 @@ C([a,b]) \times C([a,b]) \to \mathbb{R} das {\em gewichtete Skalarprodukt} mit {\em Gewichtsfunktion $w(x)$}. \end{definition} -\subsubsection{Gram-Schmidt-Orthonormalisierung} +\subsection{Gram-Schmidt-Orthonormalisierung} In einem reellen Vektorraum $V$ mit Skalarprodukt $\langle\;\,,\;\rangle$ kann aus einer beleibigen Basis $b_1,\dots,b_n$ mit Hilfe des Gram-Schmidtschen Orthogonalisierungsverfahrens immer eine @@ -274,105 +274,16 @@ b_n \end{align*} berücksichtigen dies. -\subsubsection{Selbstadjungierte Operatoren und Eigenvektoren} -Symmetrische Matrizen spielen eine spezielle Rolle in der -endlichdimensionalen linearen Algebra, weil sie sich immer -mit einer orthonormierten Basis diagonalisieren lassen. -In der vorliegenden Situation undendlichdimensionaler Vektorräume -brauchen wir eine angepasste Definition. - -\begin{definition} -Eine lineare Selbstabbildung $A\colon V\to V$ -eines Vektorrraums mit Skalarprodukt -heisst {\em selbstadjungiert}, wenn für alle Vektoren $u,v\in V$ -heisst $\langle Au,v\rangle = \langle u,Av\rangle$. -\end{definition} - -Es ist wohlbekannt, dass Eigenvektoren einer symmetrischen Matrix -zu verschiedenen Eigenwerten orthogonal sind. -Der Beweis ist direkt übertragbar, wir halten das Resultat hier -für spätere Verwendung fest. - -\begin{satz} -Sind $f$ und $g$ Eigenvektoren eines selbstadjungierten Operators $A$ -zu verschiedenen Eigenwerten $\lambda$ und $\mu$, dann sind $f$ und $g$ -orthogonal. -\end{satz} - -\begin{proof}[Beweis] -Im vorliegenden Zusammenhang möchten wir die Eigenschaft nutzen, -dass Eigenfunktionen eines selbstadjungierten Operatores zu verschiedenen -Eigenwerten orthogonal sind. -Dazu seien $Df = \lambda f$ und $Dg=\mu g$ und wir rechnen -\begin{equation*} -\renewcommand{\arraycolsep}{2pt} -\begin{array}{rcccrl} -\langle Df,g\rangle &=& \langle \lambda f,g\rangle &=& \lambda\phantom{)}\langle f,g\rangle -&\multirow{2}{*}{\hspace{3pt}$\biggl\}\mathstrut-\mathstrut$}\\ -=\langle f,Dg\rangle &=& \langle f,\mu g\rangle &=& \mu\phantom{)}\langle f,g\rangle& -\\[2pt] -\hline - 0 & & &=& (\lambda-\mu)\langle f,g\rangle& -\end{array} -\end{equation*} -Da $\lambda-\mu\ne 0$ ist, muss $\langle f,g\rangle=0$ sein. -\end{proof} - -\begin{beispiel} -Sei $C^1([0,2\pi], \mathbb{C})=C^1(S^1,\mathbb{C})$ -der Vektorraum der $2\pi$-periodischen differenzierbaren Funktionen mit -dem Skalarprodukt -\[ -\langle f,g\rangle -= -\frac{1}{2\pi}\int_0^{2\pi} \overline{f(t)}g(t)\,dt -\] -enthält die Funktionen $e_n(t) = e^{int}$. -Der Operator -\[ -D=i\frac{d}{dt} -\] -ist selbstadjungiert, denn mit Hilfe von partieller Integration erhält man -\[ -\langle Df,g\rangle -= -\frac{1}{2\pi} -\int_0^{2\pi} -\underbrace{ -\overline{i\frac{df(t)}{dt}} -}_{\uparrow} -\underbrace{g(t)}_{\downarrow} -\,dt -= -\underbrace{ -\frac{-i}{2\pi} -\biggl[ -\overline{f(t)}g(t) -\biggr]_0^{2\pi} -}_{\displaystyle=0} -+ -\frac{1}{2\pi} -\int_0^{2\pi} -\overline{f(t)}i\frac{dg(t)}{dt} -\,dt -= -\langle f,Dg\rangle -\] -unter Ausnützung der $2\pi$-Periodizität der Funktionen. - -Die Funktionen $e_n(t)$ sind Eigenfunktionen des Operators $D$, denn -\[ -De_n(t) = i\frac{d}{dt}e^{int} = -n e^{int} = -n e_n(t). -\] -Nach obigem Satz sind die Eigenfunktionen von $D$ orthogonal. -\end{beispiel} - -Das Beispiel illustriert, dass orthogonale Funktionenfamilien -ein automatisches Nebenprodukt selbstadjungierter Operatoren sind. - - -% XXX Orthogonalisierungsproblem so formulieren, dass klar wird, -% XXX dass man ein "Normierungskriterium braucht. +% +% Legendre-Polynome +% +\subsection{Legendre-Polynome +\label{buch:orthogonal:subsection:legendre-polynome}} +Der Gram-Schmidtsche Orthogonalisierungsprozess kann für jedes beliebige +Skalarprodukt aus der Folge $1$, $x$, $x^2,\dots$ der Monome ein +Folge von orthogonalisierten Polynomen machen. +In diesem Abschnitt rechnen wir den Fall konstanter Gewichtsfunktione +$w(x)=1$ durch, er führt auf die sogenannten {\em Legendre-Polynome}. Da wir auf die Normierung verzichten, brauchen wir ein anderes Kriterium, welches die Polynome eindeutig festlegen kann. @@ -380,6 +291,10 @@ Wir bezeichnen das Polynom vom Grad $n$, das bei diesem Prozess entsteht, mit $P_n(x)$ und legen willkürlich aber traditionskonform fest, dass $P_n(1)=1$ sein soll. +% +% Symmetrie-Eigenschaften +% +\subsubsection{Symmetrieeigenschaften} Das Skalarprodukt berechnet ein Integral eines Produktes von zwei Polynomen über das symmetrische Interval $[-1,1]$. Ist die eine gerade und die andere ungerade, dann ist das @@ -403,6 +318,7 @@ dargestellt. \end{figure} \begin{lemma} +\label{buch:orthogonal:lemma:symmetrie} Die Polynome $P_{2n}(x)$ sind gerade, die Polynome $P_{2n+1}(x)$ sind ungerade Funktionen von $x$. \end{lemma} @@ -435,6 +351,10 @@ $P_{n-4}(x)$ ist, die die gleiche Parität wie $x^n$ haben. Also hat auch $P_n(x)$ die gleiche Parität, was das Lemma beweist. \end{proof} +% +% Orthogonalisierung nach Gram-Schmidt +% +\subsubsection{Orthogonalisierung mit Gram-Schmidt} Die Ortogonalisierung von $x^2$ liefert daher \[ p(x) = x^2 @@ -476,7 +396,7 @@ Für $P_3(x)$ brauchen wir nur die Skalaprodukte \qquad \Rightarrow \qquad -p(x) = x^3 - \frac{\frac25}{\frac23}x=x^3-\frac{3}{5}x +p(x) = x^3 - \frac{\;\frac25\;}{\frac23}x=x^3-\frac{3}{5}x \] Die richtige Standardisierung ergibt sich, indem man durch $p(1)=\frac25$ dividiert, also @@ -516,7 +436,7 @@ Die Skalarprodukte sind = \int_{-1}^1 \frac14(9x^4-6x^2+1)\,dx = -\frac14(\frac{18}{5}-4+2) +\frac14\biggl(\frac{18}{5}-4+2\biggr) =\frac25. \end{align*} Daraus folgt für $p(x)$ @@ -604,219 +524,292 @@ dass die die beiden Polynome $P_4(x)$ und $P_7(x)$ orthogonal sind. Das Produkt $P_4(x)\cdot P_7(x)$ hat Integral $=0$. % -% Rekursionsrelation +% Verschiedene Gewichtsfunktionen +% +\subsection{Gewichtsfunktionen +\label{buch:orthogonal:subsection:gewichtsfunktionen}} +Das Standardskalarprodukt auf dem Raum der Funktionen auf dem +Interval $[-1,1]$ ist das Skalarprodukt mit der Gewichtsfunktion +$w(x)=1$, es führt auf die Legendre-Polynome. +Die Wahl einer anderen Gewichtsfunktion ändert natürlich +das Resultat der Orthogonalisierung. +Nullstellen und Pole der Gewichtsfunktion ändern die Menge der +Funktionen, für die das Skalarprodukt definiert. +Diesem Zusammenhang soll im ersten Unterabschnitt nachgegangen werden. +Danach sollen verschiedene für die Praxis relevante Gewichtsfunktionen +vorgestellt werden. + +\begin{figure} +\centering +\includegraphics{chapters/070-orthogonalitaet/images/weight.pdf} +\caption{Nullstellen und Pole der Gewichtsfunktion (rot) legen Ort +und Grad von Polen und Nullstellen der Funktionen fest, die beschränkte +$\|\,\cdot\,\|_w$-Norm haben. +An den Stellen $\pm 1$ und $\pm\frac12$ hat die Gewichtsfunktion +Pole bzw.~Nullstellen mit Grad $\alpha$. +Der blaue Bereich deutet an, wie schnell die Funktion $f$ in diesem +Bereich anwachsen kann, bzw.~wie schnell nahe der Polstelle gegen $0$ +gehen muss. +\label{buch:orthogonalitaet:fig:gewicht}} +\end{figure} +% +% Pole und Nullstellen der Gewichtsfunktion % -\subsection{Drei-Term-Rekursion -\label{buch:orthogonal:subsection:rekursionsrelation}} -Die Berechnung der Legendre-Polynome mit Hilfe des Gram-Schmidt-Verfahrens -ist ausserordentlich mühsame wenig hilfreich, wenn es darum geht, Werte -der Polynome zu berechnen. -Glücklicherweise erfüllen orthogonale Polynome automatisch eine -Rekursionsbeziehung mit nur drei Termen. -Zum Beispiel kann man zeigen, dass für die Legendre-Polynome die -Relation +\subsubsection{Pole und Nullstellen +\label{buch:orthogonal:pole-und-nullstellen}} +Das Skalarprodukt $\langle\,\;,\;\rangle_w$ ist nur sinnvoll +für Funktionen $f(x)$, für die die Norm $\|f\|_w$ definiert ist. +An einer Nullstelle $x_0$ der Gewichtsfunktion $w$ darf die Funktion $f$ +einen Pol haben. +Solange $f(x)$ für $x\to x_0$ nicht zu schnell divergiert, kann +das Produkt $|f(x)|^2 w(x)$ immer noch integrierbar sein. + +Um dies etwas genauer zu quantifizieren, nehmen wir an, dass +$w(x)$ an der Stelle $x_0$ eine Nullstelle vom Grad $\alpha$ hat. +Dies bedeutet, dass $w(x) \approx C|x-x_0|^\alpha$ ist für eine geeignete +Konstante $C$ und für $|x-x_0|<\varepsilon$. +Ein Pol von $f$ vom Grad $a$ an der Stelle $x_0$ führt entsprechend auf +eine Abschätzung $|f(x)| \approx D|f(x)|^{-a}$ für $|x-x_0|<\varepsilon$. +Dann ist +\[ +|f(x)|^2 w(x) \approx CD |x-x_0|^{\alpha-2a}. +\] +Für das Integral in der Nähe von $x_0$ ist \begin{align*} -nP_n(x) &= (2n-1)xP_{n-1}(x) - (n-1)P_{n-2}(x),\;\forall n\ge 2, +\int_{x_0-\varepsilon}^{x_0+\varepsilon} +|f(x)|^2 w(x)\,dx +&\approx +CD +\int_{x_0-\varepsilon}^{x_0+\varepsilon} +|x-x_0|^{\alpha-2a}\,dx \\ -P_1(x) &= x, -\\ -P_0(x) &= 1. +&= +2CD +\int_0^\varepsilon +t^{\alpha-2a} +\,dt += +2CD +\begin{cases} +\displaystyle +\; +\biggl[\frac{t^{\alpha-2a+1}}{\alpha-2a+1}\biggr]_0^\varepsilon +&\qquad +\alpha-2a\ne-1 +\\[7pt] +\displaystyle +\; +\biggl[ \log t \biggr]_0^\varepsilon +&\qquad +\text{sonst.} +\end{cases} \end{align*} -Mit so einer Rekursionsbeziehung ist es sehr einfach, die Funktionswerte -für alle $P_n(x)$ zu berechnen. +Der Zähler $t^{\alpha-2a+1}$ divergiert für $t\to 0$ genau dann, +wenn $\alpha-2a+1<0$ oder $\alpha<2a-1$. +Auch im zweiten Fall, für $\alpha-2a+1=0$, divergiert das Integral. +Damit die Norm $\|f\|_w$ definiert ist, muss also $a<\frac12(\alpha+1)$ +sein. + +Ganz ähnlich führt eine Polstelle von $w$ vom Grad $\alpha$ +an der Stelle $x_0$ dazu, dass $f$ dort eine Nullstelle vom Grad +$a$ haben muss. +Das Normintegral konvergiert nur, wenn $2a-\alpha > -1$ ist +oder $a > \frac12(\alpha+1)$. + +Pole der Gewichtsfunktion schränken also ein, welche Funktionen +überhaupt der Untersuchung mit Hilfe des Skalarproduktes +$\langle\,\;,\;\rangle_w$ zugänglich sind +(Abbildung~\ref{buch:orthogonalitaet:fig:gewicht}). +Ist die Ordnung $\alpha$ des Poles grösser als $1$, dann müssen die Funktionen +eine Nullstelle mindestens vom Grad $\frac12(a+1)$ haben. +Nullstellen der Gewichtsfunktion erweitern die Klasse der Funktionen. +Ist die Ordnung der Nullstelle $\alpha$, dann dürfen die Funktionen einen +Pol der Ordnung kleiner als $\frac12(\alpha+1)$ haben. -\begin{definition} -Eine Folge von Polynomen $p_n(x)$ heisst orthogonal bezüglich des -Skalarproduktes $\langle\,\;,\;\rangle_w$, wenn +\begin{lemma} +\label{buch:orthogonal:lemma:gewichtsfunktion} +Sei $w(x)\ge 0$ auf dem Intervall $(a,b)$. +Der Vektorraum $H_w$ von auf $(a,b)$ definierten Funktionen sei \[ -\langle p_n,p_m\rangle_w = h_n \delta_{nm} +H_w += +\biggl\{ +f:\colon(a,b) \to \mathbb{R} +\;\bigg|\; +\int_a^b |f(x)|^2 w(x)\,dx +\biggr\}. \] -für alle $n$, $m$. -\end{definition} +Die Funktionen $f\in H_w$ haben folgende Eigenschaften +\begin{enumerate} +\item +Ist $\xi\in[a,b]$ eine Nullstelle vom Grad $\alpha$ der Funktion $w(x)$, +dann +\item +Ist $\xi\in[a,b]$ eine Polstelle vom Grad $a$ der Funktion $w(x)$, +dann hat $f$ eine Nullstelle mindestens from Grad +\end{enumerate} +\end{lemma} -\subsubsection{Allgemeine Drei-Term-Rekursion für orthogonale Polynome} -Der folgende Satz besagt, dass $p_n$ eine Rekursionsbeziehung erfüllt. -\begin{satz} -\label{buch:orthogonal:satz:drei-term-rekursion} -Eine Folge bezüglich $\langle\,\;,\;\rangle_w$ orthogonaler Polynome $p_n$ -mit dem Grade $\deg p_n = n$ erfüllt eine Rekursionsbeziehung der Form -\begin{equation} -p_{n+1}(x) -= -(A_nx+B_n)p_n(x) - C_np_{n-1}(x) -\label{buch:orthogonal:eqn:rekursion} -\end{equation} -für $n\ge 0$, wobei $p_{-1}(x)=0$ gesetzt wird. -Die Zahlen $A_n$, $B_n$ und $C_n$ sind reell und es ist -$A_{n-1}A_nC_n\ge 0$ für $n>0$. -Wenn $k_n>0$ der Leitkoeffizient von $p_n(x)$ ist, dann gilt -\begin{equation} -A_n=\frac{k_{n+1}}{k_n}, -\qquad -C_{n+1} = \frac{A_{n+1}}{A_n}\frac{h_{n+1}}{h_n}. -\label{buch:orthogonal:eqn:koeffizientenrelation} -\end{equation} -\end{satz} - -\subsubsection{Multiplikationsoperator mit $x$} -Man kann die Relation auch nach dem Produkt $xp_n(x)$ auflösen, dann -wird sie -\begin{equation} -xp_n(x) -= -\frac{1}{A_n}p_{n+1}(x) -- -\frac{B_n}{A_n}p_n(x) -+ -\frac{C_n}{A_n}p_{n-1}(x). -\label{buch:orthogonal:eqn:multixrelation} -\end{equation} -Die Multiplikation mit $x$ ist eine lineare Abbildung im Raum der Funktionen. -Die Relation~\eqref{buch:orthogonal:eqn:multixrelation} besagt, dass diese -Abbildung in der Basis der Polynome $p_k$ tridiagonale Form hat. - -\subsubsection{Drei-Term-Rekursion für die Tschebyscheff-Polynome} -Eine Relation der Form~\eqref{buch:orthogonal:eqn:multixrelation} -wurde bereits in -Abschnitt~\ref{buch:potenzen:tschebyscheff:rekursionsbeziehungen} -hergeleitet. -In der Form~\eqref{buch:orthogonal:eqn:rekursion} geschrieben lautet -sie +% +% Die Jacobische Gewichtsfunktion +% +\subsubsection{Jacobische Gewichtsfunktion} +Die Gewichtsfunktion für die Legendre-Polynome war $w(x)=1$, alle +Punkte im Intervall $(-1,1)$ hatten das gleiche Gewicht. +Diese soll jetzt ersetzt werden durch eine Gewichtsfunktion, die +den Punkten an den Intervallenden mehr oder weniger Gewicht gibt, +wobei auch zugelassen sein soll, dass die Gewichtung nicht symmetrisch +ist. + +\begin{definition} +\label{buch:orthogonal:def:jacobi-gewichtsfunktion} +Die {\em Jacobi-Gewichtsfunktion} ist die Funktion +\index{Jacobi-Gewichtsfunktion}% \[ -T_{n+1}(x) = 2x\,T_n(x)-T_{n-1}(x). +w^{(\alpha,\beta)} +\colon (-1,1)\to\mathbb{R} +: +x\mapsto w^{(\alpha,\beta)}(x) = (1-x)^\alpha(1+x)^\beta \] -also -$A_n=2$, $B_n=0$ und $C_n=1$. - -\subsubsection{Beweis von Satz~\ref{buch:orthogonal:satz:drei-term-rekursion}} -Die Relation~\eqref{buch:orthogonal:eqn:multixrelation} zeigt auch, -dass der Beweis die Koeffizienten $\langle xp_k,p_j\rangle_w$ -berechnen muss. -Dabei wird wiederholt der folgende Trick verwendet. -Für jede beliebige Funktion $f$ mit $\|f\|_w^2<\infty$ ist +mit $\alpha,\beta\in\mathbb{R}$. +Das Skalarprodukt zugehörige Skalarprodukt wird auch als \[ -\langle fp_k,p_j\rangle_w +\langle\,\;,\;\rangle_{w^{(\alpha,\beta)}} = -\langle p_k,fp_j\rangle_w. +\langle\,\;,\;\rangle_{(\alpha,\beta)} \] -Für $f(x)=x$ kann man weiter verwenden, dass $xp_k(x)$ ein Polynom -vom Grad $k+1$ ist. -Die Gleichheit $\langle xp_k,p_j\rangle_w=\langle p_k,xp_j\rangle_w$ -ermöglicht also, den Faktor $x$ dorthin zu schieben, wo es nützlicher ist. - -\begin{proof}[Beweis des Satzes] -Multipliziert man die rechte Seite von -\eqref{buch:orthogonal:eqn:rekursion} aus, dann ist der einzige Term -vom Grad $n+1$ der Term $A_nxp_n(x)$. -Der Koeffizient $A_n$ ist also dadurch festgelegt, dass -\begin{equation} -b(x) +bezeichnet und die zugehörige Norm mit +\[ +\|f\|_{(\alpha,\beta)} += +\langle f,f\rangle_{(\alpha,\beta)} = -p_{n+1}(x) - A_nxp_n(x) -\label{buch:orthogonal:rekbeweis} -\end{equation} -Grad $\le n$ hat. -Dazu müssen sich die Terme vom Grad $n+1$ in den Polynomen wegheben, -d.~h.~$k_{n+1}-A_nk_n=0$, woraus die erste Beziehung in -\eqref{buch:orthogonal:eqn:koeffizientenrelation} folgt. - -Die Polynome $p_k$ sind durch Orthogonalisierung der Monome -$1$, $x$,\dots $x^{k}$ entstanden. -Dies bedeutet, dass $\langle p_n,x^k\rangle_w=0$ für alle $k<n$ -gilt und daher auch $\langle p_n,Q\rangle_w=0$ für jedes Polynome -$Q(x)$ vom Grad $<n$. - -Das Polynom $b(x)$ ist vom Grad $\le n$, es lässt sich also als -Linearkombination +\int_{-1}^1 |f(x)|^2 w^{(\alpha,\beta)}(x)\,dx. +\] +\end{definition} + +\begin{definition} +\label{buch:orthogonal:def:jacobi-polynome} +Die {\em Jacobi-Polynome} $P^{(\alpha,\beta)}_n(x)$ sind +\index{Jacobi-Polynome}% +Polynome vom Grad $n$, die bezüglich des Skalarproduktes +$\langle\,\;,\;\rangle_{w^{(\alpha,\beta)}}$ orthogonal sind +und mit \[ -b(x) = \sum_{k=0}^n b_k p_k(x) +P_n^{(\alpha,\beta)}(1) = \binom{n+\alpha}n \] -der $p_k$ mit $k\le n$ schreiben. -Die Koeffizienten $b_j$ kann man erhalten, indem man -\eqref{buch:orthogonal:rekbeweis} Skalar mit $p_j$ multipliziert. -Dabei erhält man +normiert sind. +\end{definition} + +In Abbildung~\ref{buch:orthogonal:fig:jacobi-parameter} +ist die Abhängigkeit der Jacobi-Polynome von den Parametern $\alpha$ +und $\beta$ illustriert. +Für $\alpha=\beta=0$ entsteht die Gewichtsfunktion +$w^{(0,0)}(x)=1$, die Legendre-Polynome sind also der Spezialfall +$\alpha=\beta=0$ der Jacobi-Polynome. + +Der Exponent $\alpha$ in der Gewichtsfunktion $w^{(\alpha,\beta)}(x)$ +steuert das Gewicht, welches Punkte am rechten Rand des Intervalls +erhalten. +Für positive Werte von $\alpha$ hat $w^{(\alpha,\beta)}(x)$ eine +Nullstelle vom Grad $\alpha$ an der Stelle $x=1$, nach +Lemma~\ref{buch:orthogonal:lemma:gewichtsfunktion} +dürfen die Funktionen einen Pole der Ordnung $<\frac12(\alpha-1)$ haben. +Je grösser $\alpha$ ist, desto weniger Gewicht haben die Punkte +am rechten Rand des Intervalls und desto schneller darf eine Funktion +für $x\to 1$ divergieren. + +Für negative Werte von $\alpha$ hat $w^{(\alpha,\beta)}(x)$ einen +Pol vom Grad $-\alpha$ an der Stelle $x=1$. +Funktionen müssen daher also ein Nullstelle mindestens vom Grad +$\frac12(1-\alpha)$ haben. + +\begin{figure} +\centering +\includegraphics[width=\textwidth]{chapters/070-orthogonalitaet/images/jacobi.pdf} +\caption{Jacobi-Polynome vom Grad $1$ bis $14$ für verschiedene Werte +der Parameter $\alpha$ und $\beta$. +Je grösser $\alpha$, desto weniger Gewicht bekommen die Funktionswerte am +rechten Rand und desto grösser werden die Funktionswerte. +Für negative $\alpha$ müssen die Polynome dagegen eine Nullstelle am +rechten Rand haben. +\label{buch:orthogonal:fig:jacobi-parameter}} +\end{figure} + +% +% Tschebyscheff-Gewichtsfunktion +% +\subsubsection{Tschebyscheff-Gewichtsfunktion} +Es wird später gezeigt werden, dass die Tschebyscheff-Polynome +von Abschnitt~\ref{buch:polynome:section:tschebyscheff} eine +Familie orthogonaler Polynome sein. +Das zugehörige Skalarprodukt hat die Gewichtsfunktion \[ -h_jb_j +w_{\text{Tschebyscheff}}(x) = -\langle b,p_j\rangle_w +\frac{1}{\sqrt{1-x^2}} = -\langle p_{n+1},p_j\rangle_w -- -A_n\langle xp_n,p_j\rangle_w. +\frac{1}{\sqrt{(1-x)(1+x)}} += +(1-x)^{-\frac{1}{2}} +(1+x)^{-\frac{1}{2}} += +w^{(-\frac12,-\frac12)}(x). \] -Für $j\le n$ verschwindet der erste Term nach der Definition einer -Folge von orthogonalen Polynomen. -Den zweiten Term kann man umformen in +Die {\em Tschebyscheff-Gewichtsfunktion} ist also ein Spezialfall der +Jacobi-Gewichtsfunktion. +\index{Tschebyscheff-Gewichtsfunktion}% + +% +% Hermite-Gewichtsfunktion +% +\subsubsection{Hermite-Gewichtsfunktion} +Die Gewichtsfunktion \[ -\langle xp_n,p_j\rangle_w +w_{\text{Hermite}}(x) += +w(x) = -\langle p_n,xp_j\rangle_w. +e^{-\frac{x^2}{2}} \] -Darin ist $xp_j$ ein Polynom vom Grad $j+1$. -Für $n>j+1$ folgt, dass der zweite Term verschwindet. -Somit sind alle $b_j=0$ mit $j<n-1$, nur der Term $j=n-1$ -bleibt bestehen. -Mit $B_n=b_n$ und $C_n=b_{n-1}$ bekommt man die somit die -Rekursionsbeziehung~\eqref{buch:orthogonal:eqn:rekursion}. - -Indem man das Skalarprodukt von~\eqref{buch:orthogonal:eqn:rekursion} -mit $p_{n-1}$ bildet, findet man -\begin{align} -\underbrace{\langle -p_{n+1},p_{n-1} -\rangle_w}_{\displaystyle=0} -&= -\langle (A_nx+B_n)p_n+C_np_{n-1},p_{n-1} \rangle_w -\notag -\\ -0 -&= -A_n\langle xp_n,p_{n-1} \rangle_w -+B_n\underbrace{\langle p_n,b_{n-1}\rangle_w}_{\displaystyle=0} --C_n\|p_{n-1}\|_w^2 -\notag -\\ -0 -&= -A_n\langle p_n,xp_{n-1} \rangle_w --C_n\|p_{n-1}\|_w^2 -\label{buch:orthogonal:eqn:rekbeweis2} -\end{align} -Indem man $xp_n$ als +heisst die {\em Hermite-Gewichtsfunktion}. +\index{Hermite-Gewichtsfunktion}% +Sie hat keine Nullstellen und geht für $x\to\pm\infty$ so schnell +gegen $0$, dass für alle Polynome \[ -xp_{n-1}(x) -= -\frac{k_{n-1}}{k_n} p_n(x) -+ -\sum_{k=0}^{n-1} d_kp_k(x) +\int_{-\infty}^\infty |f(x)|^2 e^{-\frac{x^2}{2}}\,dx<\infty \] -schreibt, bekommt man -\begin{align*} -\langle -p_n, -xp_{n-1} -\rangle_w -&= -\biggl\langle -p_n, -\frac{k_{n-1}}{k_n} p_n -+ -\sum_{k=0}^{n-1} d_kp_k -\biggr\rangle_w -= -\frac{k_{n-1}}{k_n}h_n -+ -\sum_{k=0}^{n-1} d_k\underbrace{\langle p_n,p_k\rangle_w}_{\displaystyle=0} -\end{align*} -Eingesetzt in~\eqref{buch:orthogonal:eqn:rekbeweis2} erhält man +ist. +Als Definitionsintervall kann daher die ganze reelle Achse +verwendet werden, also $a=-\infty$ und $b=\infty$. +Die mit dieser Gewichtsfunktion konstruierten Polynome heissen +bei geeigneter Normierung die {\em Hermite-Polynome}. +% XXX Normierung der Hermite-Polynome festlegen +\index{Hermite-Polynome}% + +% +% Laguerre-Gewichtsfunktion +% +\subsection{Laguerre-Gewichtsfunktion} +Ähnlich wie die Hermite-Gewichtsfunktion ist die +{\em Laguerre-Gewichtsfunktion} +\index{Laguerre-Gewichtsfunktion}% \[ -A_n\frac{k_{n-1}}{k_n}h_n = C_n h_{n-1} -\qquad\Rightarrow\qquad -C_n +w_{\text{Laguerre}}(x) = -A_n\frac{k_{n-1}}{k_n}\frac{h_n}{h_{n-1}}, +w^{-x} \] -damit ist auch die zweite Beziehung von -\eqref{buch:orthogonal:eqn:koeffizientenrelation}. -\end{proof} +auf ganz $\mathbb{R}$ definiert, und sie geht für $x\to\infty$ wieder +sehr rasch gegen $0$. +Für $x\to-\infty$ hingegen wächst sie so schnell an, dass für alle Polynome +$p(x)$ das Integral +\[ +\int_{-\infty}^\infty p(x)e^{-x}\,dx +\] +unbeschränkt ist. +Die Laguerre-Gewichtsfunktion ist daher nur geeignet für den +Definitionsbereich $(0,\infty)$. +Die bezüglich der Laguerre-Gewichtsfunktion orthogonalen Polynome +heissen bei geeigneter Normierung die {\em Laguerre-Polynome}. +\index{Laguerre-Polynome}% diff --git a/buch/chapters/070-orthogonalitaet/rekursion.tex b/buch/chapters/070-orthogonalitaet/rekursion.tex new file mode 100644 index 0000000..5ec7fed --- /dev/null +++ b/buch/chapters/070-orthogonalitaet/rekursion.tex @@ -0,0 +1,218 @@ +% +% rekursion.tex -- drei term rekursion für orthogonale Polynome +% +% (c) 2022 Prof Dr Andreas Müller, OST Ostschweizer Fachhochschule +% +\section{Drei-Term-Rekursion für orthogonale Polynome +\label{buch:orthogonal:section:drei-term-rekursion}} +Die Berechnung der Legendre-Polynome mit Hilfe des Gram-Schmidt-Verfahrens +ist wenig hilfreich, wenn es darum geht, Werte der Polynome zu berechnen. +Glücklicherweise erfüllen orthogonale Polynome automatisch eine +Rekursionsbeziehung mit nur drei Termen. +Zum Beispiel kann man zeigen, dass für die Legendre-Polynome die +Relation +\begin{align*} +nP_n(x) &= (2n-1)xP_{n-1}(x) - (n-1)P_{n-2}(x),\;\forall n\ge 2, +\\ +P_1(x) &= x, +\\ +P_0(x) &= 1. +\end{align*} +Mit so einer Rekursionsbeziehung ist es sehr einfach, die Funktionswerte +für alle $P_n(x)$ zu berechnen. + +\begin{definition} +Eine Folge von Polynomen $p_n(x)$ heisst orthogonal bezüglich des +Skalarproduktes $\langle\,\;,\;\rangle_w$, wenn +\[ +\langle p_n,p_m\rangle_w = h_n \delta_{nm} +\] +für alle $n$, $m$. +\end{definition} + +\subsection{Allgemeine Drei-Term-Rekursion für orthogonale Polynome} +Der folgende Satz besagt, dass $p_n$ eine Rekursionsbeziehung erfüllt. + +\begin{satz} +\label{buch:orthogonal:satz:drei-term-rekursion} +Eine Folge bezüglich $\langle\,\;,\;\rangle_w$ orthogonaler Polynome $p_n$ +mit dem Grade $\deg p_n = n$ erfüllt eine Rekursionsbeziehung der Form +\begin{equation} +p_{n+1}(x) += +(A_nx+B_n)p_n(x) - C_np_{n-1}(x) +\label{buch:orthogonal:eqn:rekursion} +\end{equation} +für $n\ge 0$, wobei $p_{-1}(x)=0$ gesetzt wird. +Die Zahlen $A_n$, $B_n$ und $C_n$ sind reell und es ist +$A_{n-1}A_nC_n\ge 0$ für $n>0$. +Wenn $k_n>0$ der Leitkoeffizient von $p_n(x)$ ist, dann gilt +\begin{equation} +A_n=\frac{k_{n+1}}{k_n}, +\qquad +C_{n+1} = \frac{A_{n+1}}{A_n}\frac{h_{n+1}}{h_n}. +\label{buch:orthogonal:eqn:koeffizientenrelation} +\end{equation} +\end{satz} + +\subsection{Multiplikationsoperator mit $x$} +Man kann die Relation auch nach dem Produkt $xp_n(x)$ auflösen, dann +wird sie +\begin{equation} +xp_n(x) += +\frac{1}{A_n}p_{n+1}(x) +- +\frac{B_n}{A_n}p_n(x) ++ +\frac{C_n}{A_n}p_{n-1}(x). +\label{buch:orthogonal:eqn:multixrelation} +\end{equation} +Die Multiplikation mit $x$ ist eine lineare Abbildung im Raum der Funktionen. +Die Relation~\eqref{buch:orthogonal:eqn:multixrelation} besagt, dass diese +Abbildung in der Basis der Polynome $p_k$ tridiagonale Form hat. + +\subsection{Drei-Term-Rekursion für die Tschebyscheff-Polynome} +Eine Relation der Form~\eqref{buch:orthogonal:eqn:multixrelation} +wurde bereits in +Abschnitt~\ref{buch:potenzen:tschebyscheff:rekursionsbeziehungen} +hergeleitet. +In der Form~\eqref{buch:orthogonal:eqn:rekursion} geschrieben lautet +sie +\[ +T_{n+1}(x) = 2x\,T_n(x)-T_{n-1}(x). +\] +also +$A_n=2$, $B_n=0$ und $C_n=1$. + +\subsection{Beweis von Satz~\ref{buch:orthogonal:satz:drei-term-rekursion}} +Die Relation~\eqref{buch:orthogonal:eqn:multixrelation} zeigt auch, +dass der Beweis die Koeffizienten $\langle xp_k,p_j\rangle_w$ +berechnen muss. +Dabei wird wiederholt der folgende Trick verwendet. +Für jede beliebige Funktion $f$ mit $\|f\|_w^2<\infty$ ist +\[ +\langle fp_k,p_j\rangle_w += +\langle p_k,fp_j\rangle_w. +\] +Für $f(x)=x$ kann man weiter verwenden, dass $xp_k(x)$ ein Polynom +vom Grad $k+1$ ist. +Die Gleichheit $\langle xp_k,p_j\rangle_w=\langle p_k,xp_j\rangle_w$ +ermöglicht also, den Faktor $x$ dorthin zu schieben, wo es nützlicher ist. + +\begin{proof}[Beweis des Satzes] +Multipliziert man die rechte Seite von +\eqref{buch:orthogonal:eqn:rekursion} aus, dann ist der einzige Term +vom Grad $n+1$ der Term $A_nxp_n(x)$. +Der Koeffizient $A_n$ ist also dadurch festgelegt, dass +\begin{equation} +b(x) += +p_{n+1}(x) - A_nxp_n(x) +\label{buch:orthogonal:rekbeweis} +\end{equation} +Grad $\le n$ hat. +Dazu müssen sich die Terme vom Grad $n+1$ in den Polynomen wegheben, +d.~h.~$k_{n+1}-A_nk_n=0$, woraus die erste Beziehung in +\eqref{buch:orthogonal:eqn:koeffizientenrelation} folgt. + +Die Polynome $p_k$ sind durch Orthogonalisierung der Monome +$1$, $x$,\dots $x^{k}$ entstanden. +Dies bedeutet, dass $\langle p_n,x^k\rangle_w=0$ für alle $k<n$ +gilt und daher auch $\langle p_n,Q\rangle_w=0$ für jedes Polynome +$Q(x)$ vom Grad $<n$. + +Das Polynom $b(x)$ ist vom Grad $\le n$, es lässt sich also als +Linearkombination +\[ +b(x) = \sum_{k=0}^n b_k p_k(x) +\] +der $p_k$ mit $k\le n$ schreiben. +Die Koeffizienten $b_j$ kann man erhalten, indem man +\eqref{buch:orthogonal:rekbeweis} Skalar mit $p_j$ multipliziert. +Dabei erhält man +\[ +h_jb_j += +\langle b,p_j\rangle_w += +\langle p_{n+1},p_j\rangle_w +- +A_n\langle xp_n,p_j\rangle_w. +\] +Für $j\le n$ verschwindet der erste Term nach der Definition einer +Folge von orthogonalen Polynomen. +Den zweiten Term kann man umformen in +\[ +\langle xp_n,p_j\rangle_w += +\langle p_n,xp_j\rangle_w. +\] +Darin ist $xp_j$ ein Polynom vom Grad $j+1$. +Für $n>j+1$ folgt, dass der zweite Term verschwindet. +Somit sind alle $b_j=0$ mit $j<n-1$, nur der Term $j=n-1$ +bleibt bestehen. +Mit $B_n=b_n$ und $C_n=b_{n-1}$ bekommt man die somit die +Rekursionsbeziehung~\eqref{buch:orthogonal:eqn:rekursion}. + +Indem man das Skalarprodukt von~\eqref{buch:orthogonal:eqn:rekursion} +mit $p_{n-1}$ bildet, findet man +\begin{align} +\underbrace{\langle +p_{n+1},p_{n-1} +\rangle_w}_{\displaystyle=0} +&= +\langle (A_nx+B_n)p_n+C_np_{n-1},p_{n-1} \rangle_w +\notag +\\ +0 +&= +A_n\langle xp_n,p_{n-1} \rangle_w ++B_n\underbrace{\langle p_n,b_{n-1}\rangle_w}_{\displaystyle=0} +-C_n\|p_{n-1}\|_w^2 +\notag +\\ +0 +&= +A_n\langle p_n,xp_{n-1} \rangle_w +-C_n\|p_{n-1}\|_w^2 +\label{buch:orthogonal:eqn:rekbeweis2} +\end{align} +Indem man $xp_n$ als +\[ +xp_{n-1}(x) += +\frac{k_{n-1}}{k_n} p_n(x) ++ +\sum_{k=0}^{n-1} d_kp_k(x) +\] +schreibt, bekommt man +\begin{align*} +\langle +p_n, +xp_{n-1} +\rangle_w +&= +\biggl\langle +p_n, +\frac{k_{n-1}}{k_n} p_n ++ +\sum_{k=0}^{n-1} d_kp_k +\biggr\rangle_w += +\frac{k_{n-1}}{k_n}h_n ++ +\sum_{k=0}^{n-1} d_k\underbrace{\langle p_n,p_k\rangle_w}_{\displaystyle=0} +\end{align*} +Eingesetzt in~\eqref{buch:orthogonal:eqn:rekbeweis2} erhält man +\[ +A_n\frac{k_{n-1}}{k_n}h_n = C_n h_{n-1} +\qquad\Rightarrow\qquad +C_n += +A_n\frac{k_{n-1}}{k_n}\frac{h_n}{h_{n-1}}, +\] +damit ist auch die zweite Beziehung von +\eqref{buch:orthogonal:eqn:koeffizientenrelation}. +\end{proof} diff --git a/buch/chapters/070-orthogonalitaet/rodrigues.tex b/buch/chapters/070-orthogonalitaet/rodrigues.tex index 590038a..9fded85 100644 --- a/buch/chapters/070-orthogonalitaet/rodrigues.tex +++ b/buch/chapters/070-orthogonalitaet/rodrigues.tex @@ -5,6 +5,7 @@ % \section{Rodrigues-Formeln \label{buch:orthogonalitaet:section:rodrigues}} +\rhead{Rodrigues-Formeln} Die Drei-Term-Rekursionsformel ermöglicht Werte orthogonaler Polynome effizient zu berechnen. Die Rekursionsformel erhöht den Grad eines Polynoms, indem mit $x$ @@ -173,7 +174,7 @@ Die Pearsonsche Differentialgleichung ist für $A(x)=0$ immer erfüllt. Die Randbedingung bedeutet wegen $w(x)=1$, dass $B(x)$ an den Endpunkten des Intervalls verschwinden muss. Da $B(x)$ ein Polynom höchstens vom Grad $2$ ist, muss $B(x)$ ein -Vielfaches von $(x-1)(x+1)=x^-1$ sein. +Vielfaches von $(x-1)(x+1)=x^2-1$ sein. Die Rodrigues-Formel für die Legendre-Polynome hat daher die Form \[ P_n(x) @@ -195,8 +196,337 @@ P_n(x) \] \subsubsection{Hermite-Polynome} -TODO +Die Hermite-Polynome sind auf ganz $\mathbb{R}$ definiert und verwenden +die Gewichtsfunktion +\[ +w(x) = e^{-x^2}. +\] +Für jedes beliebige Polynome $B(x)$, auch für höheren Grad als $2$, ist +\[ +\lim_{x\to-\infty} B(x) w(x) += +\lim_{x\to-\infty} B(x)^e{-x^2} += +0 +\qquad\text{und}\qquad +\lim_{x\to\infty} B(x) w(x) += +\lim_{x\to\infty} B(x)^e{-x^2} += +0, +\] +die Randbedingung der Pearsonschen Differentialgleichung ist also +immer erfüllt. + +Die Ableitung der Gewichtsfunktion ist +\[ +w'(x) = -2xe^{-x^2}. +\] +Eingsetzt in die Pearsonsche Differentialgleichung findet man +\[ +\frac{w'(x)}{w(x)} += +\frac{-2xe^{-x^2}}{e^{-x^2}} += +\frac{-2x}{1} +\] +und daher +\[ +A(x) = -2x +\qquad\text{und}\qquad +B(x) = 1. +\] +Die Gradbedingung ist also immer erfüllt und es folgt die Rodrigues-Formel +für die Hermite-Polynome +\begin{equation} +H_n(x) += +c_n +e^{x^2}\frac{d^n}{dx^n} e^{-x^2} += +(-1)^n +e^{x^2}\frac{d^n}{dx^n} e^{-x^2}. +\label{buch:orthogonal:eqn:hermite-rodrigues} +\end{equation} + +Die Hermite-Polynome können mit der Rodrigues-Formel berechnen, aber die +Form~\eqref{buch:orthogonal:eqn:hermite-rodrigues} ist dazu nicht gut +geeignet. +Dazu dient die Berechnung +\[ +-\frac{d}{dx} +e^{-x^2}f(x) += +2xe^{-x^2}f(x) +- +e^{-x^2}f'(x) += +e^{-x^2} +\biggl(-\frac{d}{dx}+2x\biggr) +f(x), +\] +nach der der Ableitungsoperator mit dem Faktor $e^{-x^2}$ +vertauscht werden kann, wenn er durch die grosse Klammer auf der +rechten Seite ersetzt wird. +Die Rodrigues-Formel bekommt daher die Form +\[ +H_n(x) = \biggl(\frac{d}{dx}-2x\biggr)^n \cdot 1 +\] + +TODO: Relation zu hypergeometrischen Funktionen $\mathstrut_1F_1$ + +%\url{https://en.wikipedia.org/wiki/Rodrigues%27_formula} + +% +% Jacoib-Gewichtsfunktion +% +\subsubsection{Jacobi-Gewichtsfunktion} +%(%i1) w: (1-x)^a*(1+x)^b; +% a b +%(%o1) (1 - x) (x + 1) +%(%i2) diff(w,x)/w; +% a b - 1 a - 1 b +% b (1 - x) (x + 1) - a (1 - x) (x + 1) +%(%o2) ------------------------------------------------- +% a b +% (1 - x) (x + 1) +%(%i3) q: diff(w,x)/w; +% a b - 1 a - 1 b +% b (1 - x) (x + 1) - a (1 - x) (x + 1) +%(%o3) ------------------------------------------------- +% a b +% (1 - x) (x + 1) +%(%i4) ratsimp(q); +% (b + a) x - b + a +%(%o4) ----------------- +% 2 +% x - 1 +% +Die Jacobi-Gewichtsfunktion +\[ +w(x) += +w^{(\alpha,\beta)}(x) += +(1-x)^\alpha(1+x)^\beta +\] +hat die Ableitung +\[ +w'(x) += +\beta(1-x)^\alpha(1+x)^{\beta-1}-\alpha(1-x)^{\alpha-1}(1+x)^\beta +\] +und für die linke Seite der Pearsonschen Differentialgleichung findet man +\[ +\frac{w'(x)}{w(x)} += +\frac{ +\beta(1-x)^\alpha(1+x)^{\beta-1}-\alpha(1-x)^{\alpha-1}(1+x)^\beta +}{ +(1-x)^\alpha(1+x)^\beta +} += +\frac{\beta-\alpha-(\alpha+\beta)x}{1-x^2} += +\frac{A(x)}{B(x)}. +\] +Die Polynome +\[ +A(x) = \beta-\alpha-(\alpha+\beta)x +\qquad\text{und}\qquad +B(x) = 1-x^2 +\] +erfüllen die Gradvoraussetzungen für eine Lösung der Pearsonschen +Differentialgleichung, die Anlass zu einer Rodrigues-Formel gibt. +Die Randbedingungen sind noch zu prüfen: $B(x)$ hat eine Nullstelle +erster Ordnung bei $\pm1$, also ist +\[ +\lim_{x\to \pm1\mp} B(x)w(x) = 0 +\] +genau dann, wenn $\alpha>-1$ und $\beta>-1$ gilt. +Für $\alpha>-1$ und $\beta>-1$ gibt es daher auch für die Jacobi-Polynome +eine Rodriguez-Formel der Art +\[ +P^{(\alpha,\beta)}_n(x) += +\frac{c_n}{w^{(\alpha,\beta)}(x)} +\frac{d^n}{dx^n} +\bigl((1-x^2)^{n} w^{(\alpha,\beta)}(x)\bigr). +\] +Die Konstanten $c_n$ werden durch die Normierung +% XXX in welchem Abschnitt +festgelegt. + +\subsubsection{Die Tschebyscheff-Gewichtsfunktion} +Die Tschebyscheff-Gewichtsfunktion ist der Spezialfall $a=b=-\frac12$ +der Jacobi-Gewichtsfunktion. +Die Rodrigues-Formel für die Tschebyscheff-Polynome lautet daher +\[ +T_n(x) += +c_n\sqrt{1-x^2} \frac{d^n}{dx^n} +\frac{(1-x^2)^n}{\sqrt{1-x^2}} += +\frac{1}{2^nn!} \sqrt{1-x^2} +\frac{d^n}{dx^n} +\frac{(1-x^2)^n}{\sqrt{1-x^2}}, +\] +wobei wir den korrekten Wert von $c_n$ nicht nachgewiesen haben. + +\subsubsection{Die Laguerre-Gewichtsfunktion} +Die Laguerre-Gewichtsfunktion +\[ +w_{\text{Laguerre}}(x) += +w(x) += +e^{-x} +\] +hat die Ableitung +\[ +w'(x) = -e^{-x}, +\] +die Pearsonsche Differentialgleichung ist daher +\[ +\frac{w'(x)}{w(x)}=\frac{-1}{1}. +\] +Dies suggeriert $A(x)=-1$ und $B(x)=1$ als Zähler und Nenner der rechten +Seite, aber daraus produziert die Rodrigues-Formel immer nur die konstante +Funktion. +Ausserdem ist die Randbedingung an der Stelle $x=0$ nicht erfüllt. +$B(x)$ muss so gewählt werden, dass +\[ +0 += +\lim_{x\to 0+} w(x)B(x) += +\lim_{x\to 0+} e^{-x}B(x) += +\lim_{x\to 0+} B(x) += +B(0). +\] +Die Annahme einer konstanten Funktion $B(x)$ widerspricht dem. +Aus der Pearsonschen Differentialgleichung folgt $A(x)=-B(x)$. +Da $A(x)$ höchstens vom Grad 1 sein kann und $B(x)$ mindestens +vom Grad $1$ muss, folgt +\[ +B(x) = x +\qquad\text{und}\qquad +A(x) = -x. +\] +Die Rodrigues-Formel liefert dann die Laguerre-Polynome als +\[ +L_n(x) = c_n e^x \frac{d^n}{dx^n} x^ne^{-x}. +\] +Die Werte von $c_n$ hängen von der gewählten Normierung ab. + +Mit der Rodrigues-Formel können die Laguerre-Polynome bis auf +die Normierung recht direkt berechnen. +Dazu versuchen wir die Ableitungen von $f(x)e^{-x}$ dadurch zu +berechnen, dass wir den Gewichtsfaktor $e^{-x}$ möglichst weit +nach links verschieben wie in +\begin{align*} +\frac{d}{dx} +e^{-x} +f(x) +&= +e^{-x} +\bigl( -f(x) + f'(x) \bigr) += +e^{-x} +\biggl( -1 + \frac{d}{dx}\biggr) f. +\end{align*} +Daraus kann man ablesen, dass die Ableitung nach $x$ mit dem Faktor +$e^{-x}$ vertauscht werden kann, wenn man die Ableitung durch +$-1+d/dx$ ersetzt. +Damit kann jetzt auch die $n$-te Ableitung bestimmen: +\begin{align*} +\frac{d^n}{dx^n}e^{-x}f(x) +&= +e^{-x} \biggl(\frac{d}{dx}-1\biggr)^n f(x) += +e^{-x} \sum_{k=0}^n (-1)^{k}\binom{n}{k}\frac{d^{n-k}}{dx^{n-k}} f(x) +\end{align*} +Dies muss jetzt auf $f(x)=x^n$ angewendet werden. +Es ergibt sich +\begin{align*} +\frac{d^n}{dx^n}e^{-x}x^n +&= +e^{-x} \sum_{k=0}^n (-1)^{k}\binom{n}{k}\frac{d^{n-k}}{dx^{n-k}} x^n +\\ +&= +e^{-x} \sum_{k=0}^n (-1)^{k}\binom{n}{k} +n(n-1)(n-2)\cdots (k+1) +x^k +\\ +&= +e^{-x} +\sum_{k=0}^n (-1)^k \frac{n(n-1)\cdots(n-k+1)}{k!} +\frac{n!}{k!} +x^k +\\ +&= +e^{-x} n! +\sum_{k=0}^\infty +\frac{(-n)(-n+1)(-n+2)\cdot\ldots\cdot (-n+k-1)}{1\cdot 2\cdot \ldots\cdot k} +\frac{x^k}{k!} +\\ +&= +e^{-x} n! +\cdot +\mathstrut_1F_1\biggl( +\begin{matrix}-n\\1\end{matrix}; x +\biggr). +\end{align*} +Die übliche Normierung für die Laguerre-Polynome ist $L_n(0)=1$, +die übereinstimmt mit dem Wert der hypergeometrischen Funktion +an der Stelle $0$. +Wir fassen die Resultate im folgenden Satz zusammen. + +\begin{satz} +Die Laguerre-Polynome vom Grad $n$ haben die Form +\begin{equation} +L_n(x) += +\sum_{k=0}^n \binom{n}{k}\frac{(-1)^k}{k!}x^k += +\mathstrut_1F_1\biggl(\begin{matrix}-n\\1\end{matrix};x\biggr). +\label{buch:orthogonal:eqn:laguerre-polynom-hypergeometrisch} +\end{equation} +\end{satz} +Laguerre-Polynome sind als spezielle hypergeometrische Funktionen, +für $n\le 7$ sind sie +in Tabelle~\ref{buch:orthogonal:table:laguerre} zusammengestellt. +In Abbildung~\ref{buch:orthogonal:fig:laguerre} sind die Laguerre-Polynome +vom Grad $0$ bis $9$ dargestellt. -\url{https://en.wikipedia.org/wiki/Rodrigues%27_formula} +\begin{figure} +\centering +\includegraphics{chapters/070-orthogonalitaet/images/laguerre.pdf} +\caption{Laguerre-Polynome vom Grad $0$ bis $9$ +\label{buch:orthogonal:fig:laguerre}} +\end{figure} +\begin{table} +\renewcommand{\arraystretch}{1.4} +\centering +\begin{tabular}{|>{$}c<{$}|>{$}l<{$}|} +\hline +n& L_n(x)\\ +\hline +0&1\\ +1&-x+1\\ +2&\frac1{2!}(x^2-4x+2)\\ +3&\frac{1}{3!}(-x^3+9x^2-18x+6)\\ +4&\frac{1}{4!}(x^4-16x^3+72x^2-96x+24)\\ +5&\frac{1}{5!}(-x^5+25x^4-200x^3+60x^2-600x+120)\\ +6&\frac{1}{6!}(x^6-36x^5+450x^4-2400x^3+5400x^2-4320x+720)\\ +7&\frac{1}{7!}(-x^7+49x^6-882x^5+7350x^4-29400x^3+52920x^2-35280x+5040)\\ +8&\frac{1}{8!}(x^8-64x^7+1568x^6-18816x^5+117600x^4-376320x^3+564480x^2-322560x+40320)\\ +\hline +\end{tabular} +\caption{Laguerre-Polynome $L_n(x)$ für $n=0,\dots,8$ +\label{buch:orthogonal:table:laguerre}} +\end{table} diff --git a/buch/chapters/070-orthogonalitaet/saev.tex b/buch/chapters/070-orthogonalitaet/saev.tex new file mode 100644 index 0000000..c667297 --- /dev/null +++ b/buch/chapters/070-orthogonalitaet/saev.tex @@ -0,0 +1,95 @@ +\subsubsection{Selbstadjungierte Operatoren und Eigenvektoren} +Symmetrische Matrizen spielen eine spezielle Rolle in der +endlichdimensionalen linearen Algebra, weil sie sich immer +mit einer orthonormierten Basis diagonalisieren lassen. +In der vorliegenden Situation undendlichdimensionaler Vektorräume +brauchen wir eine angepasste Definition. + +\begin{definition} +Eine lineare Selbstabbildung $A\colon V\to V$ +eines Vektorrraums mit Skalarprodukt +heisst {\em selbstadjungiert}, wenn für alle Vektoren $u,v\in V$ +heisst $\langle Au,v\rangle = \langle u,Av\rangle$. +\end{definition} + +Es ist wohlbekannt, dass Eigenvektoren einer symmetrischen Matrix +zu verschiedenen Eigenwerten orthogonal sind. +Der Beweis ist direkt übertragbar, wir halten das Resultat hier +für spätere Verwendung fest. + +\begin{satz} +Sind $f$ und $g$ Eigenvektoren eines selbstadjungierten Operators $A$ +zu verschiedenen Eigenwerten $\lambda$ und $\mu$, dann sind $f$ und $g$ +orthogonal. +\end{satz} + +\begin{proof}[Beweis] +Im vorliegenden Zusammenhang möchten wir die Eigenschaft nutzen, +dass Eigenfunktionen eines selbstadjungierten Operatores zu verschiedenen +Eigenwerten orthogonal sind. +Dazu seien $Df = \lambda f$ und $Dg=\mu g$ und wir rechnen +\begin{equation*} +\renewcommand{\arraycolsep}{2pt} +\begin{array}{rcccrl} +\langle Df,g\rangle &=& \langle \lambda f,g\rangle &=& \lambda\phantom{)}\langle f,g\rangle +&\multirow{2}{*}{\hspace{3pt}$\biggl\}\mathstrut-\mathstrut$}\\ +=\langle f,Dg\rangle &=& \langle f,\mu g\rangle &=& \mu\phantom{)}\langle f,g\rangle& +\\[2pt] +\hline + 0 & & &=& (\lambda-\mu)\langle f,g\rangle& +\end{array} +\end{equation*} +Da $\lambda-\mu\ne 0$ ist, muss $\langle f,g\rangle=0$ sein. +\end{proof} + +\begin{beispiel} +Sei $C^1([0,2\pi], \mathbb{C})=C^1(S^1,\mathbb{C})$ +der Vektorraum der $2\pi$-periodischen differenzierbaren Funktionen mit +dem Skalarprodukt +\[ +\langle f,g\rangle += +\frac{1}{2\pi}\int_0^{2\pi} \overline{f(t)}g(t)\,dt +\] +enthält die Funktionen $e_n(t) = e^{int}$. +Der Operator +\[ +D=i\frac{d}{dt} +\] +ist selbstadjungiert, denn mit Hilfe von partieller Integration erhält man +\[ +\langle Df,g\rangle += +\frac{1}{2\pi} +\int_0^{2\pi} +\underbrace{ +\overline{i\frac{df(t)}{dt}} +}_{\uparrow} +\underbrace{g(t)}_{\downarrow} +\,dt += +\underbrace{ +\frac{-i}{2\pi} +\biggl[ +\overline{f(t)}g(t) +\biggr]_0^{2\pi} +}_{\displaystyle=0} ++ +\frac{1}{2\pi} +\int_0^{2\pi} +\overline{f(t)}i\frac{dg(t)}{dt} +\,dt += +\langle f,Dg\rangle +\] +unter Ausnützung der $2\pi$-Periodizität der Funktionen. + +Die Funktionen $e_n(t)$ sind Eigenfunktionen des Operators $D$, denn +\[ +De_n(t) = i\frac{d}{dt}e^{int} = -n e^{int} = -n e_n(t). +\] +Nach obigem Satz sind die Eigenfunktionen von $D$ orthogonal. +\end{beispiel} + +Das Beispiel illustriert, dass orthogonale Funktionenfamilien +ein automatisches Nebenprodukt selbstadjungierter Operatoren sind. diff --git a/buch/chapters/070-orthogonalitaet/sturm.tex b/buch/chapters/070-orthogonalitaet/sturm.tex index c8ee11a..c9c9cc6 100644 --- a/buch/chapters/070-orthogonalitaet/sturm.tex +++ b/buch/chapters/070-orthogonalitaet/sturm.tex @@ -36,8 +36,11 @@ für Matrizen ist das folgende verallgemeinerte Eigenwertproblem. Das gewohnte Eigenwertproblem verwendet die Matrix $B=E$. \begin{definition} +\index{verallgemeinerter Eigenvektor}% +\index{Eigenvektor, verallgemeinerter}% +\label{buch:orthogonal:sturm:verallgemeinerter-eigenvektor} Seien $A$ und $B$ $n\times n$-Matrizen. -$v$ heisst verallgemeinerter Eigenvektor zum Eigenwert $\lambda$, +$v$ heisst {\em verallgemeinerter Eigenvektor} zum Eigenwert $\lambda$, wenn \[ Av = \lambda Bv. @@ -324,7 +327,7 @@ Wir bezeichnen den Vektorraum der Funktionen, deren Quadrat mit der Gewichtsfunktion $w(x)$ integrierbar sind, mit $L^2([a,b],w)$. -Damit auch $\langle qf,f\rangle_w$ und $\langle L_0f,0f\rangle_w$ +Damit auch $\langle qf,f\rangle_w$ und $\langle L_0f,f\rangle_w$ wohldefiniert sind, müssen zusätzlich die Integrale \[ \int_a^b |f(x)|^2 q(x) w(x)\,dx @@ -431,17 +434,217 @@ Dann ist wegen die Bedingung~\eqref{buch:integrale:sturm:sabedingung} ebenfalls erfüllt, $L_0$ ist in diesem Raum selbstadjungiert. -\subsubsection{Bessel-Funktionen} +\subsubsection{Bessel-Funktionen $J_n(x)$} Der Bessel-Operator \eqref{buch:differentialgleichungen:bessel-operator} -hat die Form eines Sturm-Liouville-Operators +kann wie folgt in die Form eines Sturm-Liouville-Operators gebracht +werden. +Zunächst rechnet man \[ +B += x^2\frac{d^2}{dx^2} + x\frac{d}{dx} + x^2 = -\frac{d}{dx} x^2 \frac{d}{dx} + x^2 +x\biggl( +x\frac{d^2}{dx^2} + \frac{d}{dx} + x +\biggr) += +x\biggl( +\frac{d}{dx}(-x)\frac{d}{dx} + x +\biggr). +\] +Somit ist $B$ ein Sturm-Liouville-Operator für +\begin{equation} +\begin{aligned} +p(x) &= -x \\ +q(x) &= x \\ +w(x) &= \frac{1}{x}. +\end{aligned} +\label{buch:orthogonal:sturm:bessel:n} +\end{equation} +Am linken Rand kann als Randbedingung +\[ +\lim_{x\to 0} p(x) y'(x) = 0 +\] +verwendet werden, die für alle Bessel-Funktionen erfüllt ist. +Dies entspricht der Wahl $k_0=0$ und $h_0=1$. +Am rechten Rand für $x\to\infty$ kann man +\[ +\lim_{x\to\infty} y(x)=0 +\] +verlangen, was der Wahl $k_\infty=1$ und $h_\infty=0$ entspricht. +Damit ist die Bessel-Differentialgleichung erkannt als ein +Sturm-Liouville-Problem für $\lambda=n^2$. +Es folgt damit sofort, dass die Besselfunktionen orthogonale +Funktionen bezüglich des Skalarproduktes mit der Gewichtsfunktion +$w(x)=1/x$ sind. + +\subsubsection{Bessel-Funktionen $J_n(s x)$} +Das Sturm-Liouville-Problem mit den Funktionen +\eqref{buch:orthogonal:sturm:bessel:n} +ist jedoch nicht die einzige Möglichkeit, die Bessel-Differentialgleichung +in ein Sturm-Liouville-Problem zu verwandeln. +Das Problem \eqref{buch:orthogonal:sturm:bessel:n} ging davon +aus, dass $n^2$ der verallgemeinerte Eigenwert sein soll. +Im Folgenden sollen hingegen die Funktionen $J_n(s x)$ für +konstantes $n$, aber verschiedene $s$ untersucht und +als orthogonal erkannt werden. + +Die Funktion $y(x) = J_n(x)$ ist eine Lösung der Bessel-Differentialgleichung +\[ +x^2y'' + xy' + x^2y = n^2y. +\] +Setzt man $x=s t$ und $f(t)=y(s t)$, dann wird die Ableitung +\[ +\begin{aligned} +f'(t) +&= +\frac{d}{dt}y(s t) += +y'(s t) \cdot s +&&\Rightarrow +& +\frac{f'(t)}{s} +&= +y'(x) +\\ +f''(t) +&= +\frac{d^2}{dt^2} y(s t) += +y''(s t) \cdot s^2 +&&\Rightarrow +& +\frac{f''(t)}{s^2} +&= +y''(x). +\end{aligned} +\] +Setzt man diese in die Besselsche Differentialgleichung ein, +findet man +\begin{align*} +x^2y''+xy'+x^2y += +s^2 t^2 \frac{f''(t)}{s^2} ++ +s t \frac{f'(t)}{s} ++ +s^2 t^2 f(t) +&= +n^2 f(t). +\end{align*} +Damit ist gezeigt, dass die Funktionen $J_n(s x)$ Lösungen +der Differentialgleichung +\begin{equation} +x^2y'' + xy' + (s^2 x^2 - n^2) y = 0 +\label{buch:orthogonal:sturm:eqn:bessellambda} +\end{equation} +ist. + +Die Differentialgleichung +\eqref{buch:orthogonal:sturm:eqn:bessellambda} +soll jetzt ebenfalls als ein Sturm-Liouville-Problem betrachtet +werden, diesmal aber mit festem $n$ und $s^2$ als dem verallgemeinerten +Eigenwert. +Dazu wird +\begin{equation} +\begin{aligned} +p(x) &= -x \\ +q(x) &= -\frac{n^2}{x} \\ +w(x) &= x +\end{aligned} +\label{buch:orthgonal:sturm:bessel:lambdaparams} +\end{equation} +gesetzt. +Das zugehörige Sturm-Liouville-Problem ist jetzt +\[ +\frac{1}{x}\biggl( +\frac{d}{dx} (-x)\frac{d}{dx} -\frac{n^2}{x} +\biggr) +y += +\lambda y +\quad\Rightarrow\quad +y'' + \frac{1}{x}y' - \frac{n^2}{x^2}y = \lambda y, +\] +oder nach Multiplikation mit $x^2$ +\begin{equation} +x^2y'' + xy' + ((-\lambda)x^2 - n^2) y = 0. +\end{equation} +Die Funktionen $J_n(sx)$ sind daher verallgemeinerte Eigenfunktionen +des Sturm-Liouville-Problems +\eqref{buch:orthgonal:sturm:bessel:lambdaparams} +für den Eigenwert $\lambda = -s^2$. + +\begin{satz}[Orthogonalität der Bessel-Funktionen] +Die Bessel-Funktionen $J_n(sx)$ für verschiedene $s$ sind orthogonal +bezüglich des Skalarproduktes mit der Gewichtsfunktion $w(x)=x$, +d.~h. +\[ +\int_0^\infty J_n(s_1x) J_n(s_2x) x\,dx += +0 +\] +für $s_1\ne s_2$. +\end{satz} + +\begin{proof}[Beweis] +Um die Bessel-Funktionen als Lösung des Sturm-Liouville-Problems +\eqref{buch:orthgonal:sturm:bessel:lambdaparams} +zu betrachten, müssen noch geeignete Randbedingungen formuliert werden. +Für $n>0$ kann man +$J_n(0)=0$ verwenden, also $k_0=1$ und $h_0=0$. +Für $J_0$ ist dies nicht geeignet, aber wegen $J_0'(0)=0$ kann +man für $n=0$ verwenden $k_0=0$ und $h_0=1$ wählen. + +Für den rechten Rand kann man verwenden, dass die Ableitung der +Bessel-Funktionen wie $x^{-3/2}$ gegen $0$ geht, gilt +\[ +\lim_{x\to\infty} p(x) J_n(sx) = 0, +\] +weil $p(x)J_n(sx)$ wie $x^{-1/2}$ gegen $0$ geht. +Dies bedeutet, dass $k_\infty=0$ und $h_\infty=1$ +verwendet werden kann. +Damit sind geeignete Randbedingungen für das Sturm-Liouville-Problem +gefunden. +\end{proof} + +\subsubsection{Laguerre-Polynome} +Die Laguerre-Polynome sind orthogonal bezüglich des Skalarprodukts +mit der Laguerre-Gewichtsfunktion $w(x)=e^{-x}$ und erfüllen die +Laguerre-Differentialgleichung +\eqref{buch:differentialgleichungen:eqn:laguerre-dgl}. +mit $p(x)=-xe^{-x}$ wird +\[ +\frac{1}{w(x)} +\biggl( +- +\frac{d}{dx} p(x) \frac{d}{dx} +\biggr) += +e^x \biggl(xe^{-x}\frac{d^2}{dx^2} + (1-x)e^{-x}\frac{d}{dx}\biggr), +\] +dies sind die abgeleiteten Terme in der Laguerre-Differentialgleichung. +Der Definitionsbereich ist $(0,\infty)$. +Als Randbedingung am linken kann man $y(0)=1$ verwenden, welche +auch die Laguerre-Polynome ergeben hat. +Am rechten Rand ist die Bedingung +\[ +\lim_{x\to\infty} p(x)y'(x) += +\lim_{x\to\infty} xe^{-x} y'(x) += +0 \] -mit $p(x)=x^2$, $q(x)=x^2$. +für beliebige Polynomlösungen erfüllt, dies ist der Fall +$k_{\infty}=0$ und $h_\infty=1$. -XXX TODO: Faktor 2 fehlt. +Das zugehörige verallgemeinerte Eigenwertproblem wird damit +\[ +xy'' + (1-x)y' - \lambda y = 0, +\] +also die Laguerre-Differentialgleichung. +Somit folgt, dass die Laguerre-Polynome orthogonal sind bezüglich +des Skalarproduktes mit der Laguerre-Gewichtsfunktion. \subsubsection{Tschebyscheff-Polynome} Die Tschebyscheff-Polynome sind Lösungen der @@ -485,6 +688,7 @@ bezüglich des Skalarproduktes \subsubsection{Jacobi-Polynome} TODO + \subsubsection{Hypergeometrische Differentialgleichungen} %\url{https://encyclopediaofmath.org/wiki/Hypergeometric_equation} Auch die Eulersche hypergeometrische Differentialgleichung diff --git a/buch/chapters/080-funktionentheorie/analytisch.tex b/buch/chapters/080-funktionentheorie/analytisch.tex index e585aea..15ca2e4 100644 --- a/buch/chapters/080-funktionentheorie/analytisch.tex +++ b/buch/chapters/080-funktionentheorie/analytisch.tex @@ -29,6 +29,7 @@ Funktion zu tun. \end{figure} \begin{beispiel} +\label{buch:funktionentheorie:beispiel:nichtanalytisch} Wir betrachten die Funktion \[ f\colon \mathbb{R}\to\mathbb{R} diff --git a/buch/chapters/110-elliptisch/ellintegral.tex b/buch/chapters/110-elliptisch/ellintegral.tex index c5a9447..46659cd 100644 --- a/buch/chapters/110-elliptisch/ellintegral.tex +++ b/buch/chapters/110-elliptisch/ellintegral.tex @@ -16,7 +16,7 @@ neue spezielle Funktionen zu definieren. \subsection{Definition \label{buch:elliptisch:subsection:definition}} Ein {\em elliptisches Integral} ist ein Integral der Form -\index{elliptishes Integral}% +\index{elliptisches Integral}% \index{Integral, elliptisch}% \begin{equation} \int R\left( x, \sqrt{p(x)}\right)\,dx |