% % rodrigues.tex % % (c) 2022 Prof Dr Andreas Müller, OST Ostschweizer Fachhochschule % \section{Rodrigues-Formeln \label{buch:orthogonalitaet:section:rodrigues}} \rhead{Rodrigues-Formeln} Die Drei-Term-Rekursionsformel ermöglicht Werte orthogonaler Polynome effizient zu berechnen. Die Rekursionsformel erhöht den Grad eines Polynoms, indem mit $x$ multipliziert wird. mit der Ableitung kann man den Grad aber auch senken, man könnte daher auch nach einer Rekursionsformel fragen, die bei einem Polynom hohen Grades beginnt und mit Hilfe von Ableitungen zu geringeren Graden absteigt. Solche Formeln heissen Rodrigues-Formeln nach dem Entdecker Olinde Rodrigues, der eine solche Formal als erster für Legendre-Polynome gefunden hat. In diesem Abschnitt sei $p_n(x)$ eine bezüglich des Skalarproduktes $\langle\,\;,\;\rangle_w$ auf dem Intervall $[a,b]$ orthogonale Familie von Polynomen mit genaum dem Grad $\deg p_n=n$. Die Skalarprodukte sollen \[ \langle p_n,p_m\rangle_w = h_n\delta_{nm} \] sein. \subsection{Pearsonsche Differentialgleichung} Die {\em Pearsonsche Differentialgleichung} ist die Differentialgleichung \begin{equation} B(x) y' - A(x) y = 0, \label{buch:orthogonal:eqn:pearson} \end{equation} wobei $B(x)$ ein Polynom vom Grad höchstens $2$ ist und $A(x)$ ein höchstens lineares Polynom. Die Gleichung~\eqref{buch:orthogonal:eqn:pearson} kann gelöst werden, wenn $y$ und $B(x)$ keine Nullstellen haben. Dann kann man die Gleichung umstellen in \[ \frac{y'}{y} = (\log y)' = \frac{A(x)}{B(x)} \qquad\Rightarrow\qquad y = \exp\biggl( \int\frac{A(x)}{B(x)}\biggr)\,dx. \] Im folgenden nehmen wir zusätzlich an, dass \begin{equation} \lim_{x\to a+} w(x)B(x) = 0, \qquad\text{und}\qquad \lim_{x\to b-} w(x)B(x) = 0. \end{equation} Falls $w(x)$ an den Intervallenden einen von $0$ verschiedenen Grenzwert hat, bedeutet dies, dass $B(a)=B(b)=0$ sein muss. Falls $w(x)$ am Intervallende divergiert, muss $B(x)$ dort eine Nullstelle höherer Ordnung haben, was aber für ein Polynom zweiten Grades nicht möglich ist. \subsection{Rekursionsformel} Multiplikation mit $B(x)$ wird den Grad eines Polynomes typischerweise um $2$ erhöhen, die Ableitung wird ihn wieder um $1$ reduzieren. Etwas formeller kann man dies wie folgt formulieren: \begin{satz} Für alle $n\ge 0$ ist \[ q_n(x) = \frac{1}{w(x)} \frac{d^n}{dx^n} B(x)^n w(x) \] ein Polynom vom Grad höchstens $n$. \end{satz} \begin{proof}[Beweis] Wenn $r_0(x)$ irgend eine differenzierbare Funktion ist, dann ist \begin{align*} \frac{d^n}{dx^n} r_0(x) B(x)^n w(x) &= \frac{d^{n-1}}{dx^{n-1}}\frac{d}{dx} r_0(x) B(x)^n w(x) \\ &= \frac{d^{n-1}}{dx^{n-1}} \bigl(r_0'(x)B(x)+ nB'(x)B(x)^{n-1}w(x) + B(x)^n w'(x) \bigr) \\ &= \frac{d^{n-1}}{dx^{n-1}} (r_0'(x)B(x)+nB'(x)+A(x)) B(x)^{n-1} w(x) = \frac{d^{n-1}}{dx^{n-1}} r_1(x)B^{n-1}(x) w(x). \end{align*} Für die Funktionen $r_k$ gilt die Rekursionsformel \begin{equation} r_k(x) = r_{k-1}'(x)B(x) + kB'(x) + A(x). \label{buch:orthogonal:rodrigues:rekursion:beweis1} \end{equation} Wenn $r_0(x)$ ein Polynom ist, dann sind alle Funktionen $r_k(x)$ ebenfalls Polynome. Durch wiederholte Anwendung dieser Formel kann man schliessen, dass \[ \frac{d^n}{dx^n} r_0(x) B(x)^n w(x) = r_n(x) w(x). \] Insbesondere folgt für $r_0(x)=1$, dass man durch $w(x)$ dividieren kann und dass $r_n(x)=q_n(x)$. Wir müssen auch noch den Grad von $r_k(x)$ bestimmen. Dazu verwenden wir \eqref{buch:orthogonal:rodrigues:rekursion:beweis1} und berechnen den Grad: \begin{equation*} \deg r_k(x) = \max \bigl( \underbrace{\deg(r_{k-1}'(x) B(x))}_{\displaystyle \deg r_{k-1}(x) -1 + 2} , \underbrace{\deg(B'(x))}_{\displaystyle \le 1} , \underbrace{\deg(A(x))}_{\displaystyle \le 1} \bigr) \le \max r_{k-1}(x) + 1. \end{equation*} Aus $\deg r_0(x)=0$ kann man jetzt ablesen, dass $\deg r_k(x)\le k$ ist. Damit ist gezeigt, dass $\deg q_n(x)\le n$. \end{proof} \begin{satz} Es gibt Konstanten $c_n$ derart, dass \[ p_n(x) = \frac{c_n}{w(x)} \frac{d^n}{dx^n} \bigl(B(x)^n w(x)\bigr) \] gilt. \end{satz} \begin{proof}[Beweis] Wir müssen zeigen, dass die Polynome orthogonal sind auf allen Monomen von geringerem Grad. \begin{align*} \langle q_n, x^k\rangle_w &= \int_a^b q_n(x)x^kw(x)\,dx \\ &= \int_a^b \frac{1}{w(x)}\frac{d^n}{dx^n}(B(x)^n w(x)) x^k w(x)\,dx \\ &= \int_a^b \frac{d^n}{dx^n}(B(x)^n w(x)) x^k \,dx \\ &= \biggl[\frac{d^{n-1}}{dx^{n-1}}(B(x)^n w(x)) x^k \biggr]_a^b - \int_a^b \frac{d^{n-1}}{dx^{n-1}}(B(x)^n w(x))kx^{k-1}\,dx \end{align*} Durch $n$-fache Iteration wird das Integral auf $0$ reduziert. Es bleiben nur die eckigen Klammern stehen, doch wenn man die Produktregel auswertet, bleibt immer mindestens ein Produkt $B(x)w(x)$ stehen, nach den Voraussetzungen an den Grenzwert dieses Produktes an den Intervallenden verschwinden diese Terme alle. Damit sind die $q_n(x)$ Polynome, die $w$-orthogonal sind auf allen $x^k$ mit $k-1$ und $\beta>-1$ gilt. Für $\alpha>-1$ und $\beta>-1$ gibt es daher auch für die Jacobi-Polynome eine Rodriguez-Formel der Art \[ P^{(\alpha,\beta)}_n(x) = \frac{c_n}{w^{(\alpha,\beta)}(x)} \frac{d^n}{dx^n} \bigl((1-x^2)^{n} w^{(\alpha,\beta)}(x)\bigr). \] Die Konstanten $c_n$ werden durch die Normierung % XXX in welchem Abschnitt festgelegt. \subsubsection{Die Tschebyscheff-Gewichtsfunktion} Die Tschebyscheff-Gewichtsfunktion ist der Spezialfall $a=b=-\frac12$ der Jacobi-Gewichtsfunktion. Die Rodrigues-Formel für die Tschebyscheff-Polynome lautet daher \[ T_n(x) = c_n\sqrt{1-x^2} \frac{d^n}{dx^n} \frac{(1-x^2)^n}{\sqrt{1-x^2}} = \frac{1}{2^nn!} \sqrt{1-x^2} \frac{d^n}{dx^n} \frac{(1-x^2)^n}{\sqrt{1-x^2}}, \] wobei wir den korrekten Wert von $c_n$ nicht nachgewiesen haben. \subsubsection{Die Laguerre-Gewichtsfunktion} Die Laguerre-Gewichtsfunktion \[ w_{\text{Laguerre}}(x) = w(x) = e^{-x} \] hat die Ableitung \[ w'(x) = -e^{-x}, \] die Pearsonsche Differentialgleichung ist daher \[ \frac{w'(x)}{w(x)}=\frac{-1}{1}. \] Dies suggeriert $A(x)=-1$ und $B(x)=1$ als Zähler und Nenner der rechten Seite, aber daraus produziert die Rodrigues-Formel immer nur die konstante Funktion. Ausserdem ist die Randbedingung an der Stelle $x=0$ nicht erfüllt. $B(x)$ muss so gewählt werden, dass \[ 0 = \lim_{x\to 0+} w(x)B(x) = \lim_{x\to 0+} e^{-x}B(x) = \lim_{x\to 0+} B(x) = B(0). \] Die Annahme einer konstanten Funktion $B(x)$ widerspricht dem. Aus der Pearsonschen Differentialgleichung folgt $A(x)=-B(x)$. Da $A(x)$ höchstens vom Grad 1 sein kann und $B(x)$ mindestens vom Grad $1$ muss, folgt \[ B(x) = x \qquad\text{und}\qquad A(x) = -x. \] Die Rodrigues-Formel liefert dann die Laguerre-Polynome als \[ L_n(x) = c_n e^x \frac{d^n}{dx^n} x^ne^{-x}. \] Die Werte von $c_n$ hängen von der gewählten Normierung ab. Mit der Rodrigues-Formel können die Laguerre-Polynome bis auf die Normierung recht direkt berechnen. Dazu versuchen wir die Ableitungen von $f(x)e^{-x}$ dadurch zu berechnen, dass wir den Gewichtsfaktor $e^{-x}$ möglichst weit nach links verschieben wie in \begin{align*} \frac{d}{dx} e^{-x} f(x) &= e^{-x} \bigl( -f(x) + f'(x) \bigr) = e^{-x} \biggl( -1 + \frac{d}{dx}\biggr) f. \end{align*} Daraus kann man ablesen, dass die Ableitung nach $x$ mit dem Faktor $e^{-x}$ vertauscht werden kann, wenn man die Ableitung durch $-1+d/dx$ ersetzt. Damit kann jetzt auch die $n$-te Ableitung bestimmen: \begin{align*} \frac{d^n}{dx^n}e^{-x}f(x) &= e^{-x} \biggl(\frac{d}{dx}-1\biggr)^n f(x) = e^{-x} \sum_{k=0}^n (-1)^{k}\binom{n}{k}\frac{d^{n-k}}{dx^{n-k}} f(x) \end{align*} Dies muss jetzt auf $f(x)=x^n$ angewendet werden. Es ergibt sich \begin{align*} \frac{d^n}{dx^n}e^{-x}x^n &= e^{-x} \sum_{k=0}^n (-1)^{k}\binom{n}{k}\frac{d^{n-k}}{dx^{n-k}} x^n \\ &= e^{-x} \sum_{k=0}^n (-1)^{k}\binom{n}{k} n(n-1)(n-2)\cdots (k+1) x^k \\ &= e^{-x} \sum_{k=0}^n (-1)^k \frac{n(n-1)\cdots(n-k+1)}{k!} \frac{n!}{k!} x^k \\ &= e^{-x} n! \sum_{k=0}^\infty \frac{(-n)(-n+1)(-n+2)\cdot\ldots\cdot (-n+k-1)}{1\cdot 2\cdot \ldots\cdot k} \frac{x^k}{k!} \\ &= e^{-x} n! \cdot \mathstrut_1F_1\biggl( \begin{matrix}-n\\1\end{matrix}; x \biggr). \end{align*} Die übliche Normierung für die Laguerre-Polynome ist $L_n(0)=1$, die übereinstimmt mit dem Wert der hypergeometrischen Funktion an der Stelle $0$. Wir fassen die Resultate im folgenden Satz zusammen. \begin{satz} Die Laguerre-Polynome vom Grad $n$ haben die Form \begin{equation} L_n(x) = \sum_{k=0}^n \binom{n}{k}\frac{(-1)^k}{k!}x^k = \mathstrut_1F_1\biggl(\begin{matrix}-n\\1\end{matrix};x\biggr). \label{buch:orthogonal:eqn:laguerre-polynom-hypergeometrisch} \end{equation} \end{satz} Laguerre-Polynome sind als spezielle hypergeometrische Funktionen, für $n\le 7$ sind sie in Tabelle~\ref{buch:orthogonal:table:laguerre} zusammengestellt. In Abbildung~\ref{buch:orthogonal:fig:laguerre} sind die Laguerre-Polynome vom Grad $0$ bis $9$ dargestellt. \begin{figure} \centering \includegraphics{chapters/070-orthogonalitaet/images/laguerre.pdf} \caption{Laguerre-Polynome vom Grad $0$ bis $9$ \label{buch:orthogonal:fig:laguerre}} \end{figure} \begin{table} \renewcommand{\arraystretch}{1.4} \centering \begin{tabular}{|>{$}c<{$}|>{$}l<{$}|} \hline n& L_n(x)\\ \hline 0&1\\ 1&-x+1\\ 2&\frac1{2!}(x^2-4x+2)\\ 3&\frac{1}{3!}(-x^3+9x^2-18x+6)\\ 4&\frac{1}{4!}(x^4-16x^3+72x^2-96x+24)\\ 5&\frac{1}{5!}(-x^5+25x^4-200x^3+60x^2-600x+120)\\ 6&\frac{1}{6!}(x^6-36x^5+450x^4-2400x^3+5400x^2-4320x+720)\\ 7&\frac{1}{7!}(-x^7+49x^6-882x^5+7350x^4-29400x^3+52920x^2-35280x+5040)\\ 8&\frac{1}{8!}(x^8-64x^7+1568x^6-18816x^5+117600x^4-376320x^3+564480x^2-322560x+40320)\\ \hline \end{tabular} \caption{Laguerre-Polynome $L_n(x)$ für $n=0,\dots,8$ \label{buch:orthogonal:table:laguerre}} \end{table}