5 files changed, 38 insertions, 35 deletions
diff --git a/buch/chapters/80-wahrscheinlichkeit/chapter.tex b/buch/chapters/80-wahrscheinlichkeit/chapter.tex
index 826e022..764e961 100644
--- a/buch/chapters/80-wahrscheinlichkeit/chapter.tex
+++ b/buch/chapters/80-wahrscheinlichkeit/chapter.tex
@@ -14,10 +14,11 @@ die Zeitentwicklung eines vom Zufall beeinflussten Systems, welches sich
 in mehreren verschiedenen Zuständen befinden kann, ebenfalls mit Hilfe
 von Matrizen modellieren lässt.
 Eine solche Beschreibung ermöglicht Verteilungen,
-Erwartungswerte und stationäre Zustände zu ermitteln.
+Erwartungswerte und stationäre Zustände mit Methoden der linearen
+Algebra zu ermitteln.
 
 Im Abschnitt~\ref{buch:section:google-matrix} wird an Hand der Google
-Matrix bezeigt, wie ein anschauliches Beispiel in natürlicher Weise
+Matrix gezeigt, wie ein anschauliches Beispiel in natürlicher Weise
 auf eine Matrix führt.
 Abschnitt~\ref{buch:section:diskrete-markov-ketten} stellt dann die abstrakte
 mathematische Theorie der Markov-Ketten dar und behandelt einige wichtige
diff --git a/buch/chapters/80-wahrscheinlichkeit/google.tex b/buch/chapters/80-wahrscheinlichkeit/google.tex
index c8d6379..314bea9 100644
--- a/buch/chapters/80-wahrscheinlichkeit/google.tex
+++ b/buch/chapters/80-wahrscheinlichkeit/google.tex
@@ -6,10 +6,10 @@
 \section{Google-Matrix
 \label{buch:section:google-matrix}}
 \rhead{Google-Matrix}
-Das Internet besteht aus einer grossen Zahl von Websites, etwa 400~Millionen
+Das Internet besteht aus einer grossen Zahl von Websites, etwa 1.7~Milliarden
 aktiven Websites, jede besteht aus vielen einzelnen Seiten.
 \index{Internet}%
-Es ist daher angemessen von $N\approx 10^9$ verschiedenen Seiten auszugehen.
+Es ist daher angemessen von $N\approx 10^{10}$ verschiedenen Seiten auszugehen.
 Eine natürliche Sprache umfasst dagegen nur einige 100000 bis Millionen
 von Wörtern.
 Ein durchschnittlicher Sprecher englischer Muttersprache verwendet nur etwa
@@ -30,7 +30,7 @@ Traditionelle Information-Retrieval-Systeme operieren auf einem relativ
 kleinen Dokumentbestand und gehen davon aus, dass bereits wenige, spezifische
 Wörter nur in einem kleinen Teil des Dokumentbestandes vorkommen und damit
 eine übersichtliche Treffermenge ergeben.
-Die Einengung der Treffermenge dank der Suche nach einzelnen Wörtern
+Die Einengung der Treffermenge mit der Suche nach einzelnen Wörtern
 bedeutet aber auch, dass nach Synonymen oder alternative Formen eines
 Wortes separat gesucht werden muss, was die Übersichtlichkeit wieder
 zerstört.
@@ -128,7 +128,7 @@ Falls es einen Link gibt, ist $P(S'_j\mid S_i)\ge 0$.
 A priori wissen wir nicht, wie wahrscheinlich es ist, dass der Besucher
 dem Link auf die Seite $j$ folgt, normalerweise werden nicht alle
 Links mit gleicher Wahrscheinlichkeit verwendet.
-Darüber hben wir aber keine Detailinformation.
+Darüber haben wir aber keine Detailinformation.
 Wir nehmen daher vereinfachend an, dass alle Links gleich wahrscheinlich
 sind.
 Enthält die Seite $i$ genau $n_i$ Links, dann ist die Wahrscheinlichkeit,
@@ -526,7 +526,7 @@ erhält man die Wahrscheinlichkeitsverteilung $p$.
 
 \subsubsection{Potenzverfahren}
 Die üblichen Algorithmen wie der von den meisten Softwarepaketen
-verwendete Francis-Algorithmus \cite{francis:watkins_paper,buch:watkins}
+verwendete Francis-Algorith\-mus \cite{francis:watkins_paper,buch:watkins}
 \index{Francis-Algorithmus}%
 zur Bestimmung von Eigenwerten
 und Eigenvektoren ist für grosse Matrizen nicht praktikabel.
@@ -555,10 +555,10 @@ a_2\lambda_2^k v_2
 +
 \dots
 +
-a_n\lambda_2^k v_n.
+a_n\lambda_n^k v_n.
 \]
 Da $\lambda_1$ der betragsmässig grösste Eigenwert ist, wird der Vektor
-$A^kv$ ungefähr mit der $k$-ten Potenz anwachsen.
+$A^kv$ ungefähr mit der $k$-ten Potenz von $\lambda_1$ anwachsen.
 Indem man durch $\lambda_1^k$ teilt, erhält man
 \[
 \frac{1}{\lambda_1^k} A^k v
diff --git a/buch/chapters/80-wahrscheinlichkeit/markov.tex b/buch/chapters/80-wahrscheinlichkeit/markov.tex
index 226c3d3..3a61a77 100644
--- a/buch/chapters/80-wahrscheinlichkeit/markov.tex
+++ b/buch/chapters/80-wahrscheinlichkeit/markov.tex
@@ -70,7 +70,7 @@ sollten also die Ereignisse $\{X_{t_0}=x_0\}$ bis $\{X_{t_{n-1}}=x_{n-1}\}$
 keinen Einfluss haben.
 
 \begin{definition}
-Ein stochastischer Prozess erfüllt die Markov-Eigenschaft, wenn 
+Ein stochastischer Prozess erfüllt die {\em Markov-Eigenschaft}, wenn 
 für jede Folge von früheren Zeitpunkten $t_0<t_1<\dots <t_n<t$ und Zuständen
 $x_0,\dots,x_n,x\in \mathcal{S}$ die 
 Wahrscheinlichkeit~\eqref{buch:wahrscheinlichkeit:eqn:historybedingt}
@@ -152,12 +152,12 @@ p_{x_1y}(t_1,s)
 \]
 wird.
 Jeder Summand auf der rechten Seite beschreibt einen Weg des Prozesses
-derart, dass er zu den Zwischenzeitpunkten bestimmte 
-Zwischenzustände durchläuft.
+derart, dass zu den Zwischenzeitpunkten bestimmte 
+Zwischenzustände durchlaufen werden.
 
 \begin{definition}
 Die Wahrscheinlichkeit, dass der stochastische Prozess zwischen Zeitpunkten
-$t_0$ und $t_n$ die Zwischenzustände $x_i$ zu Zeiten $t_i$ durchläuft ist
+$t_0$ und $t_n$ die Zwischenzustände $x_i$ zu Zeiten $t_i$ durchläuft, ist
 das Produkt
 \[
 \sum_{x_1,\dots,x_n\in\mathcal{S}}
@@ -221,7 +221,7 @@ T(n+1,n)
 \begin{pmatrix}
 p_{11}(n+1,n) & \dots  & p_{1s}(n+1,n)\\
 \vdots        & \ddots & \vdots       \\
-p_{11}(n+1,n) & \dots  & p_{1s}(n+1,n)
+p_{s1}(n+1,n) & \dots  & p_{ss}(n+1,n)
 \end{pmatrix},
 \]
 auch die $1$-Schritt-Übergangswahrscheinlichkeit genannt, kann man jetzt
@@ -267,14 +267,14 @@ Eine Permutationsmatrix beschreibt einen stochastischen Prozess, dessen
 \end{beispiel}
 
 \subsubsection{Zustandswahrscheinlichkeiten}
-Die Wahrscheinlichkeit, mit der sich der Prozess zum Zeitpunkt $n$
-im Zustand $i\in\mathcal{S}$ befindet, wird
+Die Wahrscheinlichkeiten, mit der sich der Prozess zum Zeitpunkt $n$
+in den Zuständen $i\in\mathcal{S}$ befindet, werden
 \[
 p_i(n)
 =
 P(X_i=n)
 \]
-geschrieben, die auch in einem Vektor $p(n)$ mit den Komponten
+geschrieben, die auch in einem Vektor $p(n)$ mit den Komponenten
 $p_i(n)$ zusammengefasst werden können.
 Die Matrix der Übergangswahrscheinlichkeiten erlaubt, die Verteilung
 $p(n+1)$ aus der Verteilung $p(n)$ zu berechnen.
@@ -331,7 +331,7 @@ ist singulär.
 Dass $T-I$ singulär ist, garantiert aber noch nicht,
 dass alle Einträge in einem Eigenvektor zum Eigenwert $1$
 auch tatsächlich nichtnegativ gewählt werden können.
-Die Perron-Frobienus-Theorie von
+Die Perron-Frobenius-Theorie von
 \index{Perron-Frobenius-Theorie}%
 Abschnitt~\ref{buch:section:positive-vektoren-und-matrizen}
 beweist, dass genau dies immer möglich ist.
@@ -384,7 +384,7 @@ Anzahl der Zyklen der Permutation $\sigma$.
 \end{beispiel}
 
 \subsubsection{Irreduzible Markov-Ketten}
-Die Zyklen-Zerlegung einer Permutation bilden voneinander isolierte
+Die Zyklen-Zerlegung einer Permutation bildet voneinander isolierte
 Mengen von Zuständen, es gibt keine Möglichkeit eines Übergangs zu
 einem anderen Zyklus.
 Die Zyklen können daher unabhängig voneinander studiert werden.
@@ -682,7 +682,7 @@ Dies ist der Spezialfall der Frage~\ref{buch:wahrscheinlichkeit:frage1}
 für die Verteilung $p_j(n-1) = \delta_{i\!j}$.
 Der Erwartungswert ist die Summe der Spalte $j$ der Matrix $G\odot T$.
 Man kann das Produkt $U^t(G\odot T)$ also auch als eine Zeilenvektor
-von Gewinnerwartungen unter der Vorbedingung $X_{n-1}=j$ betrachten.
+von Gewinnerwartungen unter der Vorbedingung $X_{n-1}=j$ betrachten:
 \[
 \begin{pmatrix}
 E(Y\mid X_{n-1}=1)
@@ -795,7 +795,7 @@ dass der Prozess ausgehend vom Zustand $j$ im Schritt $k$ im
 Zustand $i$ ankommt.
 
 Wegen der angenommenen Irreduzibilität wird man
-früher oder später in einem absorbierenden Zustand landet,
+früher oder später in einem absorbierenden Zustand landen,
 daher muss $\lim_{k\to\infty} Q^k=0$ sein.
 Die Summe in der rechten oberen Teilmatrix kann man als geometrische
 Reihe summieren, man erhält die Matrix
@@ -926,7 +926,7 @@ I&RF\\
 \end{array}
 \right).
 \]
-Die Matrix $RF$ enthält enthält also in Zeile $i$ und Spalte $j$
+Die Matrix $RF$ enthält also in Zeile $i$ und Spalte $j$
 die Wahrscheinlichkeit, dass der Prozess ausgehend vom Zustand $j$
 irgendwann im Zustand $i$ absorbiert wird.
 
@@ -939,7 +939,7 @@ den Zustand $l$ hat?
 Wir schreiben $l\overset{\smash{k}}{\twoheadrightarrow} i$ für das Ereignis, dass der Prozess
 im $k$-ten Schritt über den letzten
 Zustand $l$ in den Absorbtionszustand $i$ übergeht.
-Ist uns der Zeitpunkt dies Übergangs egal, lassen wir das $k$
+Ist uns der Zeitpunkt des Übergangs egal, lassen wir das $k$
 weg und schreiben nur $l\twoheadrightarrow i$.
 
 Damit $l\overset{\smash{k}}{\twoheadrightarrow} i$ eintritt, muss der Prozess im $(k-1)$-ten Schritt im
diff --git a/buch/chapters/80-wahrscheinlichkeit/parrondo.tex b/buch/chapters/80-wahrscheinlichkeit/parrondo.tex
index 5c96c09..f238d37 100644
--- a/buch/chapters/80-wahrscheinlichkeit/parrondo.tex
+++ b/buch/chapters/80-wahrscheinlichkeit/parrondo.tex
@@ -51,9 +51,9 @@ andernfalls ist sie $\frac34$.
 Formell ist
 \begin{equation}
 \begin{aligned}
-P(Y=1\mid \text{$K$ durch $3$ teilbar}) &=  \frac{1}{10}
+P(Y=1\mid \text{$K$ durch $3$ teilbar}) &=  \frac{1}{10},
 \\
-P(Y=1\mid \text{$K$ nicht durch $3$ teilbar}) &= \frac{3}{4}
+P(Y=1\mid \text{$K$ nicht durch $3$ teilbar}) &= \frac{3}{4}.
 \end{aligned}
 \label{buch:wahrscheinlichkeit:eqn:Bwahrscheinlichkeiten}
 \end{equation}
@@ -247,7 +247,7 @@ für die verschiedenen Dreierreste des Kapitals in einem interierten
 Spiels ausrechnen.
 
 Das Spiel kennt die Dreierreste als die drei für das Spiel ausschlaggebenden
-Zuständen.
+Zustände.
 Das Zustandsdiagramm~\ref{buch:wahrscheinlichkeit:fig:spielB} zeigt
 die möglichen Übergänge und ihre Wahrscheinlichkeiten, die zugehörige
 Übergangsmatrix ist
@@ -260,7 +260,7 @@ B
 \frac9{10} &\frac34 &0
 \end{pmatrix}.
 \]
-Die Matrix $B$ ist nicht negativ und man kann nachrechnen, dass $B^2>0$ ist.
+Die Matrix $B$ ist nicht negativ aber man kann nachrechnen, dass $B^2>0$ ist.
 Damit ist die Perron-Frobenius-Theorie von
 Abschnitt~\ref{buch:section:positive-vektoren-und-matrizen}
 anwendbar.
@@ -661,7 +661,7 @@ G=\begin{pmatrix}
  0                        &-\frac14-\varepsilon & \frac34-\varepsilon \\
  \frac{1}{10}-\varepsilon & 0                   &-\frac14-\varepsilon \\
 -\frac{9}{10}-\varepsilon & \frac34-\varepsilon & 0
-\end{pmatrix}
+\end{pmatrix}.
 \]
 Wie früher ist der erwartete Gewinn
 \begin{align*}
diff --git a/buch/chapters/80-wahrscheinlichkeit/positiv.tex b/buch/chapters/80-wahrscheinlichkeit/positiv.tex
index 4b86e00..056cfd6 100644
--- a/buch/chapters/80-wahrscheinlichkeit/positiv.tex
+++ b/buch/chapters/80-wahrscheinlichkeit/positiv.tex
@@ -160,8 +160,8 @@ besteht aus zwei $3\times 3$-Blöcken.
 Die beiden Unterräume $V_1=\langle e_1,e_2,e_3\rangle$
 und $V_2=\langle e_4,e_5,e_6\rangle$ sind invariante
 Unterräume von $A$ und damit auch von $A^n$.
-Die Potenzen haben daher auch die gleich Blockstruktur.
-Insbesondere sind zwar die Blöcke von $A^n$ für $n>1$ positive
+Die Potenzen haben daher auch die gleiche Blockstruktur.
+Insbesondere sind zwar die diagonalen Blöcke von $A^n$ für $n>1$ positive
 Teilmatrizen, aber die Matrix $A^n$ ist für alle $n$ nicht positiv.
 \end{beispiel}
 
@@ -236,7 +236,7 @@ Der Satz besagt also, dass es eine Komponente $v_i\ne 0$ gibt
 derart, dass $u_i = (1+\varepsilon)v_i$.
 Diese Komponenten limitiert also, wie stark man $v$ strecken kann,
 so dass er immer noch $\le u$ ist.
-Natürlich folgt aus den der Voraussetzung $u>v$ auch, dass $u$ ein 
+Natürlich folgt aus der Voraussetzung $u>v$ auch, dass $u$ ein 
 positiver Vektor ist (Abbildung~\ref{buch:wahrscheinlichkeit:figure:trenn}).
 
 \begin{figure}
@@ -305,12 +305,14 @@ nicht negativen Vektoren positive Vektoren.
 \label{buch:subsection:verallgemeinerte-dreiecksungleichung}}
 Die Dreiecksungleichung besagt, dass für beliebige Vektoren
 $u,v\in\mathbb{R}^n$ gilt
-\[
+\begin{equation}
 |u+v|\le |u|+|v|
-\]
+\label{buch:wahrscheinlichkeit:eqn:dreicksungleichung}
+\end{equation}
 mit Gleichheit genau dann, wenn $u$ und $v$ linear abhängig sind.
-Wenn beide von $0$ verschieden sind, dann gibt es eine positive Zahl
-$t$ mit $u=tv$.
+Wenn beide Vektoren von $0$ verschieden sind, dann gibt es bei Gleichheit
+in~\eqref{buch:wahrscheinlichkeit:eqn:dreicksungleichung}
+eine positive Zahl $t$ mit $u=tv$.
 Wir brauchen eine Verallgemeinerung für eine grössere Zahl von
 Summanden.