aboutsummaryrefslogtreecommitdiffstats
path: root/buch/chapters/80-wahrscheinlichkeit/google.tex
diff options
context:
space:
mode:
Diffstat (limited to 'buch/chapters/80-wahrscheinlichkeit/google.tex')
-rw-r--r--buch/chapters/80-wahrscheinlichkeit/google.tex105
1 files changed, 53 insertions, 52 deletions
diff --git a/buch/chapters/80-wahrscheinlichkeit/google.tex b/buch/chapters/80-wahrscheinlichkeit/google.tex
index 42cd0a1..3616760 100644
--- a/buch/chapters/80-wahrscheinlichkeit/google.tex
+++ b/buch/chapters/80-wahrscheinlichkeit/google.tex
@@ -6,57 +6,6 @@
\section{Google-Matrix
\label{buch:section:google-matrix}}
\rhead{Google-Matrix}
-
-%
-% Ein Modell für Webseitenbesucher
-%
-\subsection{Ein Modell für Webseitenbesucher
-\label{buch:subsection:modell-fuer-webseitenbesucher}}
-\begin{figure}
-\centering
-\begin{tikzpicture}[>=latex,thick]
-\foreach \x in {0,3,6,9}{
- \foreach \y in {0,3}{
- \fill[color=white] ({\x},{\y}) circle[radius=0.3];
- \draw ({\x},{\y}) circle[radius=0.3];
- }
-}
-\node at (0,3) {$1$};
-\node at (0,0) {$2$};
-\node at (3,3) {$3$};
-\node at (3,0) {$4$};
-\node at (6,3) {$5$};
-\node at (6,0) {$6$};
-\node at (9,3) {$7$};
-\node at (9,0) {$8$};
-% 1
-\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (0,3) -- (3,3);
-\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (0,3) -- (0,0);
-% 2
-\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (0,0) to[out=-20,in=-160] (3,0);
-% 3
-\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (3,3) -- (6,3);
-\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (3,3) -- (0,0);
-% 4
-\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (3,0) -- (6,3);
-\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (3,0) -- (6,0);
-\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (3,0) to[out=160,in=20] (0,0);
-% 5
-\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (6,3) -- (9,3);
-\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (6,3) -- (9,0);
-\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (6,3) -- (6,0);
-% 6
-\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (6,0) to[out=20,in=160] (9,0);
-% 7
-\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (9,3) .. controls (7.5,4) .. (6,4) -- (3,4) .. controls (1.5,4) .. (0,3);
-\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (9,3) to[out=-110,in=110] (9,0);
-% 8
-\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (9,0) to[out=-160,in=-20] (6,0);
-\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (9,0) to[out=70,in=-70] (9,3);
-\end{tikzpicture}
-\caption{Modell-Internet als Beispiel für die Link-Matrix und die Google-Matrix.
-\label{buch:figure:modellinternet}}
-\end{figure}
Das Internet besteht aus einer grossen Zahl von Websites, etwa 400~Millionen
aktiven Websites, jede besteht aus vielen einzelnen Seiten.
Es ist daher angemessen von $N\approx 10^9$ verschiedenen Seiten auszugehen.
@@ -84,6 +33,58 @@ bedeutet aber auch, dass nach Synonymen oder alternative Formen eines
Wortes separat gesucht werden muss, was die Übersichtlichkeit wieder
zerstört.
+%
+% Ein Modell für Webseitenbesucher
+%
+\subsection{Ein Modell für Webseitenbesucher
+\label{buch:subsection:modell-fuer-webseitenbesucher}}
+\begin{figure}
+\centering
+\includegraphics{chapters/80-wahrscheinlichkeit/images/internet.pdf}
+%\begin{tikzpicture}[>=latex,thick]
+%\foreach \x in {0,3,6,9}{
+% \foreach \y in {0,3}{
+% \fill[color=white] ({\x},{\y}) circle[radius=0.3];
+% \draw ({\x},{\y}) circle[radius=0.3];
+% }
+%}
+%\node at (0,3) {$1$};
+%\node at (0,0) {$2$};
+%\node at (3,3) {$3$};
+%\node at (3,0) {$4$};
+%\node at (6,3) {$5$};
+%\node at (6,0) {$6$};
+%\node at (9,3) {$7$};
+%\node at (9,0) {$8$};
+%% 1
+%\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (0,3) -- (3,3);
+%\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (0,3) -- (0,0);
+%% 2
+%\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (0,0) to[out=-20,in=-160] (3,0);
+%% 3
+%\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (3,3) -- (6,3);
+%\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (3,3) -- (0,0);
+%% 4
+%\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (3,0) -- (6,3);
+%\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (3,0) -- (6,0);
+%\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (3,0) to[out=160,in=20] (0,0);
+%% 5
+%\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (6,3) -- (9,3);
+%\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (6,3) -- (9,0);
+%\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (6,3) -- (6,0);
+%% 6
+%\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (6,0) to[out=20,in=160] (9,0);
+%% 7
+%\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (9,3) .. controls (7.5,4) .. (6,4) -- (3,4) .. controls (1.5,4) .. (0,3);
+%\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (9,3) to[out=-110,in=110] (9,0);
+%% 8
+%\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (9,0) to[out=-160,in=-20] (6,0);
+%\draw[->,shorten >= 0.3cm, shorten <= 0.3cm] (9,0) to[out=70,in=-70] (9,3);
+%\end{tikzpicture}
+\caption{Modell-Internet als Beispiel für die Link-Matrix und die Google-Matrix.
+\label{buch:figure:modellinternet}}
+\end{figure}
+
Das kombinierte Vorkommen von Wörtern oder Begriffen alleine kann also
nicht ausreichen, um die Seiten zum Beispiel einem Fachgebiet zuzuordnen.
Dazu muss eine externe Informationsquelle angezapft werden.
@@ -389,7 +390,7 @@ Im Fall $q=\frac1NU$ kann dies zu
\[
A
=
-\frac1N uU^t
+\frac1N UU^t
=
\frac1N
\begin{pmatrix}