Gewichteter Verzweigungsprozess

Transcription

Gewichteter Verzweigungsprozess
1
Verzweigende Stochastische Prozesse
Die Grundidee ist ein genealogischer Baum von Individuen mit einem Urahnen.
Jedes Individuum erhält einen Namen und Eigenschaften, die von der Mutter
mit einem zusätzlichen Zufallseffekt vererbt wurden usw. Der Zufallseffekt
ist unabhängig von Familie zu Familie, ist innerhalb der Familie in der
Regel jedoch korreliert. Wir erhalten einen Stammbaum von Individuen mit
individuellen Kenngrößen wie Lebensdauer, DNS, Intelligenz, Reichtum, Größe
des Individuums. Die mathematische Untersuchung solcher Modelle führt
zu Wahrscheinlichkeitstheorie auf Bäumen mit einer Dynamik, die wie bei
Markoffketten oder dynamischen Systemen fortschreitend von der Wurzel
des Baumes aufsteigend von Knoten zu Knoten führt.
Wir führen den gewichteten Verzweigungsprozess (=GVP) ein. Grob gesprochen bestehen diese aus dem Baum V aller endlichen Folgen natürlicher
Zahlen, einem Zustandsraum S und Transformationen T auf dem Zustandsraum
in sich auf allen Kanten des Baums. Der Zustand eines Individuums ergibt
sich aus dem Zustand der Urmutter und den Transformationen. Eventuell ist
der Zustand selbst nicht direkt beobachtbar, sondern nur eine Funktion U
davon mit Werten in einem Realraum R.
1.0.1
Alphabete und Worte:
n
Sei A eine nichtleere Menge und A∗ = ∞
n=0 A die Menge aller endlichen
0
Tupel über der Menge A. Das Symbol A bezeichnet per Definition die
Menge der leeren Menge {∅}. Die Menge A heißt Alphabet, ein Element
davon Buchstabe und eine endliche Folge von Buchstaben Wort.
Wir stellen die Wortmenge A∗ dar als einen genealogischen Baum, siehe
Bild. Das Bild zeigt den binären Baum für die Grundmenge A = {1, 2}.)
Der Name eines Knotens (vertex=Knoten) v = (v1 , v2 , . . . , vn ) ∈ A∗ wird
gegeben durch den Pfad von der Wurzel ∅ startend bis zum Knoten selbst.
Wir unterdrücken nach Möglichkeit die leere Menge ∅ im Pfadnamen und
Knotennamen.
S
1
³
³³
³³
)³
1 u³
¡@
@
¡
Ru12
@
ª
u
11 ¡
¢A
¢A
¢ A
¢ A
u
u
¢®
Uu
A
¢®
AUu
u∅
³³ PPP
PP
PP
PP
qu2
¡@
@
¡
Ru22
@
ª
21 u¡
¢A
¢A
¢ A
¢ A
u
¢®
AUu212 u
AUu
¢®
Zur schnelleren Schreibweise notieren wir einen Knoten v = (v1 , v2 , . . . , vn ) ∈
A (außer der Wurzel ∅) als v = v1 v2 . . . vn . (Dies ist formal ein kleiner
Notationsmißbrauch.) Der Namen eines Knoten v korrespondiert eineindeutig
mit dem direkten Pfad von der Wurzel ∅ bis zum Knoten v. Dieser Pfad
startet in der Wurzel, besucht dann v1 , von dort v1 v2 , dann v1 v2 v3 usw.
Die Länge |v| des Pfadnamens bzw. die Generation eines Knotens v =
v1 v2 . . . vn ist die Länge n des Pfades von der Wurzel bis zum Knoten. Hierbei
hat der Pfadname ∅ die Länge 0. Das Bild zeigt alle Knoten bis einschließlich
der dritten Generation.
Für m ≤ |v| benutzen wir die Einschränkung v|m = v1 . . . vm . Sei w =
w1 . . . wm ∈ V ein weiterer Knoten, so benutzen wir
∗
vw = v1 . . . vn w1 . . . wm .
Die Verzweigungsstruktur führt auf die genealogische Ordnung ¹g auf
A∗ , definiert durch
v ¹g w ⇔ |v| ≤ |w| and w||v| = v.
(1)
Dies ist eine partielle Ordnung. Wir schreiben v ≺g w genau dann wenn
v ¹g w und v ungleich w gilt. Wir sprechen auch von v ist ein Vorfahre oder
Ahne von w im Fall v ¹g w und von einem von einem echten Vorfahren oder
Ahnen. Ganz allgemein nutzen wir den genealogischen Sprachgebrauch, da er
sehr intuitiv und treffend ist. Einen Knoten, abhängig vom Kontext, nennen
wir Individuum, Teilchen oder Mutter. vi ist ein Kind oder Nachkommen
von v und v ist die Mutter von vi. vw ist ein Nachkomme von v and v ist ein
Vorfahre von vw. Die gegebene Ordnung v ¹ w entspricht der natürlichen
Abstammung der Biologie.
Sei jetzt A mit einer Totalordnung (partielle Ordnung und für alle a, b ∈ A
gilt a ¹ b oder b ¹ a. Die Totalordnung auf dem Alphabet impliziert die
2
lexikografische Ordnung auf dem Folgenraum A∗ . Hierbei gilt v kleiner
gleich w in lexikografischer Ordnung, v ¹l w, falls v ein Anfangsstück von w
ist oder vi < wi gilt für das kleinste i, für welche vi und wi sich unterscheiden.
v ¹l w ⇔ v ¹l w oder vτ < wτ für τ = inf{i ≤ |v|, |w| | vi 6= wi }.
1.0.2
(2)
Bäume als Graphen
Ein Teil der Notation gewichteter Verzweigungsprozesse ist der Graphentheorie entnommen, da Bäume Spezialfälle sind. Daher ein kurzer Ausflug in die
Graphentheorienotation.
Ein Graph (V, E) besteht aus einer nicht leeren Menge V und einer
Teilmenge E von V × V. V heißt Knotenmenge und ein Element v darin
Knoten (=vertex). Ein Element e = (a, b) aus E heißt Kante (edge) mit
Anfangsknoten a und Endknoten b. Ein Pfad in einem Graph ist eine
Folge e1 , . . . , en von Kanten, wobei der Endknoten der Kante ei stets der
Anfangsknoten der folgenden Kante ei+1 ist. Der Anfangsknoten eines Pfades
ist der Anfangsknoten von e1 und der Endknoten der von en . Wir sprechen
auch von einem Pfad von v nach w Ein Pfad heißt Schleife oder Zykel,
falls Anfangsknoten und Endknoten übereinstimmen. Der Knoten w heißt
erreichbar von v, falls es einen Pfad von v nach w gibt. Eine Wurzel eines
Graphen ist ein Knoten v, von dem aus alle andere Knoten erreichbar sind.
Ein Baum in der Graphentheorie ist ein Graph ohne Schleifen. Ein Baum
mit Wurzel heißt auch Wurzelbaum oder gewurzelter Baum. Die Wurzel
ist eindeutig.
Ein gewichteter Graph ist ein Graph mit einer Abbildung K ∈ e 7→ ge ∈ G
von den Kanten in eine Halbgruppe (G, ∗). (Beachte, das Gewicht liegt auf
den Kanten, nicht den Ecken.) Der Wert ge heißt Kantengewicht. Jedem
Pfad p = (e1 , . . . , en ) ordnen wir das Pfadgewicht
gp = ge1 ∗ ge2 ∗ . . . ∗ gen
zu.
In einem gewichtenen Baum mit Wurzel w gibt es eine Bijektion zwischen
Pfaden und Knoten ohne die Wurzel. Dies liefert eine Belegung V \{w} 3 v →
gv ∈ G der Knoten, wobei gv das Pfadgewicht des Pfades von der Wurzel bis
v ist. Die Belegung läßt sich stets auf den ganzen Baum erweitern, indem der
Halbgruppe ein neutrales Element x (∀g ∈ G x ∗ g = g = g ∗ x) zugefügt und
3
gw,w = x gesetzt wird. Ist der Baum in einem Graph eingebettet, so läßt sich
die Baumkantengewichtung zu einer Graphkantengewichtung fortsetzen. Der
Halbguppe fügen wir ein Grab 4 (∀g ∈ G g ∗ 4 = 4 = 4 ∗ g) und belegen
alle noch unbesetzten Kanten e des Graphen werden mit ge = 4.
Nun zur verwendeten Ausprägung. Unsere Wortmenge A∗ versehen mit
den Kanten (a, ai), a ∈ A∗ , i ∈ A ist ein Graph und ein Wurzelbaum mit
der Wurzel ∅. In Anbetracht der Graphentheorienotation benutzen wir das
Symbol V für die Knotenmenge (Vertexmenge). Der Knotenname v = (v1 , v2 . . . , vn )
entspricht dem Pfad von der Wurzel ∅ über die Knoten (∅, v1 ), (∅, v1 , v2 ) usw.
bis hin zum Knoten v. (Aus schreibtechnischen Gründen unterdrücken wir
die Wurzel wenn möglich.) Die Länge n = |v| des Knotennamens entspricht
der Anzahl der besuchten Knoten des zugehörigen Pfades (ohne die Wurzel).
Die n-te Generation Vn eines Baumes besteht aus allen Knoten der Länge
(=Namenslänge, Pfadlänge) n. Sinngemäß bezeichnet V≤n die Knoten bis zur
n-ten Generation und vV den Teilbaum zur Wurzel v.
1.0.3
Das Grab
Durch Einführung eines Grabes ersparen wir uns Fallunterscheidungen verschiedener Bäume und erreichen eine effizientere Notation.
Wir betrachten (fast ausschließlich) Bäume mit unendlich vielen VerzweiS
n
gungen und arbeiten stets auf dem Baum V = ∞
n=0 IN aller endlichen Tupel
zum Alphabet der natürlichen Zahlen IN = {1, 2, 3, . . .}. Binäre Bäume
(das Alphabet ist zweielementig) oder m-verzweigende Bäume (das Alphabet
hat m Elemente) mit endlich viele Ästen usw. sind alles Teilbäume von V
mit Wurzel ∅. Ein Teilbaum bzw. Baum mit Wurzel ∅ wird charakterisiert als
eine Teilmenge B ⊂ V , sodaß jeder Vorfahre eines Individuums in B wieder
in B liegt. (Äquivalent ist B ⊂ V versehen mit den Kanten (B × B) ∩ E ist
ein Wurzelbaum mit Wurzel ∅.)
Formal können wir Teilmengen B der Knotenmenge eindeutig durch eine
Funktion ϕ : V 7→ {0, 1} via ϕ−1 (1) = B beschreiben. Die Antitonie in
genealogischer Ordnung (v ¹g w ⇒ ϕ(v) ¹g ϕ(w)) der Abbildung ϕ ist
äquivalent zur Baumeigenschaft von B mit Wurzel ∅. Wir sprechen dann von
einem beobachtbaren (=lebenden) Individuum v im Falle ϕ(v) = 1 und von
einem nicht beobachtbaren (=toten) im Falle ϕ(v) = 0. Die beobachtbaren
Individuen bilden den Teilbaum B, analog zum genealogischen Stammbaum.
Allgemein, wenn immer wir eine Funktion f von einem Teilbaum B von V
4
in irgendeine Menge S haben, erweitern wir diese Menge S um ein weiteres
Element 4, genannt das Grab, und die Funktion f zur Abbildung von V
nach S ∪ {4}, indem wir jedem Element aus V \B das Grab zuordnen. Im
obigen Fall besteht S aus der 1 und das Grab ist die 0.
Ab jetzt betrachten wir nur den Baum V = IN ∗ der endlichen Folgen
natürlicher Zahlen mit der Pfadindizierung startend in der Wurzel ∅.
1.1
Gewichteter Verzweigungsprozess
Wir führen den gewichteten Verzweigungsprozess (GVP) ein und geben
einige Beispiele.
Generell sei (Ω, A, P ) ein nicht näher bezeichneter Wahrscheinlichkeitsraum.
Wir setzen stets voraus, daß dieser reichhaltig genug ist für alle Konstruktionen
und Zufallsgrößen. Wir unterdrücken, wenn möglich, in allen Zgn die Realisierung ω.
Ein gewichteter Verzweigungsprozess (GVP) besteht aus einem Tupel
(V, W, (G, ∗)). Hierbei ist V der Baum der endlichen Folgen natürlicher Zahlen
einschlies̈lich der leeren Folge ∅. Der Gewichtsraum (G, ∗) ist ein mes̈bare
Halbgruppe mit σ-Algebra σ(G) und einem neutralen Element sowie einem
Grab. Zu jeder Kanten (v, vi), v ∈ V, i ∈ IN des Baumes sind Zgn Wv,i : Ω →
G, genannt Kantengewichte, mit Werten in der Halbgruppe G vorgegeben.
Die Zgn ((Wv,vi )i∈IN ), v ∈ V sind unabhängig und identisch verteilt.
Bem: Beachte die verkürzende Schreibweise Wv,i zur Kante (v, vi). Die
Zgn (Wv,i )i , v ∈ V sind unabhängig, aber für festes v sind die Kantengewichte
Wv,i , i ∈ IN beliebig abhängig voneinander. Als Merkregel, verschiedene
Familien sind unabhängig, aber innerhalb einer Familie können beliebige
Abhängigkeiten bestehen.
Not: Wir verwenden g ∗ h oder sogar gh für ∗(g, h). Das Grab heißt stets
4.
Pfadgewichte Definiere rekursiv die Pfadgewichte Wv,w für die Pfade
(v, vw) von v nach vw durch
Wv,vwi = Wv,w ∗ Wvw,i .
(3)
Not: Wir verwenden Ww (v) =: W (v, w) und Ww = Ww (∅). Aus schreibtechnischen Gründen verwenden wir standardmäßig Wv,v als das neutrale
Element in der Halbgruppe.
5
Die Gleichung (3) schreibt sich allgemeiner als
Wv,wx = Wv,w ∗ Wvw,x
Wwx (v) = Ww (v) ∗ Wx (vw)
Wwx = Ww ∗ Wx (w)
und expliziter v = v1 . . . vn
Wv = Wv1 Wv2 (v1 )Wv3 (v1 v2 ) . . . Wvn−1 (v|n−1 )Wvn (v)
(4)
Die Pfadgewichte Ww (v) lassen sich interpretieren als Pfadgewicht für den
Baum vV zum relativen Pfad w. Das Pfadgewicht Ww (v) ergibt sich durch
Hintereinanderschaltung von den Kantengewichten entlang dem Pfad vom
Knoten v zum Knoten vw.
Ein gewichteter Verzweigungsprozeß mit Nutzenfunktion (=Kostenfunktion)
U , der Buchstabe U steht für utility, ist ein GVP (V, W, (G, ∗)) mit einer
zusätzlichen Belegung Uv der Knoten durch eine Zg mit Werten in R. Hierbei
operiert (G, ∗) transitiv auf R ∗ : G × R → R. Die Zgn ((Wi (v))i , Uv ), v ∈ V
sind unabhängig, identisch verteilt.
Halbgruppen werden gerne via der Komposition von Funktionen dargestellt
und analog für transitive Operationen. Mit dieser Interpretation werden die
realen Werte Uv (Wv )) auf den Knoten v beobachtet. Wir führen dies formal
aus.
Bisher haben wir GVP eher algebraisch betrachtet. Jetzt zur mehr analytischen Sichtweise über Funktionen. Jede Halbgruppe läßt sich darstellen als
ein Funktionenraum F mit der Komposition als Verknüpfung. Die Kantengewichte
Wi (v) entsprechen funktionswertigen Zgn Ti (v) : Ω → S S auf einer Menge S.
Die Menge S heißt Zustandsraum (state space). Die Halbgruppenoperation
∗ entspricht der Komposition von Funktionen
Wi (v) ∗ Wj (vi) = Tj (vi) ◦ Ti (v).
Beachte die Umkehrung der Verknüpfungsordnung. Analog benutzen wir
Tw (v) für Ww (v). Die Nutzenfunktion C als Abbildung C : S S → R erfüllt
W ∗ U = C(W ).
Bei der Schreibweise mit Funktionen ergeben sich Schwierigkeiten mit der
Indizierung W (v) für das Pfadgewicht. Um diesen vorzubeugen, verwenden
wir teilweise Lv , der Buchstabe L für layer, um noch eine eventuelle Auswertung
der Funktion an der Stelle s ∈ S gut betrachten zu können. Oder wir
benutzen die Kantennotation geeignet.
6
Mit der Notation T (v) = (Ti (v))i∈IN lautet die Unabhängigkeitsbedingung
(T (v), Uv ), v ∈ V sind uiv Zgn.
Die wesentlichen interessanten Beispiele für gewichtete Verzwigungsprozesse
mit zufälligen Gewichten werden wir gleich vorstellen. Es gibt aber durchaus
interessante und nichttriviale Beispiele mit deterministischen Gewichten. Als
Beispiel wählen wir die Cantormenge mit dem Cantormaß. (Stellvertretend
für eine ganze Klasse von Beispielen mit dieser Struktur, Kochkurve, Schneeflocke,
usw..)
Bsp: Cantormenge:
Aus dem abgeschlossenen Einheitsintervall entferne das offene mittlere
Drittel. Im nächsten Schritt entferne aus jedem verbleibenden Intervall das
offene mittlere Drittel und fahre rekursiv fort. Die übriggebliebenen Punkte
ist die Cantormenge.
Cantormenge:
0r
r1/3
p
p
p p p p
pppp pppp
p
p
p p p p
pppp pppp
r2/3
p
p
p p p p
pppp pppp
Cantorset Cantorset Can
r1
p
p
p p p p
pppp pppp
Cantorset Cantorset Can
Die formale Definition der Cantormenge C lautet:
3n −1
2
Cn :=
[ 2m 2m + 1
[
m=0
C :=
\
n
Cn = {x =
3n
,
3n
∞
X
xi
i=1
3i
].
| xi ∈ {0, 2}}.
Die Cantormenge hat interessante Eigenschaften:
• Die Cantor Menge ist überabzählbar, abgeschlossen, kompakt, nirgends
dicht (=das Innere vom Abschluß ist leer) und perfekt (=jeder Punkt ist
Häufungspunkt). (Übung)
• Die Cantor Menge ist Borel meßbar und das Lebesgue Maß der Cantor
Menge ist 0. (Übung)
7
• Die Cantormenge ist die größte kompakte invariante Menge bzgl. der
Funktion f : IR 7→ IR, f (x) = 11x≤1/2 3x + 11x>1/2 (1 − 3x). (Eine Menge
A heißt invariant unter f, falls f −1 (A) = A gilt.) (Übung: Benutze die
Trialdarstellung einer reellen Zahl.)
Jetzt zur Beschreibung als gewichtetem Wurzelbaum. Die verzweigende
Struktur wird durch das Aufspalten eines Intervalls in zwei Teile gegeben.
Die Knotennamensgebung startet mit der Wurzel ∅ für das Einheitsintervall.
Nach Entnahme des mittleren Drittels erhält das linke verbleibende Intervall
[0, 1/3] den Namen 1 und das rechte verbleibende Intervall [2/3, 1] den Namen
2. Fahre so fort, indem bei Aufspaltung eines Intervalls mit Namen v das linke
den Namen v1 erhält und das rechte den Namen v2. Wir erhalten den binären
Baum A∗ zum Alphabet A = /1, 2/.
Sind wir nur an der Länge der jeweiligen Intervalle interessiert, bietet sich
eine Modellierung an als ein GVP mit W1 = 1/3 = W2 , W3 = 0 = W4 =
. . . auf den positiven reellen Zahlen G mit der Multiplikation. Das Grab
P
entspricht dem Wert 0 und das neutrale Element der 1. Sei Zn = |v|=n Wv
die Gesamtlängen der Intervalle in n-ter Generation, bzw. das Lebesguemaß
n
von Cn . Eine leichte Überlegung liefert 32 Zn = Zn−1 und damit Zn = 32n →n 0.
Damit erhalten wir Zn →n 0 und das Lebesguemaß λ(C) der Cantormenge
ist ebenfalls 0,
λ(C) = n→∞
lim λ(Cn ) = lim
Zn = 0.
n
Jetzt eine etwas ausfürlichere dynamischere Modellierung als Prozess auf
Intervallen. Sei S die Menge der abgeschlossenen Intervalle in den positiven
reellen Zahlen einschlies̈lich des leeren Intervalls {∅}. Die Kantengewichte
beschreiben wir durch Transformationen der Intervalle auf sich wia
T
[a, b] 7→1 [a, a +
b−a
]
3
T
[a, b] 7→2 [b −
b−a
, b]
3
und T3 = {∅} = T4 = . . . . Die Cantormenge ist der Grenzwert der fallenden
Folge der Mengen ∪|v|=n Lv ([0, 1]).
Auf den Knoten sei die deterministische Kostenfunktion gegeben, die
jedem Intervall I seine Länge |I| zuordnet. Wir erhalten als Gesamtmasse
P
in n-ter Generation Zn = |v|=n |Lv (I)| bei Start in dem Intervall I. Eine
n
leichte Rechnung ergibt Zn = 32n λ(I) mit λ(I) die Länge des Startintervalls.
Benutzen wir die Nutzenfunktion, welches jedem Intervall I die Länge des
Intervalls zur Potenz α zuordnet. Sei α0 derjenige (eindeutige) Wert mit
8
( 23 )α0 = 1. Dann konvergiert Zn(α) := |v|=n |Lv (I)|α mit n → ∞ gegen 0 für
α < α0 , ist konstant für α = α0 und konvergiert gegen unendlich für α > α0 .
(In 4.1 zeigen wir α0 ist die Hausdorffdimension der Cantormenge.)
Ein weiteres interessantes Objekt ist das Cantormaß bzw. Hausdorffmaß.
Definiere die reellwertige Funktion F für dei Kostenfunktion J 7→ λ(J)α0
P
F (x) := n→∞
lim
X
Cv (Lv ).
|v|=n, Lv <x
Hierbei benutzen wir J < x in der Bedeutung, jeder Punkt des Intervalls
J ist strikt kleiner als x. Dann ist F eine stetige Verteilungsfunktion und
differenzierbar auf dem Komplement der Cantormenge mit Ableitung 0. (Aber
nirgendwo auf der Cantormenge. Auf der Cantormenge selbst wäre die Ableitung ∞.) Das Cantormaß ist das Maß gehörend zur Verteilungsfunktion F.
1.2
Beispiele
Wir kommen jetzt zu einer Reihe von Beispielen mit stochastischer Komponente. Die extremen Beispiele sind diejenigen, wo eine der beiden Hauptstrukturen,
die Gewichtung oder die Baumstruktur, ausarten. Falls die Gewichtung nur
einen Wert annehmen kann, neben dem Grab, so behalten wir nur die Baumstruktur. Dies sind die Galton-Watson Prozesse (eventuell mit abzählbar
vielen Nachkommen.) Falls die Baumstruktur degeneriert zu einer Linie,
die dann isomorph zu den natürlichen Zahlen ist, erhalten wir im zufällige
iterierte Funktionensysteme, im reellen Produkte von uiv Zgn. Diese Beispiele
sind eher als einfach oder grundlegend anzusehen, da nur eine Struktur
vorhanden ist. Das Vorliegen beider Strukturen verkompliziert die Lage, da
beide Strukturen einen gegenteiligen Effekt auslösen können (und in der
Regel tun) und es substanzieller Argumente und Abschätzungen bedarf,
welcher Effekt sich durchsetzt.
Bsp: Galton-Watson Prozesse:
Der Galton-Watson Prozess [2] [3] wird beschrieben durch eine Folge von
uiv Zgn Xn,m , m, n ∈ IN mit Werten in den natürlichen Zahlen einschließlich
der 0. Betrachtet wird der Prozess (Zn )n∈IN0 mit Werten in den natürlichen
Zahlen einschließlich der Null, Z0 = 1,
Zn+1 :=
Zn
X
m=1
9
Xn,m .
Dabei hat Xn,m die Interpretation als die Anzahl der Nachkommen des mten Individuums in der n-ten Generation. Zn gibt die Anzahl der (lebenden)
Individuen in n-ter Generation an.
Der Galton-Watson Prozess entspricht einem gewichteten Verzweigungsprozess
zu der multiplikativen Gruppe {1} erweitert um das Grab 4 = 0. Die
Halbgruppe ist G = {0, 1} mit der Multiplikation als Operation ∗.
Die Kantengewichte und Pfadgewichte nehmen nur die Werte 0 oder 1
an. Das Pfadgewicht 1 eines Pfades in der Wurzel startend mit Endknoten
v interpretieren wir als einen lebenden (beobachtbaren) Knoten v und das
Pfadgewicht 0 als nicht beobachtbar (nicht existent, nicht wahrnehmbar, tot,
nicht lebend, nicht realisiert usw. ). Wir erhalten als typische Realisierungen
genealogische Bäume wie etwa folgendes Bild:
³
³³
³³
u³
)
1³
´Q
Q
´
Q
´
Q
su13
Q
u´
u12
?
11 +́
¢A
¢A
¢ A
¢ A
u
u
?A
?
?AUu
¢
® u
Uu
¢u
® u
u∅
³³ PPP
PP
PP
PP
qu3
¡@
¡
@
u
ª
Ru32
@
31 ¡
¢A
¢A
¢ A
¢ A
¢u
®
AUu312 u
AUu
¢®
u2
?
Hierbei wurden nur die beobachtbaren Individuen eingezeichnet.
P
Die Anzahl der Nachkommen eines Individuums v ist X(v) = i Wi (v)
und die Anzahl aller lebenden Individuen in n-ter Generation ist
Zn =
X
Wv .
|v|=n
Die Verteilung von X ist die gleiche wie von Xn,m des GWP und die Zn
sind identisch. Nur die Benennung der Individuen ist veschieden, in unserer
Baumstruktur durch den Namen v induziert durch dne Pfad, im GaltonWatson Prozess als m-tes lebendes Individuum in der n-ten Generation.
Üblicherweise hat ein Galton-Watson Prozess per Definition nur endlich
viele Nachkommen. Eine typische Fragestellungen für den Galton-Watson
Prozess, dies ist auch historisch der entscheidende Anlaß zur Betrachtung
von Galton-Watson Prozessen gewesen, war die Aussterbewahrscheinlichkeit
10
q = limn→∞ P (Zn = 0) eines (adligen) Namens. In dem Modell von GaltonWatson hierzu spielte die Namensgebung der Individuen keine Rolle.
P
Mit geeigneter Normierung 0 < m := E i Wi < ∞ konvergiert
Zn
→n M
mn
als positives Martingal fast sicher gegen einen Grenzwert genannt M . Die
Verteilung der Grenzverteilung von M erfüllt eine stochastische Fixpunktgleichung
D
M=
X Wi
i
m
Mi .
(5)
Hierbei sind (W1 , W2 , . . .), Mi , i ∈ IN unabhängig und Mi hat dieselbe Verteilung
wie M. Hierdurch läßt sich die Verteilung von M charakterisieren. Wir werden
in den folgenden Sektionen dies genauer untersuchen.
Bsp: Iteriertes Funktionensystem:
Ein zufälliges iteriertes Funktionensystem ist die Komposition
Yn := Xn ◦ Xn−1 ◦ . . . X1
n ∈ IN von uiv Zgn Xi , i ∈ IN. Hierbei haben die X-Zgn Werte in einer
Menge von Funktionen von einer Menge S auf sich selbst.
Zufällige iterierte Funktionensysteme sind extreme Spezialfälle gewichteter
Verzweigungsprozesse mit dem Baum der lebenden Individuen ausgeartet zu
einer Linie isomorph zu IN0 . Es bietet sich die Beschreibung eines GVP via
Funktionen an. Die Funktionen mit der Komposition bilden die Halbgruppe.
Das neutrale Element ist die Identität und das Grab ist die Funktion identisch
4, wobei, ebenfalls Grab genannt, 4 dem Zustandsraum zugefügt wird (und
entsprechend der Definitionsbereich aller Funktionen erweitert wird). Die
Kantengewichte sind
W1 (v) = X|v|
falls v nur aus lauter Einsen besteht und ansonsten setze Wi (v) die Grabfunktion.
Die lebenden Individuen bei Start in s ∈ S entsprechen denjeningen Knoten,
deren Wert Lv (s) nicht das Grab ist. Dies können nur Knoten sein mit einem
Namen nur aus Einsen bestehend.
Ein eher einfaches Beispiel dieser Struktur wäre S die positiven reellen
Zahlen und die Funktionen fy , y ∈ IR+ als Multiplikation x 7→ fy (x) = xy.
11
Mit der Identifizierung fy ↔ y von Funktionen mit reellen Zahlen entspricht
die Halbgruppe (G, ∗) den positiven reellen Zahlen mit der Multiplikation.
P
Das Gesamtgewicht Zn = |v|=n Lv (s) der n-ten Generation für den Anfangswert
s ist Yn (s) = Xn Xn−1 . . . X1 s, wobei wir Xi als Zg mit Werten in den positiven
reellen Zahlen genommen haben. Der Logarithmus des Produkts Yn ist eine
Summe von uiv Zgn und darüber ist viel bekannt.
Hier ein etwas anspruchvolleres Beipiel im IR2 . Die Multiplikation wird
nun durch Matrizen ersetzt und ist im allgemeinen nicht mehr vertauschbar.
Bsp: Iterierte affin lineare Abbildungen:
Sei H ein separabler Hilbertraum, endlich dimensional oder nicht [6]. Die
Werte der zufälligen Funktion Xn seien affin lineare Abbildungen auf dem
Hilbertraum H,
H 3 x 7→ Xn (x) = An x + bn .
Hierbei sind (An , bn ) uiv Zgn mit An ist eine (zufällige) lineare Abbildung
und bn ein (zufälliges) Element des Hilbertraumes.
Damit erhalten wir Yn als
Yn = bn + An bn−1 + An An−1 bn−2 + . . . An An−1 . . . A1 b0 + An An−1 . . . A1 A0
= An Yn−1 + bn .
Betrachte den gewichteten Verzweigungsprozess (in der algebraischen Beschreibung)
mit der Halbgruppe der linearen Abbildungen, beschrieben durch Matrizen,
auf dem Hilbertraum H bereichert um das Grab 4. Die Kantengewichte
sind gegeben durch W1 (v) = A|v| falls v nur aus Einsen besteht und Wi (v) ist
ansonsten die konstante Abbildung auf 4. Die Nutzenfunktion Uv : Ω →
R, mit R die Menge der Funktionen von Matrizen in Hilbertraumwerte,
identifizieren wir mit einer Abbildung Ũv : Ω → H durch M 7→ Uv (M ) =
M Ũv durch Auswertung der Matrix M and der Stelle Uv . Setze Ũv = b|v| für
v nur aus Einsen bestehend und ansonsten das Grab. Dann hat Rn
Rn :=
X
Uv (Lv )
|v|<n
dieselbe Verteilung wie Yn bei Start in Y0 ≡ 0. Dies ersieht man aus der
Rückwärtsgleichung
D
Rn = ARn−1 (1) + b
mit Rm (i) der Rm -Term für den Baum mit der Wurzel i. Hierbei sind (A, b), R·
unabhängig und (A, b) verteilt wie oben.
12
Konvergiert Rn in Verteilung gegen ein R [6], so erfüllt die Grenzverteilung
R die stochastische Fixpunktgleichung
D
R = AR + b.
Beispiele hierzu sind die Cantormenge, die Schneeflocke, das Sierpinski
Dreieck, der Farn, . . . .
Bsp: Cantormenge In einer Dimension d = 1 wähle A als eine Konstante
in (0, 1/2] und für die Kosten C nehmen den Wert 0 oder 1 − A mit Wahrsch.
1/2 an. Der stochastische Fixpunkt R hat das Cantormaß als Verteilung im
Fall A = 1/3 und das Lebesguemaß im Fall A = 1/2. Diese Konstruktion
läs̈t sich offensichtlich auch zufällig machen.
Cantor Menge
Bsp: Sierpinski Dreieck In Dimension d = 2 sei
A :=
Ã
1/2
0
0
1/2
!
und Ũ nimmt die Werte (0, 0), (1/4, 1/2), (1/2, 0) jeweils mit Wahrsch. 1/3
an.
13
Sierpinski Dreieck
Bsp: Kochkurve
Wie entsteht die Kochkurve? Folgendes Bild erläutert dies:
Kochkurve
Bsp: Farn Die wesentlichen Daten für den Farn sind: In zwei Dimensionen
d = 2 wähle (A, b) als
ÃÃ
ÃÃ
.02
0
−.139
.246
0
.27
! Ã
.263
.224
14
,
150
0
! Ã
,
!!
171
−10.8
,
!!
,
ÃÃ
.16
.222
ÃÃ
.781
−.032
−.215
.176
! Ã
,
122.4
26.79
!!
,
.034
.739
! Ã
32.25
81
!!
,
,
jeweils mit Wahrsch. 0, 01; 0, 15; 0, 13; 0, 71.
Definiere die Folge Xn von Zgn auf IRd rekursiv zu dem Anfangswert X0
durch
Xn+1 = An Xn + bn
mit (An , bn ), n ∈ IN0 unabhängige Zgn verteilt nach (A, b). Diese Folge für
eine feste Realisierung ω aufgezeichnet, zeigt, bis auf die Anfangspunkte,
fast sicher einen Farn. Die Zg Xn nähert sich nach einer Einschwingphase
dem Farn und springt dort hin und her. Der Träger der Verteilung des
stochastischen Fixpunktes der stochastischen Fipunktgleichung
D
R = AR + b
ist der gezeichnete Farn.
Farn
1.3
GVP mit beiden Strukturen
Bsp: Verzweigende Irrfahrt:
Das vielleicht einfachste Beispiel eines nicht ausgearteten GVP ist die
verzweigende Irrfahrt (Branching Random Walk) [5]. Ein Individuum
startet in 0 und erzeugt pro Zeiteinheit endlich viele Nachkommen. Diese
15
werden zufällig verschoben vom Aufenthaltsort der Mutter nach einer festen
Verteilung platziert. Danach verhalten sich sich alle Individuen unabhängig
voneinander und folgen demselben Teilungs- und Verschiebungsschema.
Die Halbgruppe sind die reellen Zahlen mit der Addition erweitert um
das Grab −∞. Die Verschiebung des i-ten Kindes der Mutter v entsprecht
dem Kantengewicht Wi (v). Die Position des Individuums v ist die Summe
der Einzelverschiebungen des Pfades von der Wurzel ∅ bis nach v.
Von Interesse sind z.B. die exponentiell gewichteten Gesamtverschiebungen
X
Zn :=
eWv
v∈Vn
in nter Generation oder das größte Gewicht in n-ter Generation
sup Wv .
v∈Vn
Die Größe
Zn
mn
P Wi
mit 0 < m = E i e < ∞ ist ein positives Martingal und konvergiert fast
sicher gegen einen Grenzwert. Dieser erfüllt wie oben die Fixpunktgleichung
5.
Die additive Grupps der reellen Zahlen ist isomorph zur multiplikativen
Gruppe der strikt positiven Zahlen. Der Isomorphismus ist die Exponentialfunktion.
Der Isomorphismus dehnt sich auf die Gräber aus, das additive Grab −∞
wird auf das multiplikative Grab 0 abgebildet. Daher sind die additive und
die multiplikative Darstellung äquivalent. Beide Beschreibungen desselben
Modells haben ihre Vor- und Nachteile. Für stochastische Fixpunktgleichungen
auf den reellen Zahlen ist die multiplikative Version vorzuziehen.
BSP: Gewichteter Verzweigungsprozess auf den reellen Zahlen:
Betrachte die multiplikative Gruppe der reellen Zahlen ohne die Null. Die
Gruppe ist isomorph zu der multiplikativen Gruppe IR> × {+1, −1} mit zwei
Zusammenhangskomponenten, den strikt positiven und den strikt negativen
Zahlen. Als Grab fügen wir die 0 hinzu. Die Halbgruppe G sind die reellen
Zahlen mit der Multiplikation.
Von Interesse sind auch hier z.B. das Gesamtgewicht
Zn :=
X
v∈Vn
16
Wv
oder das größte Gewicht
sup Wv
v∈Vn
in n-ter Generation.
Weitere Anwendungen ergeben sich durch Verwendung der Nutzenfunktion
und von Knotengewichten Uv . Wir verwenden Uv Ω → G und lassen Uv auf
G agieren via g 7→ g ∗ Uv . (Das Halbguppenelement wird mit einer Funktion
identifiziert.) Von Interesse sind z.B. die Zgn
Rn :=
X
v∈V<n
Wv ∗ Uv ,
die die Pfadgewichte multipliziert mit den Kosten aller Individuen bis zur nten Generation aufsummiert. Unter geeigneten Voraussetzungen konvergiert
Rn (eventuell nach Normierung) gegen eine Zg Q, die die stochastische Fixpunktgleichung
D
Q=
X
Wi Qi + U
i∈IN
erfüllt. Hierbei sind die Zgn (U, W1 , W2 , . . .), Qi , i ∈ IN unabhängig, Qi verteilt
wie Q und (U, W1 , W2 , . . .) verteilt wie (U∅ , (Wi )i ) des GVP. (Die obige Fixpunktgleichung
gilt auch fast sicher, falls Rn gegen Q fast sicher konvergiert und Rn (i), analog
Rn für den Baum iV, gegen Qi fast sicher konvergiert. Dabei ist U = U∅ .)
Die Zgn Q hat Anwendungen in der Analyse von Algorithmen, [24][25],
und allgemein für stochastische Fixpunktgleichungen. Ein prominentes Beispiel
hierzu ist die Quicksortverteilung [23] als einzige Lösung mit endlichem Erwartungswert
folgender stochastischen Fixpunktgleichung:
D
Q = XQ + (1 − X)Q + f (X).
Hierbei sind X, Q, Q unabhängige Zgn mit X hat eine gleichmäßige Verteilung
auf (0, 1) und Q dieselbe Verteilung wie Q. Die Funktion f : (0, 1) → IR ist
gegeben durch
f (x) = 2x ln x + 2(1 − x) ln(1 − x) + 1.
In der Notation gewichteter Verzweigungsprozesse wäre W1 = X, W2 =
1 − X, W3 = 0 = W4 = . . . , U = g(X).
17
In den bisherigen Beispielen haben wir als Halbgruppe eine mulltiplikative
Gruppe in den reellen Zahlen erweitert um das Grab genommen. Die kleinste
mögliche multiplikative Gruppe {1} fḧrte auf den Galton-Watson Prozess,
die multiplikative Gruppe IR> = (0, ∞) and die verzweigende Irrfahrt und
die multiplikative Produktgruppe (−∞, 0) ∪ (0, ∞) auf Anwendungen zur
Laufzeitanalyse von Algorithmen. Hier noch eine Algorithmenbeispiel mit
Prozesswertigen Zgn.
Bsp: Find oder Quickselect:
Wir beschreiben zuerst den Findprozess [8], wie er als Grenzwert des
Findsuchalgorithmus, (Algorithm 65, FIND oder QUICKSELECT und Algorithm
63, PARTITION, [11],) Anzahl der Vergleiche um die l-kleinste Zahl unter n
(verschiedenen) vorgegebenen zu finden, auftaucht.
Die Halbgruppe besteht aus halboffenen Intervallen [a, b) aus dem Einheitsintervall
mit der Verknüpfung
[a, b) ∗ [c, d) = [a + c(b − a), a + d(b − a)).
Das Grab wird gespielt von dem leeren Intervall und das neutrale Element
durch das halboffene Einheitsintervall I = [0, 1).
Seien Xv , v ∈ V unabhängige Zgn gleichverteilt auf dem Einheitsintervall.
Das Kantengewicht Wi (v) hat den Wert [0, Xv ), das Kantengewicht W2 (v) =
[Xv , 1) ist das Komplement von W1 (v) bzgl. dem halboffenen Intervall I und
alle anderen Kantengewichte Wi (v) sind das Grab.
18
6
r
tr
r
r
rr r r
Betrachte für t ∈ [0, 1) die Zgn
Zn (t) =
X
|v|≤n
|Wv |11t∈Wv ,
|J| die Länge eines Intervalls J, mit Werten in den Funktionen auf dem
halboffenen Einheitsintervall. (Per Definition wird W∅ identisch das neutrale
Element gesetzt.) Die Zgn Zn sind punktweise steigend für jedes t ∈ I. Der
Grenzwert Z = limn Zn ist der Findprozess. Er hat Werte im Raum D der
rechtsstetigen Funktionen mit linksseitigem Grenzwert auf dem halboffenen
Einheitsintervall I. Der stochastische Prozess Z ist ein Fixpunkt der Gleichung
(Z(t))t∈I = (11t<X XZ(
t
t−X
) + 11t≥X (1 − X)Z(
) + 1)t∈I .
X
1−X
(6)
Hierbei sind ist X, Z, Z unabhängig, X ist rechteckverteilt auf dem Einheitsintervall
I und Z hat dieselbe Verteilung in D wie Z. Dies charakterisiert Z eindeutig,
[8].
19
Aus der Fixpunktgleichung ersieht man die allgemeinere Struktur via
eines gewichteten Verzweigungsprozesses. Eine Zg Y : Ω × I, mit I jetzt
das abgeschlossenen Einheitsintervall, wird abgebildet auf
X
(Y (t))t 7→ (
Ai (t)Yi (Bi (t)) + C(t))t .
i
Hierbei sind Ai , C : Ω×I → IR, Bi : Ω×I ×I Zgn, mes̈bar bzgl. der Produkt
σ-Algebra. Die Zgn ((Ai , Bi )i , C), Yj , j ∈ N sind unabhängig und die Yj -Zgn
sind verteilt wie Y.
Wenn wir obige Abbildung mehrfach iterieren, erhalten wir, mit offensichtlicher
Notation,
X
i
Ai Yi ◦ Bi + C =
=
X
j
i
XX
i
=
X
Ai (
j
Ai Aij ◦ Bi Yij ◦ Bij ◦ Bi +
XXX
i
+
j
k
XX
i
Aij ◦ Bi Yij ◦ Bij ◦ Bi + Ci ◦ Bi ) + C
j
X
i
Ci ◦ Bi + C
Ai Aij ◦ Bi Aijk ◦ Bij ◦ Bi Yijk ◦ Bijk ◦ Bij ◦ Bi
Ai Aij ◦ Bi Cij ◦ Bij ◦ Bi +
X
i
Ci ◦ Bi + C
I
Die Halbgruppe G bestehe aus den Funktionen R+
× I I mit der Verknüpfung
∗
(A, B) ∗ (A0 , B 0 ) = (A + A0 ◦ B, B 0 ◦ B).
Die Halbgruppe G operiert auf R = D durch
(A, B) ∗ C = A C ◦ B.
Die Kantengewichte und die Nutzenfunktion ((Wi (v))i , Uv ) sind verteilt wie
((Ai , Bi )i , C).
P
Die Zg Rn := |v|≤n Wv ∗ Uv erfüllt die Rekursion
Rn+1 =
X
i
Wi ∗ Rn (i)
mit Rn (i) entsprechend für den Baum mit Wurzel i. Konvergiert jetzt Rn
geeignet [17], z.B. fast sicher gegen eine Zg R, so gilt die Fixpunktgleichung
R=
X
i
Wi ∗ R(i).
20
Für den Findprozess gilt Zn = Rn und Z = R.
Bsp: Verzweigende Markoff Prozesse:
Wir können verzweigende Markoff Prozesse analog zu Markoffprozessen
definieren. Sei (S, σ(S)) ein meßbarer Raum und K : S × σ(S IN ) → IR ein
Übergangskern. Mit Hilfe des Übergangskernes K definieren wir die Verteilung
des Übergang von Lv (s) nach (Lvi (s))i∈IN , s ein Startwert, unabhängig von
allem anderen. Wir erhalten eine Belegung aller Knoten durch die Pfade
analog wie für Markoffketten.
Einfacher ist die folgende Sichtweise: Unter ganz schwachen Voraussetzungen
kann man zu jedem Überganskern K eine mes̈bare(!) Funktion X : Ω →
S ( S IN ) finden mit
Ω 3 ω 7→ X(ω)(s)
hat Verteilung K(s, ·) für alle s ∈ S. Nehme uiv Kopien X(v) v ∈ V und
bilde den GVP mit den Kantengewichten (Wi (v))i = X(v). Dieser tut’s.
Umgekehrt, jedes iterierte Funktionensystem, wie obiges Beispiel Find,
ist auch eine Markoffkette. Die Übergänge sind S 3 f 7→ A · f ◦ B + C für
Funktionen f auf dem Einheitsintervall in sich.
2
Der vorwärtige und rückwärtige Blick
Zusätzlich habe S eine Struktur, in der Summe (oder Supremum, Infimum
. . . ) einen Sinn machen. Der Einfachheit halber betrachten wir das Gesamtgewicht
Zn der n-ten Generation und +, ∗ erfüllen die Distributivgesetze. Die Rekursion
für Z lautet ausführlich geschrieben,
Zn+1 =
X
v∈Vn+1
W (∅, v1 ) ∗ W (v1 , v2 ) ∗ . . . ∗ W (v|n−1 , v|n ) ∗ W (v|n , v).
Der Vorwärtsblick betrifft den Übergang von Zn nach Zn+1 , indem wir
von der n-ten Generation übergehen in die n + 1-Generation,
Zn+1 =
X X
(
|v|=n i∈IN
L(v) ∗ W (v, vi).
(7)
Der Rückwärtsblick betrifft ebenfalls den Übergang von Zn nach Zn+1 , nur
benutzen wir jetzt den Übergang von der 0-ten Generation zu der ersten,
Zn+1 =
X
i∈IN
W (∅, i) ∗ Zn (i).
21
(8)
Hierbei bezeichnet Zn (i) das Gesamtgewicht n-ter Generation für den Baum
mit Wurzel i.
Die Bedeutung der Begriffe vorwärts und rückwärts ergibt sich aus der
Anschauung. Für die Vorwärtsgleichung fügen wir jedem Individuum der nten Generation die nächste weitere Generation zu. Für die Rückwärtsgleichung
steht der Prozess mit n-Generationen startend von einem Individuum erster
Generation im Vordergrund. Danach werden diese Prozesse gewichtet mit
Wi (∅) und zusammengefaßt.
Die Vorwärtsgleichung wird uns Resultate für Zgn als Funktion liefern,
wie z.B. Konvergenzsätze via Martingalen. Die Methoden sind wahrscheinlichkeitstheoretischer Natur. Die Rückwärtsgleichung wird uns Verteilungsaussagen
für Zgn liefern, wie die Konvergenz gegen eine Grenzverteilung, die eine
stochastische Fixpunktgleichung erfüllt. Die Methoden sind eher maßtheoretischer
Natur, z.B. Kontraktionsmethoden für Maßräume.
Der Beweis für zufällige Iteration affin linearer Funktionen zeigt das
Zusammen- und Wechselspiel beider Anschauungen, mit dem gute Resultate
erzielt werden. Gleiches gilt für Resultate erzielt durch die Martingalstruktur
(Vorwärtsstruktur) und mit Hilfe der Kontraktionsmethode (Rückwärtsstruktur).
22
3
GVP auf den positiven reellen Zahlen.
Wir betrachten gewichtete Verzweigungsprozesse auf der multiplikativen Halbgruppe der positiven reellen Zahlen einschlies̈lich ∞. Das Grab ist die 0 und
P
konventionell gilt 0 ∗ ∞ = 0. GVP mit keinen Nachkommen i 11Wi =0 = 0
P
und GVP mit genau einem Nachkommen i 11Wi =0 ≡ 1 der nur einen Wert
P
annimmt ( i Wi identisch eine Konstante) sind prinzipiell ausgeschlossen.
Die Galton-Watson Prozesse gehören zur Halbgruppe und Kantengewichtsraum {0, 1}. Wir lassen, abweichend von GWP, unendlich viele Kantengewichte
ausgehend von einem Knoten zu. GVP zum Kantengwichtsraum {0, c}, c > 0
können nach Division durch c der Kantengewichte auf die Halbgruppe {0, 1}
zurückgeführt werden. Damit sind wir im Bereich der GWP. Die nächst
einfache Halbgruppe rIN ∪{0} werden erzeugt von einer strikt positiven reellen
Zahl r ungleich 1 erweitert um das Grab 0. Diese multiplikative Halbgruppe
ist isomorph zu der additiven Halbgruppe IN0 . Die weiteren sind rZZ ∪ {0}
usw.
Das Hauptinteresse dieses Abschnittes liegt auf dem Gesamtgewicht
Zn =
X
Wv
i∈IN
in n-ter Generation. Eine wesentliche Rolle werden die Vorwärts- und Rückwärtsgleichung spielen.
3.0.1
Die Vorwärts- und Rückwärtsgleichung
Der Z Prozess erfüllt die Vorwärtsgleichung
Zn+1 =
X X
|v|=n i∈IN
Wv ∗ Wi (v)
(9)
und die Rückwärtsgleichung
Zn+1 =
X X
i∈IN v∈V
Wi ∗ Wv (i) =
X
i∈IN
Wi ∗ Zn (i).
(10)
Hierbei bezeichnet Zn (i) das Gesamtknotengewicht n-ter Generation für den
Baum iV zur Wurzel i.
Die Bedeutungen der Begriffe vorwärts und rückwärts ergeben sich direkt
aus der Anschauung. Für die Vorwärtsgleichung fügen wir jedem Pfad bis zur
23
n-ten Generation alle weiteren Kanten zu. Dies entspricht einer iterativen
Vorgehensweise. Für die Rückwärtsgleichung stehen die Abkömmlinge der
Gründerindividuen i im Vordergrund, von denen dann die Pfade jetzt der
Länge n starten. Der Vorteil dieser Betrachtsweise besteht im Zusammenfassen
aller Pfade in i startend. Dies ist eine rekursive Betrachtung.
Verweilen wir bei den Vorteilen der rückwärtigen Betrachtung. Die Rueckwaertsgleichung liefert uns eine Vorschrift, aus der Verteilung von Zn diejenige
von Zn+1 zu erhalten. Sei K diese Abbildung. Dann hat Zn als Verteilung
die n-fache Iteration K n (δ1 ) bei Start im Punktmaß δ1 auf 1. Ein eventueller
Grenzwert in Verteilung entspricht der Konvergenz der Iterierten K n (δ1 )
gegen einen Fixpunkt von K.
Bezeichne ϕY , ϕY (t) := Ee−tY , t ≥ 0 die Laplace Transformierte einer
Zg Y und sei ϕn = ϕZn die Laplace Transformierte von Zn .
Proposition 1 Die Rückwärtsgleichung (8) schreibt sich in der äquivalenten
Form
Y
ϕn+1 (t) = E ϕn (tWi ).
(11)
i
Beweis:
P
ϕn+1 (t) = Ee−tZn+1 = E(E(e−t i Wi Zn (i) | (Wi )i )))
Y
Y
= E( E(e−tWi Zn (i) | (Wi )i )) = E( ϕn (tWi ))
i
i
q.e.d.
Konvergiert Zn schwach gegen Z, so konvergieren die Laplacetransformierten
ϕn punktweise und monoton in n und die Laplacetransformierte ϕZ von Z
erfüllt die Fixpunktgleichung, verwende mootone Konvergenz in der Rückwärtsgleichung
Y
ϕ(t) = E( ϕ(tWi ))
(12)
i
Hier eröffnet sisch ein potentieller Weg zur Bestimmung und Charakterisierung
der Grenzverteilung von Z.
Jetzt zu den Vorteilen der vorwärtigen Betrachtung. Sei m endlich. Die
Zn
Zgn m
n bildet ein Martingal bzgl. der Filtration An , die kleinste σ-Algebra
aufgespannt von allen Kantengewichten bis zur n-ten Generation
E(Zn+1 | An ) =
X
|v|=n
X
Wv ∗ E(
i
24
Wi (v) | An ) =
X
|v|=n
m = Zn m.
Jedes positive Martingal konvergiert fast sicher. Damit haben wir einen fast
sicheren Grenzwert der Zn gefunden.
Zusammenfassend: Der vorwärtige Blick betrifft Zgn und liefert Konvergenz
von Zgn. mit eher wahrscheinlichkeitstheoretischen Hilfsmitteln. Der rückwärtige
Blick betrifft Verteilungen und liefert Konvergenz von Verteilungen mit eher
mas̈theoretischen Hilfsmitteln.
4
Die Aussterbewahrscheinlichkeiten
Sir Francis Galton, ein Cousin des Naturforschers Charles Darwins, angeregt
durch dessen grundlegendes Buch von 1859, ber die Entstehung der Arten
durch natrliche Zuchtwahl oder Die Erhaltung der begnstigten Rassen im
Kampfe ums Dasein (Original: On the Origin of Species by Means of Natural
Selection, or the Preservation of Favoured Races in the Struggle for Life),
versuchte auf der Vererbungsgrundlage in seinem Buch Heriditary Genius
(Deutsch: Genie und Vererbung) den Niedergang adliger Familien zu erklären.
Später schrieb er: Es gibt viele Beispiel dafür, dass Nachnamen, die einst
verbreitet waren, seltener wurden oder ganz verschwanden. Die Tendenz ist
überall zu beobachten und zu ihrer Erklärung wurde vorschnell der Schluss
gezogen, dass eine Zunahme an physischem Komfort und intellektueller Fähigkeit
notwendigerweise mit einer Minderung der Fruchtbarkeit einhergeht. Galton
bot eine andere, gesellschaftliche Erklärung an: Männer, deren Status sich
kürzlich erhöht hat, versuchen ihre Position abzusichern, indem sie Erbinnen
heiraten - per Definition Frauen aus Familien ohne Söhne. Solche Frauen
würden auch selbst mit geringerer Wahrscheinlichkeit Söhne gebären.
Nach dem Einwand des Schweizer Botanikers Alphonse de Candolle auf
ein rein zufälliges Phänomen, stellt er diese wahrscheinlichkeitstheoretische
Frage 1873 im Journal Educational Times. Der Reverend, Schullehrer und
Mathematiker Reverend Henry William Watson gab eine Antwort, die gemeinsam
1874 erschien, On the probability of extinction of families. Dies ist die Grundlage
des Galton-Watson Pozesses. (Dies Konzept, wie erst viel später herausgefunden
wurde, war (unabhängig) früher von I. J. Bienaym diskutiert worden [13] [10].
Die übliche Definition eines Galton-Watson Prozesses ist: Seien Xn,i , n, i ∈
IN0 uiv Zgn mit Werten in IN0 . Der Galton-Watson Prozess (Zn )n ist rekursiv
25
definiert durch
Zn+1 =
Zn
X
Xn,i
(13)
i=1
mit der Anfangsbedingung Z0 = 1. Die Verteilung von X heißt die Nachkommenschaftsverteilung
Wir schliessen per Definition den uninteressanten Fall X identisch 1 oder
identisch 0 aus.
Galton-Watson Prozesse sind spezielle gewichtete Verzweigungsprozesse
auf der multiplikativen Halbgruppe G = {0, 1}. Beobachtet werden die lebenden
Nachkommen, alle Knoten v mit Wv = 1. Die Verteilung der Nachkommen
P
Xv = i Wi (v) des Individuums v ist die Nachkommenverteilung. Während
der gewichtete Verzweigunsprozess eine namensgebung nach der Abstammung
vergibt, nummeriert der Galton-Watson Prozess die Individuum n-ter Generation
willkürlich.
Wir wollen eine unendliche Nachkommenanzahl zulassen. Der GWP betrachtet
nur endlich viele Nachkommen, was biologisch sinnvoll erscheint. Für abstraktere
Anwendungen des GVP benötigen wir unendlich viele Nachkommen.
Sei qn = P (Zn = 0) die Wahrscheinlichkeit, dass der Prozess in nter Generation bereits ausgestorben ist. Aus Monotoniegründen konvergiert
qn aufsteigend gegen die Aussterbewahrscheinlichkeit q = P (∃nZn =
0) = limn qn . Sehr viele Aussagen von Galton-Watson Prozessen, wie auch
die Analyse über Aussterbewahrscheinlichkeiten, basieren auf dem Studium
erzeugender Funktionen.
Erzeugende Funktionen Die erzeugende Funktion fY einer Zg Y mit
Werten in den natürlichen Zahlen einschlies̈lich der 0 und ∞ ist die Funktion
[0, 1] 3 s 7→ fY (s) := EsY . Beachte, das Y eventuell Masse auf ∞ hat und
nur das halboffene Intervall (0, 1) für die erzeugende Funktion betrachten.
Die erzeugende Funktion ist wohl definiert. Aus der erzeugenden Funktion
erhalten wir die Verteilung von Y durch die Koeffizienten, die sich durch
Ableitungen ermittlen lassen, eindeutig zurück. Die Masse P (Y = ∞) ergibt
sich aus 1−lims%1 f (s). Dies ergibt eine Bijektion zwischen Wahrscheinlichkeitsverteilungen
auf IN0 und erzeugenden Funktionen.
Die erzeugende Funktion hat viele schöne Eigenschaften, aufsteigend,
konvex, steitig in [0, 1), stetig differenzierbar in (0, 1) usw. Ein Unstetigkeitspunkt
ist eventuell 1 da 1 − lims%1 f (s) der Masse P (Y = ∞) entspricht.
Lemma 2 Seien Yi , i ∈ IN uiv Zgn mit Werten in N 0 und sei τ eine davon
unabhängige Zg ebenfalls mit Werten in N 0 . Sei f die erzeugende Funktion
26
der Y -Zgn und g die erzeugende Funktion von τ. Dann hat die Zg
die erzeugende Funktion g ◦ f.
Bew: Die Zg
Pτ
i=0
Es
Pτ
i=0
Yi
Yi ist wohldefiniert.
P
i≤τ
Yi
= E
∞
X
11τ =j s
j=0
Pj
i=1
X
11τ =j E(
X
11τ =j E(
X
11τ =j
= E(
j
Y
j
Y
j
i=1
X
j
= E(
sYi | τ = j))
sYi ))
i=1
j
= E(
j
Y
i=1
j
= E(
Yi
E(
j
Y
sYi ))
i=1
11τ =j f (s)) = Ef τ (s) = g(f (s)).
j
q.e.d.
Wir verwenden f für die erzeugende Funktion der Nachkommenschaftsverteilung
P
Xv = i Wi (v) in der GVP-Notation. Sei m = f 0 (1−) und fn die n-fache
Komposition von f.
P
Sei Zn = |v|=n Wv die Anzahl der lebenden Individuen eines GWP in der
GVP-Notation. Beachte die Vorwärtsdarstellung und die Rückwärtsdarstellung
Zn+1 =
X X
Wv Wi (v) =
|v|=n i∈IN
X X
Wi Wv (i).
i∈IN |v|=n
Proposition 3 Die erzeugende Funktion von Zn aus (13) ist fn .
Bew: Wir zeigen die Behauptung durch Induktion nach n. Die erzeugende
Funktion von Z1 ist f nach Definiton von Z1 = X. Nun der Induktionsschritt
von n auf n+1. Beachte hierbei die Unabhängigkeit von Zn und der Xv , |v| ∈
V
EsZn+1 = Es
P
i∈IN
sup|v|=n Wi Wv (i)
(sWi s
Y
= EE(
i
Y
= EE(
i
sWi E(s
P
v
Wv
P
v
Wv
) | Wi , i ∈ IN )
| Wi , i ∈ IN ) = f (fn (s)) = fn+1 .
q.e.d.
27
Satz 4 Die Aussterbewahrscheinlichkeit q eines GWP mit eventuell unendlich
vielen Nachkommen ist der kleinste Fixpunkt der erzeugenden Funktion f. Es
gilt q < 1 genau dann wenn entweder f (1−) < 1 oder f (1−) = 1 und m > 1
gilt.
Bew: Die W-keiten qn = P (Zn = 0) = fn (0) erfüllen
f (qn ) = f (fn (0)) = fn+1 (0) = qn+1 .
Sei f (1−) = 1. Damit gilt, beachte f ist eine stetige, monoton steigende
Funktion auf dem gesamten abgeschlossenen Einheitsintervall
f (q) = f (lim
qn ) = lim
f (qn ) = lim
qn+1 = q.
n
n
n
Für die Eindeutigkeit sei r ein weiterer Fixpunkt von f . Es gilt 0 ≤ r und die
Monotonie von f bzw. fn impliziert fn (0) ≤ fn (r) = r. Im Grenzwert folgt
q ≤ r. Da [0, 1] 3 s 7→ f (s) − s eine strikt konvexe Funktion ist, (wir hatten
X ≡ 0 ausgeschlossen), hat f maximal zwei Fixpunkte. Der Wert 1 ist stets
ein Fixpunkt. f hat einen zweiten Fixpunkt genau dann, wenn f 0 (1)−1 strikt
positiv ist. Dies ist äquivalent zu f 0 (1) = m > 1.
Im Fall f (1−) < 1 hat f mindestens einen Fixpunkt s0 < 1, da f stetig
ist auf [0, 1) und [0, 1) 3 s 7→ f (s) − s das Vorzeichen wechselt. Zeige per
Induktion qn ≤ s0 und verwende dann die Stetigkeit wie eben um q als
kleinsten Fixpunkt zu erhalten.
q.e.d.
Ohne Beweis sei angefügt, f hat stets höchstens einen Fixpunkt in [0, 1)
und keinen genau dann wenn f (1−) = 1 und m ≤ 1 gilt.
Diesen Satz wenden wir auf einen GVP an. Sei 4 das Grab und Zn =
P
1Wv 6=4 die Anzahl der Knoten n-ter Generation, denen nicht durch die
|v|=n 1
Pfade der Wert 4 zugeordnet wird. Die Anzahl der lebenden Nachkommen
P
des Individuums v ist Xv = i 11Wi (v)6=4 . Hiermit ergeben sich, sei Zn die
Anzahl der lebenden Nachkommen in n-ter Generation, die Aussterbewahrscheinlichkeiten
qn = P (Zn = 0) und q = P (∃n Zn = 0) = limn qn eines GWP. Das
Anwendung von Satz 4 auf GVP lautet:
Korollar 5 Die Aussterbewahrscheinlichkeit q eines GVP ist der kleinste
Fixpunkt der erzeugenden Funktion f. Es gilt f (qn ) = qn+1 ↑n q. Die Aussterbewahrscheinlichkeit
q ist 1 genau dann wenn f (1−) = 1 und m ≤ 1 gilt.
28
Watson, der diese Charakterisierung der Aussterbewahrscheinlichkeit gezeigt
hatte, machte kurz vor dem Ziel einen Schnitzer. Er setzte als Beispiel die
5
erzeugende Funktion als f (s) = (3+s)
an, was durchaus akzeptabel ist,
210
übersah aber die Lösung f (0, 55) = 0, 55. Stattdessen erhielt er als Aussterbewahrscheinlichkeit
den Wert 1 und schrieb: Alle Nachnamen haben daher die Tendenz auszusterben.
Dieses Resultat war eigentlich vorhersehbar, denn ein Nachname, wenn er erst
verloren ist, kann niemals wiederhergestellt werden, und mit jeder nachfolgenden
Generation erhöht sich die Chance des Verlustes. Damit war die Chance
vertan.
4.1
Das Gesamtknotengewicht Zn
Wie groß ist in der Regel das Gesamtknotengewicht
Zn =
X
Wv
|v|=n
Zn
der n-ten Generation? Den Schlüssel liefert das Martingal Mn = m
n.
Mit An bezeichnen wir die kleinste σ-Algebra erzeugt von allen Kantengewichten
Wi (v), |v| < n, i ∈ IN für Kanten (v, vi) bis zur n-ten Generation. Sei
P
Xv = i Wi (v) und m = EX.
Satz 6 Sei der durchschnittliche Zuwachs m strikt positiv und endlich. Dann
ist M = (Mn )n∈IN ein positives Martingal bzgl. der Filtration (An )n∈IN und
konvergiert fast sicher gegen einen Grenzwert, genannt M∞ , mit Erwartungswert
0 ≤ EM∞ ≤ 1.
v
( Xmv −
Beweis: Die Differenz Dn = Mn −Mn−1 hat die Darstellung |v|=n−1 mWn−1
1). (Dies folgt aus der Vorwärtsgleichung.) Die Martingaleigenschaft ist äquivalent
zu E(Dn | An−1) = 0 für alle n,
P
Wv Xv
(
− 1) | An−1 )
mn−1 m
|v|=n−1
E(Dn | An−1 ) = E(
=
X
Wv
Xv
E(
− 1) | An ) = 0.
n−1
m
m
|v|=n−1
X
Jedes positive Martingal konvergiert fast sicher gegen einen Grenzwert. Das
Lemma von Fatou liefert
1 = limninf EMn ≥ E limninf Mn = EM∞ ≥ 0.
29
q.e.d.
Das Gesamtknotengewicht n-ter Generation ist pfadweise von der Größenordnung
Zn ∼ M ∞ m n .
Bsp: Die Hausdorffdimension zufälliger Cantormengen.: Anstelle
des mittleren Drittels wie bei der (deterministischen) Cantormenge 1.1 schneiden
wir zufällig ein Intervall heraus.
Formal: Seien (Av , Bv ), v ∈ V uiv Zgn mit 0 ≤ Av , Bv ≤ 1, Av +
Bv < 1. Sei S die Menge der abgeschlossenen Intervalle in den positiven
reellen Zahlen einschlies̈lich des leeren Intervalls {∅}. Die Kantengewichte
sind Transformationen von S nach S
Tv,1
Tv,2
[a, b] 7→ [a, a + Av (b − a)]
[a, b] 7→ [b − Bv (b − a), b]
und Tv,3 = {∅} = Tv,4 = . . . . Die zufälligen Cantormengen sind die Grenzwerte
C = C(ω) der fallenden Folgen Cn := ∪|v|=n Lv ([0, 1]) von abgeschlossenen
Mengen bei vorgegenem ω ∈ Ω.
Die Hausdorffdimension H(C) einer Menge C aus den reellen Zahlen wird
definiert als das Infimum aller α < 0 mit lim²→0 Hα,² (C) < ∞. Hierbei ist
P
Hα,² (C) das Infimum aller Summen n∈IN |Un |α , wobei jedes Un ein Intervall
höchstens der Länge ² ist und ∪i∈IN Ui eine Überdeckung der Menge C ist.
Wir behaupten, die Hausdorffdimension einer zufälligen Cantormenge ist
fast sicher kleiner gleich α0 , wobei α0 > 0 durch EAα1 0 + EB1α0 = 1 gegeben
wird. Wir betrachten die Folge Uv = Lv ([0, 1]), |v| = n von Überdeckungen.
Das Supremum sup|v|=n |Uv | der n-ten Überdeckung ist absteigend. Es konvergiert
gegen 0, da der Erwartungswert
E( sup |Uv |)2α0 ≤ E
|v|=n
X
|v|=n
|Uv )|2α0 = mn →n 0
2α0
0
= EA2α
+ EB12α0
i |Ti ([0, 1))|Uv |
1
P
ist Hα0 ,² (C) ≤ |v|=n |Uv |α0 =: Mn für
m = E
< 1 gegen 0 konvergiert.
hinreichend gros̈es n. Das
Folglich
Martingal Mn konvergiert fast sicher gegen einen endlichen Wert. Dies zeigt
lim²→0 H²,α0 (C) ≤ limn Mn < ∞ fast sicher und damit die Behauptung.
Der Wert α0 ist tatsächlich die Hausdorffdimension [22]. Dies Ergebnis
umfasst auch die deterministische Cantormenge mit Av und Bv identisch 1/3.
P
4.1.1
Momente von Zn
Wie groß ist das Gesamtknotengewicht Zn in n-ter Generation? In diesem
Abschnitt berechnen wir die ersten beiden Momente.
30
Da diese Aufgabenstellung die Verteilung betrifft, liegt es nahe, die Rückwärtsgleichung
zu benutzen. Wir erhalten gute Rekursionen, die sich explizit lösen lassen.
Die Rechnungen für natürliche Momente werden kürzer (und etwas einfacher)
Zn
durch konsequente Ausnutzung der Martingalstruktur von Mn = m
n bzgl der
σ-Algebren An erzeugt von allen Kantengewichte bie zur n-ten Generation.
Wir nutzen die Martingaldifferenzdarstellung des Martingals Mn als Teleskopsumme
Mn − 1 =
n
X
Di
i=1
mittels der Martingaldifferenzen Di = M − i − Mi−1 .
P
P
(2)
Sei Zn(2) := |v|=n Wv2 , m(2) := EZ1 = E i Wi2 und σ 2 = Var X
.
m
Proposition 7 Die Nachkommenschaft Xv = i Wi (v) habe endliches erstes
Moment m = EX < ∞ und endliche Varianz σ 2 = VarX. Es gilt
P
E
E
Zn
= 1
mn
Zn(2)
= 1
m2 (n)





Zn
Var( n ) = σ 2 m2n 
m


mn (2)
m2n
m(2)
1− 2
m
falls
m(2) 6= m2
n
falls
m(2) = m2
1−

Beweis: Wir benutzen die Darstellung des Martingals Mn − 1 = ni=1 Di über
P
v
die Martingaldifferenzen Di = M − i − Mi−1 = |v|=i−1 mWi−1
( Xmv − 1). Der
Erwartungswert der Martingaldifferenzen
P
E(Di ) = EE(Di | Ai−1 ) = E
Wv Xv
E(
− 1 | Ai−1 ) = 0
mn
m
|v|=i−1
X
ist natürlich 0.
Die zweite Behauptung folgt aus der ersten für den GVP mit Kantengewichten
(2)
Wi2 (v). (Dann ist mZnn(2) ein Martingal.)
Die Varianz von Mn berechnet sich zu
n
X
E(Mn − 1)2 = E(
i=1
Di ) = E
n
X
Di2 + E
i=1
31
X
1≤i6=j6=n
Di Dj = E
n
X
i=1
Di2 .
Beachte, die gemischten Terme EDi Dj sind 0 für i 6= j. Zum Beispiel für
i < j benutze die bedingte Erwartungen EDi Dj = EE(Di Dj | Aj−1 ) =
E(Di E(Dj | Aj−1 )) = 0.
Wv Xv
(
− 1))2
i−1 m
m
|v|=i−1
EDi2 = E(
X
Wv2 Xv
(
− 1))2 + 0
2(i−1) m
m
|v|=i−1
= E(
=
X
X
|v|=i−1
= σ2
E(
Wv2
Xv
)E((
− 1))2 )
m2(i−1)
m
mi−1 (2)
.
m2(i−1)
W w Xw
W v Xv
Alle gemischten Terme E( m
n ( m − 1)) mn ( m − 1)) sind 0, da wir auf Ai−1
bedingen können, Unabhängigkeit ausnutzen und E( Xmv − 1) = 0 gilt. Wir
erhalten
n−1
X mi (2)
Zn
.
Var n = σ 2
2i
m
i=0 m
Dies ist eine geometrische Reihe mit dem Faktor m(2)
. Die Fallunterscheidung
m2
nach dem Faktor gleich oder ungleich 1 liefert das Resultat.
q.e.d.
Auch höhere Momente ließen sich berechnen, falls notwendig. Die Ausdrücke
werden mit steigender Potenz schwieriger. Aber es ist machbar und man
erhält (durchaus handhabbare) Formeln.
Eine typische Anwendung ist:
Korollar 8 Sei m(2) < m2 und EX 2 < ∞. Dann ist M gleichgradig integrierbar
und gleichgradig 2-integrierbar. Damit konvergiert das Martingal M fast sicher
und in L2 .
Beweis: Der Satz folgt direkt aus dem Theorem 45 des Anhangs.
q.e.d.
Beispiel: Für einen superkritischen (1 < m < ∞) Galton-Watson Prozess
Zn
mit endlicher Varianz der Nachkommenschaft ist Mn = m
n ein gleichgradig
2-integrierbares Martingal. Die Varianz von Z∞ berechnet sich als Grenzwert
der Varianzen der Zn .
32
4.1.2
Andere Momente
Aus der Martingaldifferenzdarstellung erhalten wir Abschätzungen für pMomente 1 < p < 2 von Z.
Lemma 9 Sei m endlich und es existiere ein 1 < p ≤ 2 mit endlichem
P
m(p) = E i Wip und EX p . Es gilt

¯p  n
¯
¯
¯
X
EMnp ≤ 1 + E ¯¯ − 1¯¯  1−( m(p)
)n
mp
m
1−
m(p) = mp
falls
sonst
m(p)
mp
Im Fall m(p) < mp ist das Martingal M gleichgradig p-integrierbar und
konvergiert fast sicher und in Lp .
Beweis: Wir wollen die ARTV-Ungleichung (??) aus dem Anhang anwenden.
− 1|p .
Sei zur Abkürzung a = E| X
m
Sei zuerst n fest und ϕ : Vn−1 → IN eine Abzählung (=bijektive Abbildung)
von Vn−1 . Dann ist
Yj :=
X
ϕ(v)≤j
Wv
mn−1
Ã
!
X(v)
−1
m
ein Martingal mit den Martingaldifferenzen
Yj − Yj−1
Wv
=
11ϕ(v)=j n−1
m
|v|=n−1
X
Ã
!
X(v)
−1 .
m
Eine Anwendung der ARTV-Ungleichung auf das positive Martingal (Mn−1 +
Yj )j liefert
p
E(Mn−1 + Yj ) −
p
EMn−1
≤
X
X
|v|=n ϕ(v)≤j
≤ a
X
ϕ(v)≤j
Ã
¯
¯
¯ W v ¯p
¯
E ¯ n−1 ¯¯
m(p)
≤ a
mp
33
¯
Ã
!¯p
¯ W
¯
X(v)
v
¯
E ¯¯ n−1
− 1 ¯¯¯
m
m
m
!n−1
< ∞.
(14)
(15)
(16)
Daher ist (Mn−1 + Yj )j ein positives Lp -Martingal und konvergiert in Lp und
f.s. gegen den Grenzwert Mn . Wir erhalten
Ã
m(p)
E|Mn |p − E|Mn−1 |p ≤ a
mp
!n−1
.
Eine erneute Anwendung der ARTV-Ungleichung mit der Funktion x 7→
x liefert
p
p
E|Mn | − 1 ≤ 2
n
X
j=1
p
p
(E|Mj | − E|Mj−1 | ) ≤ a
n
X
i=1
Ã
m(p)
mp
!n−1
Im Fall m(p) < m ist E|Mn |p gleichmäßig beschränkt durch 1 + a
damit das Martingal gleichgradig p-integrabel.
.
1
1−
m(p)
mp
und
q.e.d.
Korollar 10 Sei m endlich und es existiere ein 1 < p ≤ 2 mit m(p) < mp
und EX p < ∞. Dann ist M gleichgradig integrierbar und gleichgradig pintegrierbar. Damit konvergiert das Martingal M fast sicher und in Lp .
Beweis: Der Satz folgt direkt aus dem Theorem 45.
q.e.d.
Beispiel: Für einen superkritischen (1 < m ≤ 2) Galton-Watson Prozess
mit endlichem p-ten Moment der Nachkommenschaft für ein 1 < p ≤ 2 ist
Zn
Mn = m
n ein gleichgradig p-integrierbares Martingal für 1 < p ≤ 2.
4.1.3
Die stochastische Fixpunktgleichung von M
Ziel der nächsten Sektionen ist es die Menge M = 0 genauer zu betrachten.
Die Aussage Zn (ω) ist von der Größenordnung M (ω)mn macht erst besonders
Sinn, falls M (ω) > 0 gilt.
Eine Verteilung µ erfüllt die Fixpunktgleichung
D
X=
X
Ai Xi + C
(17)
i
bzgl. dem Wertebereich B falls alle Zgn Werte in B haben und die Verteilung
P
der rechten Seite als Grenzwert der Verteilungen i≤n Ai Xi +C wohldefiniert
ist. Die Zgn (C, A1 , A2 , . . .), Xi , i ∈ IN sind unabhängig und alle X-Zgn haben
D
dieselbe Verteilung µ. Das Symbol = steht für Gleichheit der Verteilung. Aber
34
Vorsicht, die Regelregeln mit Gleichheit und Gleichheit in Verteilung sind
verschieden. (Zum Beispiel kann man im letzteren keine Zgn auf beiden Seiten
addieren.) Sprachlich benutzt man auch, eine Zg erfüllt eine stochastische
Fixpunktgleichung, wenn dies für die Verteilung der Zg gilt. Die Unabhängigkeit
ist Bestandteil der Definition und wird nicht jedesmal neu gefordert.
Wenn wir die Angabe des Wertebereiches weglassen, ist das default setting
die reellen Zahlen. Implizit wird damit auch die Wohldefiniertheit der rechten
Seite gegeben. Durch Annahmen in Sätzen wird diese dann gewährleistet.
Da wir nur positive Zgn betrachten und den Wert ∞ zulassen, haben wir in
diesem Abschnitt keine Probleme mit der Wohldefiniertheit. Falls notwendig,
werden wir dies spezifizieren.
Beachte, wenn wir eine Lösung X der Lösung der Fixpunktgleichung (??)
P
haben, so gibt es Versionen von X, Xi und ((Ai )i , C) mit X = i Ai Xi + C
fast sicher. Definiere einfach X durch vorgegebenen Zgn auf der rechten Seite
als Zgn durch die rechte Seite.
Äquivalent zur Fixpunktgleichung ist die Gleichung
ϕ(t) = EetC
Y
ϕ(tAj )
(18)
j
für Laplace- oder Fouriertransformierte ϕ und der Parameter t geeignet reell
oder imaginär. Aus der stochastischen Fixpunktgleichung ?? folgt für die
Transformierte ϕ(t) = EetX mit bedingten Erwartungen
ϕ(t) = EE(etC
Y
j
etAj Xj | A, C) = E(etC
Y
j
E(etAj Xj | A, C)) = EetC
Y
ϕ(tAj ).
j
Umgekehrt aus einer Lösung von Gleichung (18) durch eine Transformierte ϕ
ergibt sich aus der Eindeutigkeit eine Lösung der stochastischen Fixpunktgleichung
??.
q.e.d.
Lemma 11 Gegeben sei ein GVP auf den positiven reellen Zahlen mit m <
∞. Dann erfüllt M die Gleichung
M=
X Wi
m
i
M (i)
(19)
mit M (i) der entsprechende Grenzwert auf dem Baum iV. Insbesonders erfüllt
M die Fixpunktgleichung ??
D
X=
X Wi
i
35
m
Xi
(20)
Es gilt EM ≤ 1.
Beweis: Definiere das Gesamtknotengewicht Zn (i) = |v|=n Wv (i) der n-ten
Generation des Baumes iV mit Wurzel i und betrachte die Rückwärtsdarstellung
P
Mn+1 =
X Wi Zn (i)
Zn+1
=
.
n+1
n
m
i m m
Die linke Seite konvergiert f.s. als positives Martingal gegen M. Das Lemma
von Fatou liefert EM = E limn Mn ≤ limn EMn = 1.
Falls wir auch auf der rechten Seite zum Grenzwert übergehen dürften,
würde Gleichung (19) und damit Gleichheit in Verteilung. Der Grenzübergang
ist nicht offensichtlich und benötigt ein Argument.
P
P
i Zn (i)
i
Für endliches N konvergiert i≤N W
gegen i≤N W
M (i). Dieser
m mn
m
Wert ist punktweise dominiert bei M und konvergiert mit N → ∞ gegen
P Wi
i m M (i) ≤ M∞ . Nehmen wir auf beiden Seiten den Erwartungswert, so
erhalten wir fast sichere Gleichheit.
q.e.d.
Die Fixpunktgleichung ?? hat eventuell mehrere Lösungen. Vielfache einer
Lösung sind ebenfalls ein Lösung. X ≡ 0 ist stets eine Lösung, wenn auch
eine triviale. Es gibt Fälle in denen M ≡ 0 gilt. (Siehe den Satz von KestenStegum oder die Sektionen über Maßtransformierte.) Ist das Martingal M
jedoch gleichgradig integrierbar, so konvergiert Mn in L1 und die Zg M hat
Erwartungswert 1. Insbesonders ist M∞ nicht ausgeartet und wir haben einen
nicht trivialen Fixpunkt.
Natürlich ließe sich obiges Resultat auch mit Transformierten erreichen.
Betrachte die Laplace Transformierten ϕn , ϕn (t) = Ee−tMn , t ≥ 0 von Mn .
Diese sind punktweise aufsteigend in n, verwende Jensens Ungleichung und
P
die vorwärtige (=iterative) Blickweise, Yv = i Wi (v),
−t
ϕn+1 (t) = Ee
= EE(
Wv Yv
|v|=n mn m
P
Y
Wv Yv
m
e−t mn
|v|=n
= E(
Wv Yv
m
Y
E(e−t mn
Y
e−t mn E m |An ) )
|v|=n
≥ E(
| An )
|v|=n
Wv
Yv
= E(e−tMn ) = ϕn (t).
36
| An ))
ϕn konvergiert punktweise gegen einen Grenzwert, und dies muß die Laplace
Transformierte ϕ von M sein (eventuell ausgeartet). Aus der Rückwärtsgleichung
1 erhalten wir
ϕn+1 (t) = ϕn+1 (t) = E
Y
ϕn (tWi ) = E
i
Y
ϕn (tWi )
i
und damit für den punktweisen Grenzwert
ϕ(t) = E
Y
ϕ(tWi ).
i
Dies entspricht der stochastischen Fixpunktgleichung 20 wegen der Eindeutigkeit
der Laplace Transformierten. Beachte auch, alles ist wohldefiniert in IR+ .
q.e.d.
4.1.4
Die W-keit P (M∞ = 0).
Wann ist M∞ identisch 0. Als Folgerung aus der stochastischen Fixpunktgleichung
(20) berechnen wir die Wahrscheinlichkeit P (M∞ = 0).
P
Sei X̂ = i 11Wi 6=0 die Anzahl der Nachkommen und f die erzeugende
Funktion [0, 1] 3 s 7→ f (s) = EsX̂ von X̂. (Im Punkt 0 benutzen wir die
stetige Fortsetzung durch die Konvention 00 = 1.) Wir lassen unendlich viele
Nachkommen zu (X̂ kann den Wert unendlich annehmen).
Lemma 12 Sei Y eine Lösung der Fixpunktgleichung
D
Y =
X
Wi Yi
(21)
i
auf dem Wertebereich B = [0, ∞). Dann ist P (Y = 0) ein Fixpunkt von f.
Beweis:
P (Y = 0) =
N
X
lim P (
N →∞
X
= lim
N
= lim
N
Wi Yi = 0)
i=1
J⊂{1,2,...,N }
X
J
P (J = {i ≤ N | Wi > 0}, ∀j ∈ J : Yj = 0)
P (J = {i ≤ N | Wi > 0})P (∀j ∈ J : Yj = 0)
37
= lim
N
= lim
N
=
X
J
N
X
l=0
X
P (J = {i ≤ N | Wi > 0})P |J| (Y = 0)
N
X
P(
11Wi >0 = l)P l (Y = 0)
i=1
P (X̂ = l)P l (Y = 0)
0≤l<∞
= f (P (Y = 0)).
Damit ist P (Y = 0) ein Fixpunkt von f. Der Rest folgt aus Lemma ??. q.e.d.
Korollar 13 Entweder ist M∞ identisch 0 oder M∞ ist strikt positiv auf der
Überlebensmenge.
Bew: Die Zgn identisch 0 ist immer eine Lösung der obigen Fixpunktgleichung.
Wenn die Zg M∞ ein strikt positives Moment besitzt, so kann sie nicht
degeneriert sein. Die Menge M∞ > 0 ist enthalten in der Überlebensmenge
P
U des GWP mit Nachkommenschaftverteilung wie X̂ = i 11Wi 6=0 . Da beide
dieselbe W-keit besitzen, sowohl P (M∞ = 0) als auch 1−P (U ) sind Fixpunkte
ungleich 1 von f und oEdA hat f höchstens zwei Fixpunkte, gilt fast sichere
Gleichheit. Folglich konvergiert Mn auf der Überlebensmenge gegen den strikt
positiven Grenzwert M∞ und nur dort.
q.e.d.
Wie sieht die Verteilung von M∞ aus auf der Überlebensmenge? Der
strikt positive Teil einer nichttrivialen Fixpunktlösung löst noch eine andere
Fixpunktgleichung. Damit lassen sich lästige Fallunterscheidungen manchmal
vermeiden.
Proposition 14 Sei X eine positive Lösung einer stochastischen Fixpunktgleichung
D
X=
X
Ai Xi
i
mit positiven Koeffizienten und 0 < P (X = 0) < 1. Sei Y die Verteilung von
X gegeben X ist strikt positiv. Dann erfüllt Y die stochastische Fixpunktgleichung
D
Y =
X
A0i Yi .
(22)
i
Hierbei ist die Verteilung von (A0i )i diejenige von (Ai Bi )i bedingt auf i Ai Bi >
0 wobei Bi , i ∈ IN Zgn mit Bernoulli Verteilung zum Parameter P (X > 0)
sind und unabhängig von den (Ai )i .
P
38
Beweis: Beachte die Darstellung von X in der Form BY mit Y, B unabhängig,
B eine Zg mit Bernoulli Verteilung zum Parameter P (X > 0) und die
Verteilung von Y wie oben beschrieben. Die Fixpunktgleichung für X liefert
D
BY =
X
Ai Bi Yi .
i
Die Einschränkung auf strikt positive Werte lifert
D
11B=1 Y = 11P
A B >0
i i i
X
Ai Bi Yi .
i
Es folgt P (B = 1) = P ( i Ai Bi > 0) und stochastische Gleichheit (22) bei
Bedingung auf strikt positive Werte.
q.e.d.
: Ex. GWP: Welcher Transformation entspricht dies beim GWP? Sei
i
m > 1 und die Ai entsprechen den W
mit den Werten 0 oder m1 . Sei p =
m
P (B = 1), f die erzeugende Funktion des GWP und j ∈ IN.
P
X
P(
A0i = mj) = P (
X
i
i
=
=
=
=
g(s) :=
X
j
A − jBj > 0)
P ( i Ai Bi = mj)
P
P ( j Aj Bj > 0)
1 X
E
11J={j|Aj >0} 11P Bi =j
i∈J
p J⊂IN
P
Ã
!
|J| j |J|−j
1 X
pq
11J={j|Aj >0}
E
j
p J⊂IN
à !
1 X
k j k−j
E
pk
pq
p k≥j
j
X
sj P (
j∈IN
=
Ai Bi = mj |
1X
p
k
X
i
à !
X
k j k−j
1X
pq )
sj
pk (
A0i = mj) =
j
p k
1≤j≤k
pk ((sp + q)k − q k ) =
f (sp + q) − q
.
p
Aus der erzeugenden Funktion läßt sich die Nachkommenschaftsverteilung
berechnen. Die beiden Erwartungswerte m = f 0 (1−) und g 0 (1−) der Nachkommenschaft
sind gleich. Die Laplacetransformierte ϕ des Fixpunktes X erfüllt ϕ(t) =
39
f (ϕ( mt )) und der Fixpunkt Y mit Laplacetransformierter ψ erfüllt ψ(t) =
g(ψ( mt )).
Für den GWP bedingt aufs Aussterben siehe den Abschnitt Maßtransformierte
Prozesse. Prozess als bedingt auf Nichtaussterben. ......................Name.......................
40
5
Maßtransformierte Prozesse
Zn
Wir kommen langfristig jetzt zur L1 -Konvergenz des Martingals m
n . Ein
starkes Hilfsmittel von eigenständiger Bedeutung sind maßtransformierte
Prozesse bzw. ein Maßwechsel. Die Idee eines Maßwechsels ist es eine stochastische
Aussage bzgl. eines Maßes auf eine andere stochastische Aussage unter einem
anderen Maß zu erhalten.
Hintergrund: Sei (An )n eine Filtration und Pn das auf An eingeschränkte
Maß. Sei (Mn )n ein adaptiertes Martingal. Die Familie Qn := Mn Pn von Wmaßen habe einen projektiven Grenzwert, genannt Q. Die Idee ist, eventuelle
Aussagen für den W-raum (Ω, A, Q) beweisen zu können und damit Aussagen
für den Originalwahrscheinlichkeitsraum (Ω, A, P ) zu erhalten.
Zur Orientierung sehen wir uns zeitlich homogene Markoffketten und
Doobsche h-Transformierte an. Sei (Xn )n eine zeitlich homogene Markoffkette
zur Übergangsmatrix P = (pi,j )i,j∈S auf dem abzählbaren Zustandsraum S
an. Sei h eine harmonische (in der Wahrscheinlichkeitstheorie P h = h ≥
0), überall auf dem Zustandsraum strikt positive Funktion. Die Doob hTransformierte ist die Markoffkette mit den Übergangswahrscheinlichkeiten
q(i, j) =
1
p(i, j)h(j).
h(i)
n)
P entsteht durch
Beachte (h(Xn ))n ist ein Martingal und das Maß Qn = h(X
h(X0 ) n
obigen Maßwechsel. Zur Interpretaion, betrachte ein terminales Ereignis A
(meßbar bzgl. σ(∪n≥m An ) für alle m) und benutze die harmonische Funktion
h(x) = Px (A). Es gilt Q = P (. | A). Das Martingal h(Xn ) konvergiert
gegen 11A und Q ist das W-maß bedingt auf das termninale Ereignis Q =
P (. | A). Der h-transformierte Prozess ist der Originalprozess bedingt auf
das terminale Ereignis A.
Ein Beispiel für einen superkritischen GWP als Markoffkette gesehen, ist
die Harris-Sevastyanov [9] Transformierte zur harmonischen Funktion n 7→ q n
mit q die Aussterbewahrscheinlichkeit. Dies ist wieder ein GWP. Er hat die
erzeugende Funktion s 7→ f (sq)
. Anschaulich gesprochen ist dies der Original
q
GWP bedingt darauf, auszusterben. (Siehe nachfolgende Erklärungen.)
Ein Maßtheoretiker würde auf demselben meßbaren Raum einen Wechsel
des Maßes vornehmen und die Zgn unverändert lassen. Ein Wahrscheinlichkeitstheoretiker würde den W-raum unverändert lassen und die Zgn ändern.
41
Beide Sichtweisen haben Ihre Bedeutung und Vorteile. Wir werden in folgenden
Abschnitten [21] beide Sichtweisen verwenden.
Der nächste Teilabschnitt entwickelt etwas Theorie und Notation, um
solche Transformierten auch für GVP nutzen zu können.
5.0.5
Maßtransformation zu einer Filtration
Seien P, Q zwei W-maße auf demselben meßbaren Raum (Ω, A) und (An )n
eine Filtration. Seien die Einschränkungen Pn , Qn der Maße auf die n-te σAlgebra An absolut stetig, etwa sei Qn << Pn . Die Radon-Nikodym Ableitung
bildet ein positives Martingal mit Erwartungswert 1. Umgekehrt ein positives
Martingal Mit Erwartungswert 1 liefert auch eine Folge von konsistenten Wmaßen Qn und damit als projektiven Grenzwert ein W-maß Q.
Wir geben zuerst einige allgemeine Sachverhalte zu Maßtransformationen
mit Martingalen an.
Ein Maß ν heißt absolut stetig bzgl. einem Maß µ, geschrieben ν << µ,
falls alle µ-Nullmengen auch ν-Nullmengen sind, (µ(A) = 0 ⇒ ν(A) = 0).
Ein Maß µ heißt singulär oder orthogonal bzgl. einem Maß ν, geschrieben
µ⊥ν, falls es eine Menge A gibt mit µ(A) = 0 und ν(Ac ) = 0. Jedes Maß ν
hat bzgl. µ eine eindeutige Zerlegung ν = νc + ν⊥ in den absolut stetigen Teil
νc und den singulären Teil νs jeweils bzgl. µ.
Der Satz von Radon-Nikodym besagt für W-maße (σ-endliche Maße),
ν << µ dann und nur dann, wenn
es eine
positive meßbare Funktion f gibt
R
R
mit dν = f dµ. (Ausführlicher gdν = f gdµ für alle positiven, meßbaren
Funktionen g.) Die Radon-Nikodym Ableitung f ist µ fast sicher eindeutig.
dν
= f (oder seltener dν = f dµ).
Wir werden auch schreiben ν = f µ oder dµ
Beachte, die Relation singulär ist symmetrisch, die Relation absolut stetig
im allgemeinen nicht. (Beispiel: P, Q seien die Bernoulliverteilung zum Parameter
1/2 bzw. 1.) Symmetrie für absolute Stetigkeit liegt vor, falls die RadonNikodym Ableitung P -fast sicher strikt positiv ist.
Sei (An )n eine Filtration (=aufsteigende Folge von σ-Algebren) bzw. die
kanonische Filtration zu einem Prozess Xn )n . (An ist die kleinste von Xi , i ≤
n aufgespannte σ-Algebra.) Eine Folge Xn von Zgn heißt adaptiert zur Filtration
(An )n falls Xn meßbar ist bezüglich An für jede natürliche Zahl n. Seien P
und Q W-maße auf dem meßbarem Raum (Ω, A). Wir benutzen Pn = P|An
für die Einschränkung von P auf die σ-Algebra An und analog Qn .
42
Proposition 15 Sei (Mn )n ein positives Martingal mit Erwartungswert 1
bzgl. der Filtration (An )n . Dann ist Qn definiert surch Qn := Mn Pn eine
projektive Familie im Sinne Qn eingeschränkt auf Am ist Qm für m < n.
Umgekehrt, sei Qn absolut stetig bzgl. Pn für alle n ∈ IN und sei Mn =
dQn
die Radon-Nikodym Ableitung von Qn bzgl. Pn . Dann ist (Mn )n ein
dPn
positives Martingal bzgl. P zu der Filtration (An )n mit Erwartungswert 1.
Beweis: Das Objekt Qn ist ein wohldefinertes W-maß. Die Projektivität wird
nachgerechnet. Sei A aus An−1 .
Qn (A) =
=
Z
ZA
A
Mn dPn =
Z
A
Mn dP =
Z
E(11A Mn | An−1 )dP
Mn−1 dP = Qn−1 (A).
Die Radon-Nikodym Ableitung ist Pn -f.s. und damit P -f.s. eindeutig. Die
Martingaleigenschaft wird nachgerechnet. Für alle A ∈ An−1 gilt
Z
A
E(Mn | An−1 )dP =
Z
A
Mn dP = Qn (A) = Qn−1 (A) =
Z
A
Mn−1 dP.
Die Eindeutigkeit der bedingten Erwartung liefert die Teilaussage.
q.e.d.
Bemerkung: Die Existenz eines projektiven Grenzwertes der projektiven
Familie (Qn )n muss separat gezeigt werden und erfordert weitere Voraussetzungen
wie polnische Räume oder die endliche Durchschnittseigenschaft. In den meisten
Fällen gibt es den projektiven Grenzwert.
Lemma 16 Sei A erzeugt von der Filtration (An )n . Seien Q, P zwei Wmaße auf (Ω, A) und die Einschränkung Qn von Q auf An absolut stetig
bzgl. der Einschränkung Pn von P auf An . Sei (Mn )n die Radon-Nikodym
Ableitung von Qn nach Pn und M der P -fast sichere Grenzwert. Es gilt
L1 (P )
Mn →n M ⇔ Q << P
M ≡ 0 P-f.s. ⇔ Q⊥P
Im Falle Q << P gilt Q = M P.
Bew: Betrachte die Menge M der A-meßbaren Mengen A, für die es eine
Folge von An -meßbaren Mengen An gibt, sodaß bzgl. dem Maß P + Q die
symmetrischen Differenz An 4A von An und A gegen 0 konvergiert.
43
M ist nicht leer und abgeschlossen bzgl. der Komplementbildung und
endlicher Vereinigung und Durchschnitt. Dies ist einfach.
• M ist abgeschlossen bzgl. abzählbarer Vereinigung.
Für An ∈ M, n ∈ IN haben wir B = ∪n An ∈ M zu zeigen. Sei BN :=
∪n≤N An und CN,n ∈ An mit (P + Q)(BN 4CN,n ) →n 0. Wähle Nn →n ∞
geeignet und argumentiere
(P + Q)(B4CNn ,n ) ≤ (P + Q)(BNn 4CNn ,n ) + (P + Q)(B\BNn ) →n 0.
•M=A
M ist eine σ-Algebra enthalten in A und enthält einen Erzeuger von A.
L1 (P )
• Mn →n M ⇒ Q << P.
Sei P (A) = 0. Dann gibt es eine Folge An -meßbarer Mengen An mit
(P + Q)(An 4A) →n 0. Dies impliziert P (An ) → P (A) = 0 und Q(An ) →n
Q(A). Aus
Q(A) ←n Q(An ) = Qn (An ) =
Z
An
Mn dPn =
Z
An
Mn dP =
Z
An
M dP →n 0
folgt die Teilaussage.
L1 (P )
• Q << P ⇒ Mn →n M und Q = M P.
Die L1 -Konvergenz ist äquivalent zur schwachen Konvergenz und der
Konvergenz des ersten Momentes. (Und äquivalent zur gleichgradigen Integrierbarkeit
der Folge, siehe Anhang.) Sei M∞ die Radon-Nikodym Ableitung von Q
bzgl. P. Es gilt E(M∞ | An ) = Mn fast sicher wegen der Eindeutigkeit der
bedingten Erwartung. Die linke Seite konvergiert in n gegen M∞ und die
rechte gegen M P-fast sicher. Daher gilt M = M∞ P -f.s. Aus EMn = 1 =
EM∞ folgt die Teilbehauptung.
• M ≡ 0 P-f.s. ⇒ Q⊥P
Sei (Mn )n eine feste Version und B das Ereignis lim inf n Mn = 0. Es gilt
P (B) = 1 nach Voraussetzung und Q(B) = 0 wegen
Q(B) ≤
=
Z
Z
1lim inf n Mn <² dQ
limninf 11Mn <² dQ
≤ limninf
44
Z
11Mn <² dQ
= limninf
≤ limninf
Z
Z
11Mn <² dQn
11Mn <² ² dPn
≤ ² →²→0 0.
• Q⊥P ⇒ M ≡ 0 P-f.s.
Es gibt eine meßbare Menge B mit Q(B) = 0 und P (B) = 1. Da B
auch in M liegt, existiert eine An -meßbare Folge An mit der symmetrischen
Differenz zu B konvergiert dem Maße P + Q nach gegen 0. Damit liefert
Z
Z
M dP ←n
An
M dP =
Z
lim Mm dP ≤ limminf
An m
Z
An
Mm dP
= limminf Qm (An ) = Q(An ) →n Q(B) = 0
die Teilbehauptung.
q.e.d.
Korollar 17 Seien Q, P zwei W-maße auf demselben meßbaren Raum (Ω, A).
Sei für jedes n ∈ IN das W-maß Qn absolut stetig bzgl. Pn und Mn die RadonNikodym Ableitung. Dann gilt auf An
(
Der Prozess
1
Mn
1
)Qn = Pn (· ∩ 0 < Mn < ∞)).
Mn
ist ein Q-Supermartingal. Es gilt
Mn → ∞ Q-f.s. ⇔ Mn →n 0 P-f.s..
Sei M der fast sichere Grenzwert des Martingals (Mn )n unter P. Es gilt
lim sup Mn < ∞Q − f.s. ⇔ Mn → M in L1 (P ).
n
Es gilt Q = M P falls lim supn Mn < ∞Q−f.s. gilt und Q⊥P im Fall lim supn Mn =
∞Q−f.s.
Beweis: Für jedes A ∈ An gilt
Z
A
Z
Z
Z
1
1
1
1
dQn =
dQn +
dQn +
dQn
Mn
A∩{0<Mn <∞} Mn
A∩{0=Mn } Mn
A∩{Mn =∞} Mn
=
Z
A∩{0<Mn <∞}
dPn + 0 + 0 = Pn (A ∩ {0 < Mn < ∞})
45
Für die Supermartingaleigenschaft argumentiere
Z
1
1
EQ (
(
| An )dQ =
dQn+1
Mn+1
A
A Mn+1
Z
= Pn+1 (A, 0 < Mn+1 < ∞) ≤ Pn (A, 0 < Mn < ∞) =
Z
A
(
• Mn → ∞ Q-f.s. ⇒ Mn →n 0 P-f.s..
Für reelle Zahlen 0 < c < d betrachte
Z
Z
1
1
1
dQn =
dQn +
dQn
P (c < Mn ) =
c<Mn <d Mn
d≤Mn Mn
c<Mn Mn
1 1
1
≤
+ Q(c < Mn < d) →n→∞ →d→∞ 0.
d c
d
Z
Da Mn fast sicher gegen M konvergiert, erhalten wir P (c < M ) ≤ lim inf n P (c <
2Mn ) = 0 für jedes c > 0 und damit M = 0 P -fast sicher.
• Mn → 0 P-f.s. ⇒ Mn →n ∞ Q-f.s..
Q(Mn < d) =
Z
Mn <c
Mn dPn +
Z
cMn <d
Mn dPn
≤ c + P (c < Mn < d)d →n→∞ c →c→0 0.
Aus der Submartingaleigenschaft ergibt sich Mn konvergiert Q-f.s. und der
Grenzwert kann nach obigem nur ∞ sein.
• lim supn Mn < ∞ Q-f.s. ⇒ Mn →n M in L1 (P ).
Wir zeigen die äquivalente Eigenschaft gleichgradige Integrierbarkeit der
(Mn )n .
sup
n
Z
Mn >c
Mn dP = sup Qn (Mn > c) = sup Q(Mn > c) ≤ Q(sup Mn > c) →c→∞ 0.
n
n
n
• Mn →n M in L1 (P ) ⇒ lim supn Mn < ∞ Q-f.s. und Q = M P.
Aus Lemma (16) wissen wir Q = M P. Mit gleichgradiger Integrierbarkeit
folgt
Z
sup Q(Mn > c) = sup
M dP →c→∞ = 0
n
n
Mn >c
und wegen der Submartingaleigenschaft lim supn Mn < ∞ Q-f.s.
Der Rest folgt aus Lemma (16).
46
q.e.d.
1
dQ
Mn
5.0.6
Maßtransformation für den GWP
Hier einige Beispiele eines Maßwechsels für den GWP gesehen als Markoffkette.
Der GWP bedingt aufs Aussterben: Sei A = {∃n Zn = 0} das
Aussterbeereignis und die Aussterbewahrscheinlichkeit q = P (A) in dem
offenen Einheitsintervall. Die Funktion x 7→ h(x) = Px (A) = q x ist eine
harmonische, strikt positive Funktion und h(Zn ) eine Martingal. Der maßtransformierte
n)
P ist eine zeithomogene Markoffkette
Prozess zu den Übergansw-keiten Qn = h(Z
h(Z0 ) n
mit den Übergangswahrscheinlichkeiten
qy
q(x, y) = x p(x, y)
q
y
und der Halbgruppe q n (x, y) = qqx pn (x, y), n ∈ IN0 . Die erzeugende Funktion
P
∗
n
y
fn,x
(s) = ∞
y=0 q (x, y)s berechnet sich zu
gn,x (s) =
Ã
fn (sq)
q
!x
.
Aus dieser Darstellung heraus identifiziert sich der Q-Prozess als ein GWP
zu der erzeugenden Funktion
s 7→ g(s) =
f (sq)
.
q
Der transformierte Prozess entspricht dem Originalprozess bedingt aufs Aussterben.
Mit Markoffkettennotation gilt
Px (Zn = y | A) =
Px (Zn = y, A)
1
= x Px (Zn = y)Px (A | Zn = y) = q n (x, y).
Px (A)
q
Bevor wir ein weiteres Beispiel einer Maßtransformierten betrachten, führen
wir GWP mit Immigration bzw. GWP mit ewigem Partikel ein.
GWP mit Immigration: Ein Galton-Watson Prozess mit Immigration
(GWPI) ist ein Prozess (Zn )n rekursiv definiert durch
Zn+1 =
Zn
X
Xn,i + Cn .
i=1
47
Die Zgn Xn,i , Cn , i, n ∈ IN0 sind unabhängig mit Werten in den positiven
ganzen Zahlen IN0 . Die X-Zgn haben alle dieselbe Verteilung und die C-Zgn
haben alle dieselbe Verteilung. Der Anfangswert Z0 ist zusätzlich unabhängig
von allem anderen gegeben, standardmäßig als eie Konstante, etwa 1.
Der Immigrationsprozess (Zn )n ist eine Markoffkette auf den positiven
ganzen Zahlen. Die erzeugende Funktion gn,x (s) = Ex sZn von Zn bei Start
in Z0 = x erfüllt die Rekursion
gn+1,x = cgn,x ◦ f
mit c(s) = EsC1 und dem Anfangswert g0,x (s) = sx . (Dies folgt direkt aus
der Rekursionsgleichung und die bedingte Erwartung genommen bzgl. Zn .)
Durch Iteration erhalten wir
gn,x = c(c ◦ f )(c ◦ f2 ) . . . (c ◦ fn−1 )fnx .
(23)
GWP mit ewigem Partikel: Die Immigration läßt sich interpretieren
als Nachkommenschaft eines ewig lebenden Partikels, das ewige Partikel nicht
mitgezählt. Wenn wir es mitzählen, ändert sich nicht viel am Prozess. Wir
erhalten für Ẑn = Zn + 1 die rekursive Beziehung
Ẑn+1 =
ẐX
n −1
Xn,i + Cn + 1.
i=1
Die erzeugende Funktion von Ẑn bei Start in Ẑ0 = x ergibt sich als
ĝn,x (s) = Ex sẐn = sEx−1 sZn = sgn,x−1 (s)
wie oben berechnet. Die Rekursion (nachrechnen) lautet
ĝn+1,x (s) =
c(s)s
gn,x (f (s)).
f (s)
GWP mit Königswahl: Eine andere Interpretation wäre, anstelle des
mitgezählten ewigen Partikels jetzt von Generation zu Generation ein Partikel,
genannt den König, pro Generation auszuwählen, welches sich mit einer
anderen Nachkommenschaftsverteilung reproduziert. Die auswahl kann mit
Gleichverteilung über alle Individuen der n-ten Generation erfolgen, oder
stets aus der Königsfamilie wird ein Nachkomme ausgewählt oder..... Die
48
Gesamtgröße der n-ten Generation ist stets die gleiche (in Verteilung) unabhängig
von der speziellen Auswahl des Königs. Wir kommen hierauf zurück.
Zn
mn
Zn
Die Transformierte zu m
n : Sei Q die Maßtransformation zum Martingal
und dem GWP Prozess (Zn )n . Es ergibt sich
q n (x, y) =
Die erzeugende Funktion gn,x (s) =
gn,x (s) =
∞
X
y n
p (x, y).
xmn
P∞
y=0
q n (x, y)sy von q n (x, .) ergibt sich als
1
s
y n
p (x, y)sy =
sDs fnx (s) = n fnx−1 (s)fn0 (s).
n
n
xm
m
y=0 xm
Sie erfüllt die rekursive Gleichung
gn+1,x (s) =
sf 0 (s)
gn,x (f (s)).
mf (s)
Dies ist dieselbe Rekursion wie für einen GWPE, wenn wir eine Verteilung
von C finden mit
sc(s)
sf 0 (s)
=
.
mf (s)
f (s)
Der maßtransformierte Prozess ist ein GWP mit Immigration zu derselben
Nachkommenschaftsverteilung (pk )k und der Immigrationsverteilung kpmk . Zu
der Immigrationsverteilung berechnen wir
c(s) =
1 X
1
kpk sk = sf 0 (s).
m k
m
(24)
Bemerkung: Der konstruierte maßtransformierte Prozess ist ein Doob htransformierter Prozess. Ein direkter Übertragungsversuch scheitert sofort
Zn
an der formalen Schwierigkeit, daß das Martingal m
n sich nicht als eine
harmonische Funktion angewandt auf Zn darstellen läßt. Wir benötigen den
Umweg über Raum-Zeit Prozesse.
Sei (Xn )n eine Markoffkette mit den Übergangswahrscheinlichkeiten
m,n
(p (i, j))i,j∈S , m ≤ n ∈ IN0 . Der Raum-Zeit Prozess ist eine Markoffkette
mit dem Zustandsraum S̃ = S × ZZ und den Übergangsmatrizen
p̃m,n ((i, s), (j, t)) = 11t−s=n−m pm,n (i, j)
49
m ≤ n ∈ IN0 . Eine harmonische Funktion für diese Markoffkette ist eine
P
positive Funktion h auf dem Raum-Zeitzustandsraum S̃ mit h(i, m) = j,t p̃m,n ((i, m), (j, t))h(j, t
für alle n ≥ m. Mit der Notation hn = h(., n) schreibt sich die Harmonizität
für den Raum-Zeit Prozess als
hm = P m,n hn .
Der Doob h-transformierte Raum-Zeitprozess hat die Übergangsw-keiten
q̃ m,n ((i, s), (j, t)) =
h(j, t) m,n
p̃ ((i, s), (j, t)).
h(i, s)
Falls h faktorisiert (h(i, m) = f (i)g(m)) mit g ein Charakter, g(x + y) =
g(x)g(y), und die Markoffkette zeitlich homogen ist, (pm,n = pm−n ), folgt
q̃ m,n ((i, s), (j, t)) =
f (j)
pn−m (i, j).
f (i)g(m − n)
Die linke Seite ist die Übergangsmatrix einer zeitlich homogenen MK.
Der GWP Zn ist eine zeitlich homogene MK, die Funktion h(x, n) = mxn
ist eine faktorisierende harmonische Funktion mit dem Charakter g(n) = m1n .
5.1
Maßtransformation für den GVP
Wir konstruieren eine spezielle Prozessversion der Maßtransformierten zum
Zn
Martingal m
n . Dies ist der Königsprozess oder Rückgratprozess (im Englischen
Spine). Der Königsprozess hat entlang dem Rückgrat (in der Königslinie) eine
andere Nachkommenschaftsverteilung als die anderen Individuen.
Königsprozess: Mathematisch ist der Königsprozess ein GVP mit Immigration
analog zum GWP mit Immigration. Wir benutzen einen GVP mit einem
zufällig ausgewählten Pfad, wobei die Kantengewichtsvektoren für Knoten
auf dem Pfad durch uiv Zgn. geändert werden. Die Kantengewichtung auf
dem ausgewählten Pfad entscheidet die L1 -Konvergenz des Z-Martingals.
Definiere ein neues Maß µ̂ auf IRIN durch
Z
gdµ̂ = EP (g(W )
X
)
m
(25)
mit W = (W1 , W2 , . . .), X = i Wi für alle positiven, meßbaren Funktionen
g : IRIN → IRIN . (Vergleiche mit (24).) Die rechte Seite ist eine lineare,
P
50
positive und σ-stetige Abbildung auf Funktionen, die die 1 auf die 1 abbildet.
Daher existiert das Wahrscheinlichkeitsmaß µ̂.
Sei Ŵ stets eine Zg mit Werten in IR+ IN und Verteilung µ̂ bezüglich dem
Wahrscheinlichkeitsmaß P,
EP (g(Ŵ )) =
Z
gdµ̂ = EP g(W )
X
.
m
Beachte weiterhin X̂ := i Ŵi ist P -fast sicher strikt positiv. (P (X̂ = 0)) =
E11{0} (X̂) = E X
11 (X) = 0.)
m {0}
Sei (Ŵ , A), A steht für Auswahl des Königs, eine Zg mit Werten in IR+ IN ×
IN. Hierbei ist Ŵ wie oben und die Verteilung der Zg  ist gegeben durch
P
P (A = i | Ŵ ) =
Ŵi
.
X̂
Damit ist die Verteilung von (Ŵ , A) wohlbestimmt und es gibt Zgn mit dieser
Verteilung. Zum Beispiel bei gegebenem Ŵ wähle eine gleichverteilte Zg U
und definiere A als dasjenige i welches genau
i−1
X
Ŵj
j=1
X̂
≤U <
i
X
Ŵj
j=1
X̂
erfüllt. Dies tut es. Wir haben an dieser Stelle X̂ > 0 P f.s. benutzt. Die
gemeinsame Verteilung von (Ŵ , Â) berechnet sich hieraus zu
E(11A=i g(Ŵ )) = E(g(Ŵ )E(11A=i | Ŵ ) = E(g(W )
Wi
).
m
(26)
Seien W (v), v ∈ V, (Ŵ n , An ), n ∈ IN0 unabhängige Zgn. Die Zgn W (v), v ∈
V geben die uiv Kantenvektoren für einen GVP und die Zgn (Ŵ n , An )
haben die Verteilung von (Ŵ , A). Die unendliche Folge (A0 , A1 , A2 , . . .) der
Auserwählten heißt Königspfad oder Rückgrat (oder Spine in Denglisch).
Anschaulich, im Knoten v des Pfades wird das Kind A|v| auserwählt.
Definiere die Kantengewichtsvektoren W̃ durch
W̃ (v) :=
(
Ŵ |v|
W (v)
falls
51
v = A|v|−1
.
sonst
Dieser Prozess heißt Königsprozess oder Rückgratprozess. (Für Dengländer
auch Spineprozess.)
Zn
Die Maßtransformierte des GVP Sei Qn = m
n Pn die Maßtransformation
Zn
auf der Filtration An = σ(W (v), |v| < n) zu dem P -Martingal m
n.
Lemma 18 Die Verteilung der Kantengewichtsvektoren (W (v))v∈V<n unter
Qn ist genau die Verteilung des Königsprozesses (W̃ (v))v∈V<n unter P für
alle n ∈ IN.
Beweis: Sei ϕn , ϕ̃n : Ω → (IRIN )V<n , ϕn = (W (v))v∈V<n die Projektion des
original GVP bzw. des Königsprozesses bis zur n-ten Generation (aussschließlich).
Für die Verteilungsgleichheit
Pn (ϕ̃n ∈ B) = Qn (ϕn ∈ B)
(27)
für alle borelmeßbaren Mengen B aus (RIN )V<n reicht es für alle w ∈ Vn zu
zeigen
Ww
(28)
E11A|n =w 11ϕ̃n ∈B = E n 11ϕn ∈B
m
mit A|n = (A0 , A1 , . . . , An−1 ). Denn eine einfache Rechnung zeigt
Pn (ϕ̃n ∈ B) =
X
w∈Vn
Qn (ϕn ∈ B) =
E11A|n =w 11ϕ̃n ∈B
X
w∈Vn
E
Ww
11ϕ ∈B .
mn n
Für die Aussage (28) reicht es Zylindermengen B = v∈V|n Bv mit Bv
borelmeßbar aus RIN ) zu nehmen. Sei gv = 11Bv . Beachte die Produktformen
Qn−1
Qn−1
11A|n =w = j=0
11Aj =wj+1 und vom Pfadgewicht Ww = j=0
11Wwj+1 (w|j ).
Q
Linke Seite

= E 

= E 

n−1
Y
= 
j=0
Y
V<n 3v¹w
n−1
Y
j=0

gv (W̃ (v)) 
Y
V<n−1 3v6¹w
j

(gw|j (Ŵ )11Aj =wj+1 ) 

E(gw|j (Ŵ j )11Aj =wj+1 )
52

gv (W̃ (v))
Y
V<n−1 3v6¹w
Y
V<n−1 3v6¹w

gv (W (v))
Egv (W (v))
Rechte Seite




Y
Y
Ww
gv (W̃ (v))
= E n 
gv (W̃ (v)) 
m
V<n 3v¹w
V<n−1 3v6¹w


n−1
Y

Wwj+1 (w|j )   Y
= E  (gw|j (W (w|j ))
)
gv (W (v))
m
j=0
V<n−1 3v6¹w

n−1
Y
!
Ã
Y
Wwj+1 (w|j ) 
Egv (W (v))
E gw|j (W (w|j ))
= 
m
j=0
V<n−1 3v6¹w
Ein Vergleich mit Hilfe von 26 zeigt die Gleichheit
Egw|j (Ŵ j )11Aj =wj+1 = Egw|j (W (w|j ))
Wwj+1 (w|j )
m
für alle j.
q.e.d.
Lemma 19 Die Folge (Qn ) von W-maßen ist eine projektive Familie mit
einem projektiven Grenzwert, genannt Q, auf der von An erzeugten kleinsten
σ-Algebra. Die Verteilung der Kantengewichtsvektoren (W (v))v∈V unter Q
ist genau die Verteilung des Königsprozesses (W̃ (v))v∈V unter P.
Beweis: Die beiden σ-Algebren An und die Borelsche Bn auf (IRIN )V<n sind
isomorph, siehe Anhang. Die Isomorphie ist ϕ−1 : Bn → An . Wir können
daher Qn auf (Ω, An ) mit einem Maß µn auf (IRIN )V<n , Bn ) identifizieren. Die
(Qn )n bilden eine projektive Familie und ebenso die (µn )n bzgl. der üblichen
Projektion. Da µn auf Borelräumen lebt, liefert der Satz von Kolmogoroff ??,
einen projektiven Grenzwert µ der µn . Das W-maß Q, Q(·) = µ(ϕ∞ (·)), ist
der projektive Grenzwert der Folge (Qn ). Der projektive Grenzwert lebt auf
der kleinsten von An erzeugten σ-Algebra.
Da die W-maße P und Q auf einem Erzeuger übereinstimmen, sind sie
gleich.
q.e.d.
5.2
Regularitäet des Martingals Mn .
Zn
Wann ist das Martingal Mn = m
n ein reguläres Martingal, d.h. L1 konvergent
gegen M ? Verbunden damit ist die Frage, wann der obige projektive Grenzwert
sich als transformeirte Q = M P schreiben läßt. Die Konvergenzfragestellung
ist äquivalent zur gleichgradigen Integrierbarkeit 50 der Familie (Mn )n von
Zgn.
53
Für den GWP ist die L1 -Konvergenz äquivalent zur sogenanten L-log-LBedingung nach einem Satz von Kesten und Stigum [15].
Satz 20 (Kesten-Stigum) Für eine superkritischen GWP sind äquivalent
• EZ1 ln Z1 < ∞
• P (M > 0) > 0
• EM = 1
• Mn →n M in L1 .
• E supn Mn < ∞.
Als Folgerung bekommen wir die Dichotomie entweder EM = 1 oder EM =
0. Der Beweis von Kesten-Stigum oder andere zum Satz, [3], lassen sich
nicht auf den GVP übertragen, da an irgendeiner Stelle entscheidend ein
Zählargument eingeht, das Pfadgewicht Wv ist 1 oder 0. (Diese Bedingung
ließe sich für den GVP kopieren unter der Bedingung Wv ist 0 oder gleichmäßig
von 0 weg beschränkt.)
Wir präsentieren hier den konzeptionellen Beweis von Lyons, [20] bzw.
Lyons, Pemantle, Peres [21] mit Hilfe einer geschickten Maßtransformation.
Die beiden Fälle EM = 1 bzw. M ≡ 0 P-fast sicher entsprechen nach der
Proposition 16 den Fällen Mn konvergiert fast sicher unter dem transformierten
Qn
= Pn ). Auf
Maß Q gegen eine endliche Zg oder gegen unendlich (betrachte M
n
dem Originalwahrscheinlichkeitsraum entsprechen diese Fälle genau (M̃n )n
konvergiert fast sicher unter dem Maß P gegen eine endliche Zg oder gegen
unendlich. Dies werden wir zeigen.
Wir benutzen die Notation wie eben. Zur Abkürzung verwenden wir a =
P i
P
i
E ln ŴmA = E i W
ln W
und b = E ln X̂
= E( X
ln X
) mit X = i Wi . Der
m
m
m
m
m
Erwartungswert a sei wohldefiniert im Lebesguesinne, wobei wir die Werte
∞ oder −∞ zulassen.
Satz 21 Der Erwartungswert des Martingalgrenzwertes M unter dem Maß
P ist entweder 1 oder 0.
• Sei a = ∞ oder b = ∞ und a > −∞. Dann gilt M = 0 P-fast sicher.
• Sei jetzt b < ∞.
54
(i) Sei ln m ≤ a < ∞. Dann gilt M = 0 P-fast sicher.
(ii) Sei a < ln m. Dann gilt EM = 1.
Beweis: Sei M der fast sichere Grenzwert des positiven Martingals Mn =
Der Rückgratprozess Z̃n erfüllt eine rekursive Beziehung
X
Z̃n =
Zn
.
mn
Ŵi0 Zn−1 (i) + ŴA0 0 Z̃n−1 (A0 ).
i6=A0
Hierbei benutzen wir Zm (i) für das Gesamtknotengewicht der m-ten Generation
im Baum iV. Diese Beziehung iterieren wir. Sei U i =
Y k :=
k−1
Y
Ŵ i i
A
m
und Y k das Produkt
U i.
i=0
Leichter ist die rekursive Definition Y 0 = 1 und Y k := Y k−1 Ui . Sei M̃n =
Z̃n = ŴA0 0 Z̃n−1 (A0 ) +
X
Z̃n
.
mn
Ŵi0 Zn−1 (i)
i6=A0
M̃n = U0 M̃n−1 (A0 ) +
X Ŵ 0 (i)
i6=A0
m
= U0 U1 M̃n−2 (A0 A1 ) + U0
Mn−1 (i)
X Ŵi1
i6=A1
n
= Y +Y
n−1
X
i6=An−1
+ Y2
X Ŵi2
i6=A2
≥ Y n−1
m
m
Mn−2 (A0 i) +
X Ŵi0
i6=A0
m
Mn−1 (i)
Ŵin−1
+ ...
m
Mn−3 (A0 A1 i) + Y 1
X Ŵi1
i6=A1
m
Mn−2 (A0 i) +
X Ŵi0
i6=A0
m
Mn−1 (i)
X̂ n−1
m
Der Summand mit Y k anfangend bezeichnet den Beitrag aller Knoten, deren
Vorfahren bis zur k-ten Generation einschließlich Könige waren und anschließend
Bürgerliche.
55
Die Zgn Y n−1 sind ein Produkt von n uiv Faktoren mit Verteilung U =
ŴA
. Der Erwartungswert von ln U berechnet sich zu
m
E ln U = E
X Ŵi
i
X̂
ln
Ŵi
X X Wi Wi
= E(
ln
= a.
m
m i X
m
Das starke Gesetz der Großen Zahl 7 impliziert die fast sichere Konvergenz
ln Y n →n→∞ a
gegen den Erwartungswert a, wobei wir die Werte +∞ und −∞ zulassen.
• a = ∞ impliziert lim supn M̃n = ∞ P -f.s.
Verwende aus obiger Abschätzung
ln M̃n ≥ ln Y n−1 + ln
X̂ n−1
.
m
(29)
Das starke Gesetz der großen Zahl liefert die Aussage.
• b = ∞ und a > −∞ impliziert lim supn M̃n = ∞ P -f.s.
In der Abschätzung (29)
n−1
ln X̂m
1
1
ln M̃n ≥ ln Y n−1 +
n
n
n
(30)
ist der erste Term auf der rechten Seite fast sicher nach unten beschränkt
n−1
ln X̂ m
und konvergiert nach dem starken GGZ gegen a. Die Ereignisse
≥c
n
treten nach Borel-Cantelli unendlich oft ein für jedes c > 0. (Die Ereignisse
P
n−1
sind unabhängig und n P (ln X̂m ≥ nc) = ∞, da der Erwartungswert b
von ln X̂
unendlich ist.)
m
• b < ∞ und 0 < a < ∞ impliziert lim supn M̃n = ∞ P -f.s.
In der Abschätzung (30) konvergiert der erste Term auf der rechten Seite
ln
X̂ n−1
nach dem starken GGZ gegen a > 0. Es reicht also lim supn nm ≥ a2 zu
zeigen. Dies folgt z.B. aus Borel-Cantelli.
• b < ∞, a = 0 und WA keine Konstante impliziert lim supn M̃n = ∞
P -f.s.
Nach einem Satz von Spitzer Kesten-Spitzer [14] gilt für jede Irrfahrt
Sn , d.h. n-te Partialsummen von uiv zentrierten nicht ausgearteten Zgn,
56
lim supn Sn = ∞ P -f.s. Im Fall a = 0 ist ln Y n−1 eine Irrfahrt und der Limes
superior P -f.s. ∞. Sei ni → ∞ eine (meßbare) Folge mit limi ln Y ni = ∞. Die
Folge X̂ ni ist unendlich oft größer als ein vorgegebenes c mit P (X̂ > c) > 0.
(Verwende wieder Borel-Cantelli wie oben.) Aus beiden Aussagen folgt die
Teilbehauptung.
• b < ∞, a = 0 und ŴA eine Konstante, aber X nicht, impliziert M ≡= 0
P -f.s.
Sei W identisch die Konstante c. Aus der Maßtransformation Eg ŴA =
P i A
gWi für alle positiven meßbaren g erkennt man Wi = c oder 0. Der
E iW
m
Prozess mit den Kantengewichten Wc i ist ein GWP. Aus
0=a=E
X Wi
i
m
ln
Wi
X
c
c
= E ln
= ln
m
m m
m
folgt c = m und E i Wc i = 1. Ein GWP mit durchschnittlicher Nachkommenschaft
m = 1 stirbt fast sicher aus, es sei denn, die Nachkommenschaft ist identisch
1. (Dieser Fall war prinzipiell ausgeschlossen und entspräche hier X ist ebenfalls
eine Konstante.)
• lim supn M̃n = ∞ P -f.s. impliziert M ≡= 0 P -f.s.
Die Verteilung von Z̃n unter P entspricht der Verteilung von Zn unter Qn .
Daher gilt lim supn Mn = ∞ unter Q. Das Korollar 17 liefert das gewünschte.
• b < ∞ und a < 0 impliziert Mn konvergiert in L1 (P ).
Sei Y die σ-Algebra erzeugt von allen Zgn (Ŵ i , Ai ). Durch Iteration, wie
oben ausgeführt, erhalten wir
P
E(M̃n | Y ) =
n−1
X
i=0
Yi
X̂ i
+Yn
m
E M̃n = E(E(M̃n | Y)) =
=
n−1
X
n−1
X
i=0
E(Y i )E(
X̂ i
) + E(Y n )
m
ci d + cn
i=0
i
mit c = E(U ) und d = E X̂m . Wegen EU ≤ ea < 1 (Jensen Ungleichung) ist
dies eine geometrische konvergente Reihe. Es folgt limn E M̃n < ∞.
Dies impliziert EQ Mn < ∞ unter dem Mass Q.Da Mn bzw M1n fast sicher
unter Q konvergieren, erhalten wir lim supn Mn < ∞ Q-f.s. Das Korollar (17)
liefert die Teilbehauptung.
57
q.e.d.
Der Satz von Kesten-Stigum ist ein Korollar unseres Satzes 21.
5.2.1
Der Spineprozess als GVP
Die obige Maßtransformation bildet einen GVP mit Zustandsraum IR+ auf
einen GVP ab mit einem anderen Zustandsraum. Mathematisch gesehen
verbleibt man in derselben Klasse unter der Masstransformation. (Dieser
Abschnitt ist nicht wichtig für alles folgende, beim ersten Lesen überschlagen.)
..................................................
Wenn der Spineprozess ein GVP ist, brauchen wir zumindest zwei verschieden
Typen von Individuen, Prinz oder nicht Prinz. Weiterhin müssen wir das
Problem beseitigen, dass die Nachkommenschaft des n-ten Prinzen durch
eine Zgn beschrieben wird, die von der jeweiligen Generation abhängt, aber
nicht von der Familie. (Prinzen verschiedener Familien in derselben n-ten
Generation haben dieseben Nachkommen (Ŵ n , An ). Zuerst einige andere
Betrachtungen.
GVP mit Immigration. Wir betrachten den Prozess ohne die Königsfamilien.
Die Nichtprinzen der Königsfamilie werden dem Prozess als Immigranten
zugefügt und vermehren sich anschließend wie normale Individuen. Die Verteilung
der Folge der Gesamtgewichte in den Generationen ist dieselbe wie für den
Spineprozess.
GVP mit ewig lebendem Individuum. Im obigen Modell sehen wir
den jeweiligen Prinzen als dasselbe, ewig lebende Individuum versehen mit
Generationenweise wechselndem Gewicht. Dieses wird an die Kinder entsprechend
weitergegeben. Die Gewichte sind dieselben wie im Immigrationsprozess, nur
die Interpretation ist verschieden.
Umnummerierung. Wir ändern die Namensgebung etwas. Die Prinzen
erhalten als Namen im Baum stets Folgen bestehend nur aus Einsen. Es
verbleibt einen Prozess zu definieren, der zwei verschieden Typen von Individuen
hat und ein GVP ist. Dies wird in Allgemeinheit im nächsten Beispiel beschrieben.
Die Verteilung der Folge der Gesamtgewichte in den Generationen für diesen
Prozess ist dieselbe wie für den Spineprozess.
GVP mit Matrixen. Wir verwenden als S den Raum der 2×2 Matrixen
mit der üblichen Matrizenmultiplikation als Verknüpfung.
Seien W (v), Ŵ (v), A(v)), v ∈ V unabhängig identisch verteilte Zgn. Hierbei
seien W (v) wie eben und (Ŵ (v), A(v)) habe die masstransformierte Verteilung.
58
Definiere die Kantengewichte durch
W i (v) =
Ã
Wi (v)
0
11A(v)6=i Ŵi (v)
11A(v)=i Wi (v)
!
.
Sei Z n das Gesamtkontengewicht |v|=n L(v) in n-ter Generation. Ei x0 der
Vektor (1, 0) und x1 der Vektor (0, 1). Dann hat (Z n x0 )n die Verteilung wie
der Original W -GVP und (Z n x1 )n wie der Spineprozess.
Der allgemeine Weg. Wir konstruieren einen GVP (V, (S, σ(S), ◦), W , L)
einschließlich einer Abbildung ◦S,R in die reale Welt, so dass die Beobachtung
von (Z n ) sich als (Zn )n ergibt.
Der Zustandsraum S bestehe aus den Funktionen von S1 × S2 in sich
selbst. Hierbei sind S1 = {0, 1} und S2 = [0, ∞). (Die Markierung als Prinz
erfolgt durch 1 aus S1 und das eigentliche Gewicht wird durch eine reelle Zahl
aus S2 gegeben.) Die betrachteten Zustände sind die Funktionen f werden
mit einem Tupel (z, x, y) S1 × S2 × S2 identifiziert, durch
P
f (s1 , s2 ) = (zs1 , 11s1 =0 xs2 + 11s1 =0 ys2 ).
Die Komposition von zwei Funktionen f ↔ (z, x, y) ergibt sich durch
f ◦ f ↔ (zz, xx, 11z=0 xy + 11z=0 yy).
Die reale Welt ist R = S1 × S2 (Typ des Partikels und Gewicht) mit der
Verknüpfung ◦S,R als f ◦S,R (s1 , s2 ) = f (s1 , s2 ).
Seien W (v), Ŵ (v), A(v)), v ∈ V unabhängig identisch verteilte Zgn. Hierbei
seien W (v) wie eben und (Ŵ (v), A(v)) habe die masstransformierte Verteilung.
Definiere die Kantengewichte durch W i (v) ↔ (11A(v) = i, Wi (v), Ŵi (v)). Dann
hat die Familie der Knotengewichte L(v) ◦S,R (1, 1))v dieselbe Verteilung wie
Q
(L(v))v . (Der Beweis via den massbestimmenden Produkten v gv und einer
Induktion ist länglich ohne Besonderheiten und wir überschlagen ihn.)
Der Königspfadprozess Dies ist ein spezieller GVP. Die Kantengewichte
P
Wi sind positiv und erfüllen i Wi = 1. In n-ter Generation sind alle Gewichte
0 bis auf genau ein v mit Gewicht L(v) = 1. Alle diese Knoten mit Gewichte
1 liegen auf einem Pfad nach unendlich. Definiere den unendlichen Pfad
S ∈ IN IN durch L(S|n = 1. (Oder rekursiv S0 = ∅, S1 = i mit demjenigen I
welches W (∅, i) = 1 erfüllt. S2 = W (S1 , s1 i) = 1 usw. Die Rekursionsformel
lautet, Sn+1 = i) mit W (S|n , S|n i) = 1 mit S = (S1 , S2 , . . .). Die leere Menge
wird in der Indizierung weggelassen.)
59
Rückgratprozess als GVP Definiere ein neues Maß µ̂ auf IRIN durch
Z
gdµ̂ = EP (g(W )
X
)
m
mit X = i Wi für alle positiven, meßbaren Funktionen g : IRIN → IRIN . Die
rechte Seite ist eine lineare, positive und σ-stetige Abbildung auf Funktionen,
die die 1 auf die 1 abbildet. Daher existiert das Wahrscheinlichkeitsmaß µ̂.
Sei Ŵ stets eine
Zg mit Verteilung µ̂ bezüglich dem Wahrscheinlichkeitsmaß
R
P
P, EP (g(Ŵ )) = gdµ. Beachte weiterhin X̂ := i Ŵi > 0 fast sicher. (Die
Menge X̂ = 0 hat µ̂-Maß 0.)
Sei (W 2 , W 3 ) mit Index 2, 3 eine Zgn mit Werten in IR+ IN × IN. Die
Verteilungsfunktion der W 2 Kantengewichte ist durch µ̂ wie oben gegeben
P
und die Verteilung von W 3 wird gegeben durch, 0 ≤ Wi3 , i Wi3 = 1 und
den bedingten W-keiten
P
P (Wi3 = 1 | W 2 ) =
Wi2
X̂
mit X̂ = i Wi2 .
Es bedarf eines Arguments, daß wir eine Verteilung (W 2 , W 3 ) mit dieser
Eigenschaft wählen können. Zum Beispiel sei U eine von W unabhängige
Zg mit einer gleichmäßigen Verteilung auf [0, 1). Dann definiere Wi3 = 1 für
dasjenige i welches genau
P
i−1
X
j=1
Wj2 ≤ U
X
j∈IN
Wj2 <
i
X
Wj2
j=1
erfüllt. Dies tut es. Wir haben an dieser Stelle j Wj2 > 0 P -f.s. benutzt. Die
gemeinsame Verteilung berechnet sich hieraus zu
P
E(Wi3 g(W 2 )) = E(g(W 2 )Wi3 ).
(31)
Seien W 1 (v), (W 2 (v), W 3 (v)), v ∈ V, unabhängige Zgn. Die Zgn W (v)
sind die original Kantengewichte eines GVP, die (W 2 , W 3 ) Zgn wie oben
definiert.
Hier ist eine algorithmische und verbale Beschreibung des Spineprozesses.
Am Anfangspunkt ∅ wähle das Kantengewichte W 2 (∅) und setze S1 als
dasjenige Kind i fest mit W 3 (∅) = i. In erster Generation starte von jedem
60
Individuum v ungleich S1 einen ordinären GVP mit den Kantengewichten
W 1 (v) wie bisher. Für das Individuum S1 , dem Prinzen in der ersten Generation,
wähle als neue Kantengewichte (von der ersten zur zweiten Generation)
die Zgn W 2 (S1 ). Der Prinz (S1 , S2 ) in zweiter Generation wird der Knoten
v ∈ V2 mit L3 (v) = 1. Alle anderen Knoten in zweiter Generation bekommen
Nachkommen wie der gewöhnliche GVP, der Prinz (S1 , S2 ) hat Nachkommen
gegeben durch W 2 mit der maßtransformierten Verteilung und wählt W 3
einen neuen Prinzen in der nächsten Generation usw.
Für die formale Beschriebung als GVP seien fa,b,c : IR2 → IR2 , a, b, c ∈ IR
die Funktionen
fa,b,c (x, y) = (11cy6=1 ax + 11cy=1 by, cy).
Betrachte den GVP mit den Kantengewichten
W̃ (v) = fW 1 (v),W 2 (v),W 3 (v) .
Die Knotenlängenfunktion sei L̃(v) = (L̃1 (v), L̃2 (v)).
Jedem Knoten v ordnen wir als Knotengewicht die Projektion C(v) = C
des IR2 auf die erste Koordinate zu. Der Prozess
V 3 v 7→ C L̃(v)(1, 1)
von Knotengewichten heißt Rückgratprozess oder Spineprozess. Die Menge
der Knoten v mit einer zweiten Koordinate 1 von L(v)(1, 1) liegen alle auf
einem Pfad, dem Königspfad. (Betrachte den GVP mit Kantengewichten
W 3 (v) und dessen Knotenlängen. Diese geben den Königspfad.) Das Rückgrat
oder Spine des Prozesses ist dieser Pfad S = (S1 , S2 , S3 , . . .) der Auserwählten.
61
6
Maximum
In diesem Abschnitt betrachten wir einen nicht ausgearteten gewichteten
Verzweigungsprozess mit positiven Kantengewichten. Unser Hauptinteresse
P
gilt dem Tailverhalten des zufälligen Maßes νn = |v|=n δWv und dessen
Funktionen
ξn (t) := νn ([t, ∞)) =
Fn (t) := Eξn (t)
X
|v|=n
11Wv ≥t
(32)
(33)
für t > 0.
Die Funktion Fn erweist sich als n−fache Faltung von F1 . Die Theorie
großer Abweichungen liefert dann das asymptotische Verhalten
ln Ln
→n a0
n
für den maximalen Wert
Ln := sup Wv
|v|=n
in n-ter Generation, Korollar 27. Der Wert a0 ist die Nullstelle I(a0 ) = 0 der
P
Fenchel-Legendre Transformation I zu α 7→ m(α) = E i Wiα .
6.1
Faltungseigenschaft
Wir benutzen F = F1 . Als monoton fallende Funktion korrespondiert F zu
einem Maß
dF auf den strikt positiven reellen Zahlen IR> = (0, ∞). Wir
R
benutzen f dF = F (f ) für Funktionen f, fallls wohldefiniert. Sei F n∗ die nfache Faltung von F (bzw. dF ) bezüglich der multiplikativen Gruppe (IR> , ·)
Z
n∗
f (x)dF (dx) =
Z
...
Z
f (x1 x2 . . . xn )dF (x1 ) . . . dF (xn )
für alle positiven meßbaren Funktionen f.
Proposition 22
Fn = F n∗
62
(34)
Bew: Wir zeigen die Behauptung durch Induktion nach n. Für den Induktionsschritt
n → n + 1 benutzen wir die Vorwärtsdarstellung. (Die Rückwärtsdarstellung
wäre analog möglich.) Sei f eine positive meßbare Funktion.
Fn+1 (f ) = E
X X
|v|=n i∈IN
=
X
E
|v|=n
Z
X
f (Wvi ) =
E(E(
|v|=n
f (Wv x)dF (x) =
X
i∈IN
Z Z
f (Wv Wi (v)) | Wv ))
f (xy)dF (x)dFn (dy)
= (Fn ∗ F )(f ) = F (n+1)∗ (f ).
q.e.d.
6.2
Das Tailverhalten von Fn .
Wir benutzen im folgenden
m(α) := E
∞
X
Wiα
m0 (α) := E
i=1
X
m00 (α) := E
Wiα ln Wi
Wi >0
X
Wiα ln2 Wi
Wi >0
für α > 0, falls die Terme wohldefiniert sind als absolut konvergierende
Reihen. Falls m differenzierbar ist, sind dies die entsprechenden Ableitungen
von m. Sei
m0 (α)
J(a) := ln m(α) − aα
J = J(a(α)).
a(α) :=
m(α)
Satz 23 Sei α eine strikt positive reelle Zahl mit 0 < m(α) < ∞. Dann gilt
für jede reelle Zahl a und jede positive reelle Zahl b
Fn (bean ) ≤ b−α enJ(a)
(35)
an
ln Fn (be )
lim sup
≤ J(a).
(36)
n
n→∞
Ist m0 (α) eine wohldefinierte reelle Zahl, so gilt für alle a < a(α) ∈ IR und
b>0
ln Fn (bena(α) )
= J
n
Sei 0 < m00 (α) < ∞. Dann gilt für jedes b > 0
lim
n→∞
lim
n→∞
√
ln Fn (bena(α) )
n
− J) = 0
n
Ã
!
63
(37)
(38)
Bew: Mit dem Erwartungswert auf beiden Seiten der Markoff Abschätzung
ξn (t) =
X
|v|=n
11Wv ≥t ≤
X Wvα
|v|=n
tα
=
Zn(α)
tα
(39)
und t = bean eingesetzt ergibt
ξn (t) ≤
Zn(α) nJ(a) −α
e
b
mn (α)
(40)
und die Aussage (35).
Die Aussage (36) ist eine direkte Folgerung aus (35).
a(α)n )
≥ J zu
Wegen (36) reicht es die untere Abschätzung lim inf n ln Fn (ben
zeigen. Definiere das W-mas̈ µ̂ zu dem W-mas̈ µ mit Verteilungsfunktion F
durch
Z
Z
xα
f (x)µ̂(dx) = f (x)
dµ(x)
m(α)
für alle positiven mes̈baren Funktionen f. Dieses existiert.
P
Seien Yn , n ∈ IN uiv Zgn mit Verteilung µ̂ und Sn = ni=1 ln Yi die n−te
Partialsumme der logarithmierten Zgn.. Beachte
E ln Y = E
1 Z α
m0 (α)
= a(α)
x ln x ν(dx) =
m(α)
m(α)
und die Verteilung von eSn =
µ̂n∗ mit
Qn
i=1
µ̂n∗ (dx) :=
Yi ist die n-fache multiplikative Faltung
xα
µn∗ (dx).
n
m (α)
Damit erhalten wir, t = bean
Fn (t) =
Z
11t≤x µn∗ (dx)
n
= m (α)
Z
11t≤x x−α µ̂n∗ (dx)
= mn (α)E11t≤eSn e−αSn
≥ mn (α)e−αn(a(α)+²) E11 ln b +a≤ Sn ≤a(α)+² .
n
n
Der Erwartungswert konvergiert für n → ∞ gegen 1 wegen der fast sicheren
Konvergenz Snn → a(α). Mit ln und lim inf auf beiden Seiten und dann ² → 0
folgt die untere Abschätzung für (37).
64
Für die Aussage 38 zeige zuerst die Wohldefiniertheit von m0 (α) ∈ IR.
(Übung). Die Ungleichung (36) liefert den oberen Grenzwert 0.
Nun zum unteren Grenzwert. Sei Sn wie oben. Die Zgn Sn∗ = Sn√−na(α)
, mit
nσ 2
00
(α)
− a2 die Varianz von ln Y, konvergiert nach dem ZGS gegen eine
σ 2 = mm(α)
standard Gaußverteilung. Wir erhalten mit einer noch wählenden Konstanten
c>0
Fn (bena(α) ) = mn (α)e−αna(α) E11 √ln b
≥ enJ e−α
√
nσ 2
nσ 2 c
E11 √ln b
nσ 2
−α
∗e
≤Sn
√
∗
nσ 2 Sn
∗ ≤c
≤Sn
Der Erwartungswert =: en in obiger Gleichung wird für gros̈e n nach dem
zentralen Grenzwertsatz dicht bei 0 < Φ(c)−Φ(0) < 1, Φ die Verteilungsfunktion
der Normalverteilung, liegen. Wir erhalten
limninf
√
n(
ln en
ln Fn (bena(α) )
− J) ≥ −αcσ + limninf √ →n −αcσ.
n
n
Mit c > 0 klein genug erhalten wir die Teilbehauptung.
q.e.d.
Bemerkung 24 Einige Ergebnisse lassen sich auch erzielen falls m0 (α) nicht
wohldefiniert ist oder den Wert ∞ annimmt. [12]
6.3
Das Tailverhalten des zufälligen Maßes νn
Wir betrachten das asymptotische Verhalten von ξn (t) = v∈Vn 11Wv ≥t . Dies
ist nur auf der Überlebensmenge U interessant, wenn nicht alle Pfadgewichte
einer Generation Null sind.
Die Markoff Ungleichung (39) liefert auch punktweise eine obere Abschätzung.
Zusammen mit Martingalkonvergenz ergibt sich eine obere asymptotische
Schranke
M (α)
ξn (t)
≤ ∞
(41)
lim sup n
m (α)
tα
n
P
(α)
(α)
mit M∞
der Grenzwert des Martingals mZnn(α) .
Für Galton-Watson Prozesse ergeben sich untere asymptotische Schranken
leicht, da jedes Individuum das Gewicht 0 oder 1 trägt und Zn(α) = Zn gilt.
65
Der nächste Satz liefert untere asymptotische Schranken für den GVP. Wir
verwenden a(α), J wie eben.
Wir sprechen vom Galton-Watson Fall, falls es eine Konstante c gibt,
sodass alle Kantengwichte entweder 0 oder c sind.
Satz 25 Der Galton-Watson Fall sei ausgeschlossen. Sei α > 0 und 0 <
m(α) < ∞.
Für J(a) < 0 gilt für jedes b > 0 bis auf endlich viele n
ξn (bena ) = 0.
(42)
(α) −α
lim sup ξn (bena ) ≤ M∞
b .
(43)
Für J(a) = 0 gilt
n
Für J(a) > 0, m0 (α) eine wohldefinierte reelle Zahl gilt für jedes a, b > 0
lim sup
n
ln ξn (bena )
≤ J(a).
n
(44)
Auf der Überlebensmenge U gilt
lim
n
ln ξn (bena(α) )
= J.
n
(45)
Bew: Gelte J(a) < 0. In der Gleichung (40) konvergiert das positive Martingal
(α)
Zn
(α)
fast sicher gegen einen endlichen Grenzwert genannt M∞
. Daher konvergiert
n
m (α)
an
an
ξn (be ) fast sicher mit n → ∞ gegen 0. Da ξn (be ) nur ganzzahlige Werte
annehmen kann erhalten wir die erste Aussage.
Der Fall J(a) = 0 folgt wie oben aus der Martingalkonvergenz.
Sei jetzt J(a) > 0. Gleichung (40) und die Martingalkonvergenz liefern
(44).
Für a < a(α) zeigen wir zuerst lim inf n n1 ln ξn (bena ) ≥ d für jedes 0 <
P
d < J unter der zusätzlichen Voraussetzung i Wiα ist gleichmäßig nach
oben beschränkt durch c < ∞.
Für den Beweis zählen wir ausgewählte Individuen nur entlang der Generationen
mit einem Vielfachen von k als Index. Zu vorgegebenem 0 < d < J wähle ein
k ∈ IN und a < a1 < a(α) mit Fk (eka1 ) ≥ ekd > 1. Dies ist möglich nach Satz
23. Zu diesem k konstruieren wir einen GWP, Notation mit überstrichenen
66
Symbolen, auf dem Baum B = ∪n≥0 Vnk mit den Kanten (v, vw), v ∈ B, |w| =
k und den Pfadgewichten
W w (v) = 11Ww (v)≥ea1 k .
Der Baum B ist isomorph (als Graph) zu V. Die Knotengewichte W v , v ∈ B,
sind 0 oder 1.
P
Der Prozeß Z n := |v|=nk W v in n ist ein Galton-Watson Prozess. Beachte,
nach Konstruktion gilt für v ∈ B
Wv ≥ ea1 |v| W v
ξk (ea1 k ) = Z 1
ξnk (ea1 nk ) ≥ Z n .
• Der GWP (Z n )n ist superkritisch.
Die durchschnittliche Nachkommenschaft ist
m := EZ 1 = Fk (ea1 k ) ≥ ekd > 1.
• Der GWP (Z n )n ist quadratintegrierbar.
Die Nachkommenschaft Z 1 ≤ c ist beschränkt.
Zn
• Das Martingal m
n konvergiert in L2 gegen eine Zg genannt M ∞ .
Das Martingal ist gleichgradig 2-integrierbar 36 da das Supremum der
Varianzen des Martingals beschränkt ist.
• Die Menge M ∞ > 0 hat strikt positives Maß.
Folgt aus Positivität und der L2 −Konvergenz.
(ea1 kn )
> d auf der Menge M ∞ > 0.
• lim inf n ln ξknnk
Mit Monotonieüberlegungen folgt
limninf
ln ξkn (eka1 n )
ln Z n
≥ limninf
nk
nk
Zn
1
ln m
ln n +
= lim inf
n
nk m
k
ln ekd
≥ 0+
=d
k
(46)
(47)
(48)
auf der Menge M ∞ > 0.
an )
≥ d auf M ∞ > 0 für jedes b > 0.
• lim inf n ln ξn (be
n
Jedes n hat eine eindeutige Zerlegung n = mk + r mit 0 ≤ r < k. Wähle
zu für jedes r ein vr = vr (ω) ∈ V1 mit Wvr > 0 und argumentiere mit der
67
Rückwärtsgleichung
X
ξn (t) =
ξmk,v (
|v|=r
t
t
).
≥ ξmk,vr (
Wv
W vr
Hierbei ist ξi,j analog zu ξi für den Baum jV. Für t setze bean ein und
argumentiere für hinreichend große n Wbv ean ≤ ea1 mk für alle r. Der Rest
r
folgt aus dem oberen.
an )
Sei A die Menge lim inf n ln ξn (be
≥ d für jedes b > 0. Sei A(i) das
n
Äquivalent von A auf dem Teilbaum iV gestartet mit dem Gewicht 1 auf i.
• Ai ∩ {Wi > 0} ⊂ A für jedes i ∈ IN.
Die rückwärtige Betrachtung des Prozesses liefert, t = bean ,
X
ξn (t) =
ξn−1,j
j:Wj >0
Ã
t
Wj
!
≥ 11Wi >0 ξn−1,i
µ
t
.
Wi
¶
Die Summe wird nur genommen über j mit Wj > 0 (oder alternativ benutze
die Konvention 0b = ∞ für b > 0). Der Rest folgt.
• P (Ac ) ≤ f (P (Ac )) für die erzeugende Funktion f (s) = EsX , X =
P
1Wi >0 , s ∈ [0, 1].
i1
P (Ac ) ≤ P (∩j (Acj ∪ {Wj = 0}))
= lim P (∩j≤N (Acj ∪ {Wj = 0}))
N →∞
= lim
N
= lim
N
= lim
N
= lim
N
P (J = {i ≤ N | Wi > 0}, ∩j∈J (Acj ∪ {Wj = 0})
X
P (J = {i ≤ N | Wi > 0}, ∩j∈J Acj )
J⊂{1,2,...,N }
= lim
N
X
J⊂{1,2,...,N }
X
J
X
J
N
X
P (J = {i ≤ N | Wi > 0})P (∩j∈J Acj )
|
P (J = {i ≤ N | Wi > 0})P |J (Ac )
N
X
P(
l=0
= f (P (Ac ))
11Wi >0 = l)P l (Ac ) =
i=1
∞
X
P (X = l)P l (Ac )
l=0
• P (Ac ) ≤ q mit q der kleinste Fixpunkt von f in [0, 1].
68
Die Funktion f : [0, 1] → [0, 1] ist monoton steigend, strikt konvex und
stetig. Die Werte s mit s ≤ f (s) sind genau die Werte 0 ≤ s ≤ q oder s = 1.
Dies impliziert P (Ac ) ≤ q oder P (Ac ) = 1. Da A die Menge M ∞ enthält, hat
sie strikt positives Maß hat und die Aussage folgt.
• P (Ac ) = q und A = U fast sischer.
Da A eine Untermenge der Überlebensmenge U sein muss, folgt P (A) ≤
P (U ). Die Überlebensmenge U hat W-keit 1−q, Satz 4. Jetzt ergibt P (Ac ) ≤
q = P (U c ) = 1 − P (U ) ≤ P (Ac ) die Teilbehauptung.
na )
Damit haben wir lim inf n ln ξn (be
≥ J auf der Überlebensmenge U gezeigt
n
unter zusätzlichen Beschränktheitsbedingungen. Von diesen werden wir uns
jetzt lösen durch eine Abschneidetechnik 7.1. Definiere einen neuen GVP mit
den Kantengewichten
W̃i (v) := Wi (v)11P
j≤i
Wjα (v)≤c .
Der neue GVP ist eine Minorante, es gilt stets W̃v ≤ Wv .
Der neue GVP erfüllt die benötigte zusätzliche Eigenschaft und unser
Resultat liefert
ln ξ˜n (bena )
≥ J˜
(49)
limninf
n
für alle b > 0 und a < ã(α) auf der Überlebensmenge Ũ . Wegen Monotonie,
W̃v ≤ Wv , gilt (49) auch für ξ˜n ersetzt durch ξn .
Wir machen jetzt den Übergang c → ∞. Der Wert m̃(α) konvergiert
˜
(monoton) gegen m(α), m̃(α) konvergiert gegen m̃0 (α), und folglich ã(α), J(a)
gegen a(α), J(a). Die Überlebensmenge Ũ ist aufsteigend in c und eine Teilmenge
von U. 1 − P (Ũ ) ist der kleinste Eigenwert q̃ der erzeugenden Funktion
P
P
f˜(s) = n sn P ( i 11W̃i >0 = n). Da f˜ monoton gegen f aufsteigt (und schöne
Eigenschaften hat), erhalten wir q̃ →c q mit etwas Epsilontik. Damit folgt
P (Ũ ) =%c P (U ) und Ũ %c U.
na) )
Damit haben wir lim inf n ln ξn (be
≥ J für alle a < a(α) bewiesen (ohne
n
Zusatzbedingungen).
Wir kommen jetzt zu (45). Der Trick ist eine Abschneidetechnik, die eine
Minorante mit ã(α) > a(α) liefert. Diesmal müssen wir kleine Kantengewichte
wegschneiden, etwa W̃i (v) = Wi (v)11Wi (v)≥c , und machen dann den Grenzübergang
0 < c → 0. Wir überlassen dem Leser die Einzelheiten. (Eventuelle muß
randomisiert werden und/oder c konvergiert absteigend gegen einen endlichen
Grenzwert.)
q.e.d.
69
Zum Abschluss formulieren wir noch ein Korollar. Die Fenchel-Legendre
Transformierte, siehe Anhang,
I(a) := inf (ln m(α) − aα)
α≥0
ist strikt antiton, sofern I endlich ist. Sofern I in einer Umgebeung von a
endlich ist, ordnen wir jedem a dasjenige α = α(a) = arginfI(a) zu, an dem
0 (α)
I(a) das Infimum annimmt. Dies geschieht bei a = m
. Der Galton-Watson
m(α)
Fall sei wieder ausgeschlossen.
Korollar 26 Sei I(a) > 0 und es gebe ein α > 0 mit a =
Funktion m ist endlich in einer Umgebung von α. Dann gilt
m0 (α)
m(α)
und die
1
ln ξn (bena ) →n I(a)
n
fast sicher auf der Überlebensmenge.
Obiges Korollar fogt aus Satz 25. Da α ein Stetigkeitspunkt von m ist, kann
m (unendlich oft) differenziert werden.
6.4
Maximaler Wert
Der Galton-Watson Fall sei wieder ausgeschlossen und die Funktion m endlich
in mindestens einem Wert.
Wir betrachten jetzt den maximalen Wert
Ln = sup Wv
|v|=n
in n-ter Generation. Der Zusammenhang mit ξn ergibt sich aus
Ln ≥ t ⇔ ξn (t) > 0.
Anders formuliert
Ln = inf{t | ξn (t) = 0} = sup{t | ξn (t) > 0}.
Die Fenchel-Legendre Transformierte, siehe Anhang,
I(a) := inf (ln m(α) − aα)
α≥0
70
ist strikt antiton, sofern I endlich ist. Sofern I in einer Umgebeung von a
endlich ist, ordnen wir jedem a dasjenige α = α(a) = arginfI(a) zu, an dem
0 (α)
I(a) das Infimum annimmt. Dies geschieht bei a = m
.
m(α)
Sei
a0 := inf{a | I(a) < 0}.
Ist a0 ein Stetigkeitspunkt von I so gilt I(a0 ) = 0. Anderenfalls ist a0 ein
Randpunkt von I −1 (IR) und es gilt I(a0 ) = −∞.
Korollar 27 Sei a0 ∈ (0, ∞) ein Stetigkeitspunkt von I. Sei α mit a0 =
und α ein innerer Punkt von m−1 (IR). Dann gilt
m0 (α)
m(α)
ln Ln
→n a0
n
auf der Überlebensmenge.
Bew: Sei a > a0 dicht bei a0 und I(a) < 0. Es gibt ein α1 mit I(a) =
ln m(α1 ) − aα1 < 0. Der Satz 25 liefert
lim sup 11ln Ln ≥an = lim sup 11ξn (ean )>0 = 0.
n
n
Dies impliziert lim supn lnnLn ≤ a0 .
Sei a < a0 dicht bei a0 . Die strikte Monotonie von I impliziert I(a) >
0. Wir können daher den Satz 25 anwenden (mit a und α(a)). Auf der
Überlebensmenge U gilt
limninf 11ln Ln ≥an = limninf 11ξn (ean )>0 ≥ limninf 11 ln ξn (ean ) >0 ≥ 11I(a)>0 = 1.
n
Wir erhalten auf der Überlebensmenge
a ≤ limninf
ln Ln
ln Ln
≤ lim sup
≤ a0 .
n
n
n
q.e.d.
Das Korollar 26 ermöglicht Abschätzungen der Anzahl der Individuen.
Korollar 28 Seien a1 < a2 < a0 und α(a1 ), α(a2 ) innere Punkte vom Definitionsbereich
der Funktion m. Dann gilt
1
ln |{v ∈ Vn | ea1 n ≤ Wv < ea2 n }| →n I(a1 ).
n
71
Bew: Sei Xn := ξn (ea1 n ) > Yn := ξn (ea2 n ).
1
1
ln |{v ∈ Vn | ea1 n ≤ Wv < ea2 n }| =
ln(Xn − Yn )))
n
n
¶
µ
1
1
Yn
=
ln(Xn ) + ln 1 −
n
n
Xn
Der erste Term konvergiert gegen I(a1 ), Korollar 26. Der zweite Term konvergiert
gegen 0, da 1 ≥ XYnn →n 0 fast sicher konvergiert. Dies folgt punktweise für n
hinreichend gros̈ aus
I(a2 )−I(a1 )
ln Yn −ln Xn
Yn
n
2
≤ en
→n 0.
= en
Xn
(Wir haben die strikte Monotonie von I benutzt.)
q.e.d.
Die Resultate zum Maximum folgen im wesentlichen der Arbeit Biggins,
Chernoff’s Theorem in the branching random walk, J. Appl. Prob. 14, 630636 (1977).
72
6.5
Logkonvexität der characteristischen Kantenfunktion
Durchgehend ist der Zustandsraum enthalten in den positiven reellen Zahlen.
Das Hauptresultat dieses Abschnittes ist die Logkonvexität der (erweiterten)
Funktion m
X
m
(0, ∞) 3 α 7→= E
Wiα .
i
Die erweiterte Funktion m ist immer wohldefiniert, kann jedoch den Wert
∞ annehmen. m heißt die charakteristische Kantenfunktion.
Sei D = m−1 (IR) die Menge der strikt positiven α mit endlichem Kantenfunktionswert
m(α). Dies ist stets ein Intervall, mit oder ohne die Randpunkte αl , αr ∈
[0, ∞]. Der Definitionsbereich D von m hae stets ein nicht leeres Inneres.
Eine Funktion f : I → IR mit Definitionsbereich I ⊂ IR heißt konvex, falls
f (tx+(1−t)y) ≤ tf (y)+(1−t)f (y) für alle reellen Zahlen x, y, tx+(1−t)y aus
dem Definitionsbereich und t aus dem Einheitsintervall gilt. Wir sprechen von
strikter Konvexität, falls in der Ungleichung stets strikt kleiner steht, sofern
t aus dem offenen Einheitsintervall (0, 1) stammt und x 6= y gilt.
Die charakteristische Funktion m ist antiton (monoton fallend), wenn alle
Kantengewichte aus dem Einheitsinterval sind und isoton (monoton steigend),
falls alle Kantengewichte größer oder gleich 1 sind.
Die Kantenfuntion m|D eingeschränkt auf D ist konvex. (Sie ist Summe
positiver konvexer Funktionen und damit konvex.) Sie ist sehr stark konvex,
genauer gesagt logarithmisch konvex. Eine Funktion f : I → IR> heißt
(strikt) logarithmisch konvex oder logkonvex, falls der Logarithmus der
Funktion (strikt) konvex ist. Die logarithmische Konvexität einer Funktion
f ist äquivalent zu
f (tx + (1 − t)y) ≤ f t (x)f 1−t (y)
für alle t aus dem Einheitsintervall und reelle Zahlen x, y, tx + (1 − t)y aus
dem Definitionsbereich.
Proposition 29 Eine logarithmisch konvexe Funktion ist konvex, eine strikt
logarithmisch konvexe ist strikt konvex. Eine logarithmisch konvexe Funktion,
die nicht konstant ist auf einem offenen Intervall, ist strikt konvex.
Bew: Sei ϕ(x) = eψ(x) mit ψ konvex und zweimal stetig differenzierbar.
Dann gilt ϕ00 = eψ (ψ 00 + (ψ 0 )2 ). Konvexität ist äquivalent zur Positivität
73
der zweiten Ableitung und strikte Konvexität zur strikten Positivität bis auf
eine abgeschlossene Menge mit leerem Inneren.
Ohne Differenzierbarkeit sind die Aussagen (schreibtechnisch aufwändiger)
ebenfalls herleitbar.
q.e.d.
Lemma 30 Ein Integral über logkonvexe Funktionen bzgl. einem Mas̈ ist
logkonvex. Das Integral ist strikt logkonvex, falls für alle x 6= y und t ∈ (0, 1)
es keine Konstante c gibt mit µ({f | f (x) 6= cf (y)}) = 0.
R
Bew: Sei h = f µ(df ) ein Integral über logkonvexe Funktionen f und sei
1
t ∈ (0, 1). Wir benutzen die dualen Zahlen p = 1/t, q = 1−t
mit p1 + 1q = 1.
h(tx + (1 − t)y) =
Z
f (tx + (1 − t)y)µ(df ) ≤
Z
f t (x)f 1−t (y)µ(df )
= kf t (x)f 1−t (y)k1 ≤ kf t (x)kp kf 1−t (y)kq = ht (x)h1−t (y)
Die erste Ungleichung beruht auf Logkonvexität und ist strikt für strikt
logkonvexe Funktionen. Die zweite Ungleichung ist die Hölder Ungleichung.
Gleichheit gilt genau dann, wenn für festes x, y stets f (x) dasselbe Vielfache
von f (y) µ fast sicher ist.
q.e.d.
Bemerkung: Das Lemma schließt Summen ein als ein Integral bzgl. dem
Zählmaß.
Satz 31 Die Funktion m|D eingeschränkt auf D ist logkonvex. Sie ist strikt
logkonvex, falls m keine Konstante ist.
Bew: Die Funktionen α → xα für x ≥ 0 sind logkonvex. Die Funktion m(α) =
P
E i Wiα ist als Integral über logkonvexe Funktionen logkonvex nach Lemma
30. Für die strikte Kogkonvexität müssen wir konstante Kantenfunktionen
ausschließen.
q.e.d.
Eine Funktion f auf de reellen Zahlen heißt oberhalb (unterhalb) stetig,
falls für alle y ∈ IR die Menge {x ∈ E | f (x) > y} ({x ∈ E | f (x) < y})
offen ist. Äquivalent ist die Aussage, für jede konvergente Folgen xn → x gilt
lim inf n f (xn ) ≥ f (x) (lim supn f (xn ) ≤ f (x)).
Lemma 32 Sei m|D keine Konstante und sei D nicht leer oder einelementig.
Die Funktion m ist strikt konvex und unterhalbstetig. Die Funktion ist unendlich
74
oft differenzierbar im Inneren von D und die Ableitungen haben stetige Erweiterungen
auf die Randpunkte von D. Es gilt
lim
α→∞
ln m(α)
= ln esssupi Wi
α
Die Funktion m ist strikt logkonvex.
Beweis: Wir benutzen die Zerlegung
m(α) = E
X
Wiα + E
Wi <1
X
Wiα + E
Wi =1
X
Wiα .
i:Wi >1
Der linke Term ist fallend in α, der mittlere unabhängig von α und der rechte
aufsteigend. Wir erhalten strikte Logkonvexität und strikte Konvexität.
Für die Unterhalbstetigkeit reicht es die Stetigkeit in den Randpunkten
von D nachzuweisen. Dies folgt aus monotoner Konvergenz.
• Unendlich oft differenzierbar.
P
Die formale Ableitung ist m(k) (α) = E i Wiα lnk Wi . In der Zerlegung
wie oben ist jede der drei Summen und auch deren Ableitungen monoton in
α (monotonen Konvergenz).
• lim inf ln m(α)
≥ ln s wobei s = esssupWi ist.
α
Sei r < s dicht bei s. Aus
∞ > m(α) ≥ E
X
wi >r
Wiα ≥ rα E
X
Wi >r
≥ ln r. Der Term E
folgt die untere Abschätzung lim inf α→∞ ln m(α)
α
ist positiv und endlich.
≤ ln s
• lim sup ln m(α)
α
Sei α ≥ α0 und m(α0 ) < ∞. Sei s < ∞. Es gilt
m(α) = sα E
X µ W i ¶α
i
s
P
wi >c1
≤ sα−α0 m(α0 )
und hieraus die Teilbehauptung.
q.e.d.
Die charakteristische Kantenfunktion m eingeschränkt auf D ist stetig
im Inneren von D und hat eventuelle Sprünge nach ∞ auf den Endpunkten
von D. Eine Sprungstelle tritt genau dann auf, wenn m an dem Randpunkt
endlich ist.
75
6.6
Die Fenchel-Legendre Transformierte
Sei m endlich in mindestens einem Punkt α0 > 0 und der Galton-Watson
Fall liegt nicht vor.
Definiere das Aktionsfunktional I : (−∞, ∞) → IR
I(a) := inf (ln m(α) − aα).
α>0
I ist wohldefiniert. I kann nicht den Wert ∞ annehmen, denn es gilt stets
I(a) ≤ ln m(α0 ) − aα0 < ∞.
Sei c das essentielle Supremum esssupi Wi aller Kantengewichte.
Proposition 33 Die erweiterte Funktion I ist monoton fallend, konkav und
oberhalb stetig.
Beweis: • Monotonie.
Für jedes α ≥ 0 ist die Funktion a 7→ ln m(α) − aα fallend. Das Infimum
fallender Funktionen ist fallend.
• Konkavität.
Mit entsprechender Notation haben wir I(ta+(1−t)b) ≥ tI(a)+(1−t)I(b)
zu zeigen. Zu vorgegebenem ² wähle 0 ≤ α mit I(ta + (1 − t)b) ≥ ln m(α) −
(ta + (1 − t)b)α − ². Dann gilt
I(ta+(1−t)b) ≥ t(ln m(α)−aα)+(1−t)(ln m(α)−bα)−² ≥ tI(a)+(1−t)I(b)−².
Da ² beliebig war folgt die Teilbehauptung.
• Oberhalbstetigkeit.
Für jedes α ist die Funktion a 7→ ln m(α) − aα oberhalb stetig. Das
Infimum oberhalb stetiger Funktionen ist oberhalb stetig. (Nachrechnen.)
q.e.d.
Bei fallenden Monotonie ist Oberhalbstetigkeit äquivalent zur Linksstetigkeit.
Das Infimum I(a) wird angenommen entweder durch ein α = α(a) aus
0 (α )
l
dem Rand von D oder im Inneren von D. αl tut es für a ≤ m
und ar tut
m(αl )
0
(αl )
es für a ≥ m
. In allen anderen Fällen liegt α im Inneren von D und ist
m(αl )
eindeutig bestimmt durch
m0 (α)
.
a=
m(α)
Viele weitere Eigenschaften liessen sich aufzeigen: Ist m(αl ), m(αr ) < ∞
so ist I eine Funktion. Und damit auch stetig. Sei c das essentielle Supremum
76
aller Kantengewichte. Ist c < 1, so ist I(a) = −∞ für a > 0. Ist 1 < c < ∞
und αr = ∞, so gilt I(a) = −∞ für a > ln c. Im Fall c = ∞ und αr = ∞ ist
I eine Funktion.
6.7
Gleichgradige Integrierbarkeit
Eine Familie F von Zgn heißt gleichgradig integrierbar, falls gilt
g(c) := sup
X∈F
Z
{|X|>c}
|X|dP −→c→∞ 0.
Eine Familie F von Zgn heißt gleichgradig f -integrierbar, falls die Familie
f (X), X ∈ F gleichgradig integrierbar ist. Im Falle f (x) = xp , p > 0
sprechen wir von gleichgradiger p-Integrierbarkeit.
Bemerkung: Gleichgradige Integrierbarkeit ist eine Eigenschaft der Verteilungen
der Zgn und hängt nicht von der Realisation der Zgn ab. Eine Familie
gleichgradig integrierbaren Zgn erfüllt stets supX E|X| ≤ c + g(c) < ∞.
Für eine Zg X definiere H = HX : [0, 1] 7→ IR
Z
HX (t) := sup{
A
|X|dP | P (A) ≤ t}.
Für eine Familie F von Zgn benutzen wir
HF (t) := sup HX (t).
X∈F
Falls der W-raum reichhaltig genug ist und eine gleichförmig verteilte Zg
besitzt, so gilt
Z
HX (t) =
1
1−t
F −1 (u)du,
mit F die Verteilungsfunktion zu |X|. Übung.
Satz 34 Für eine Familie F von Zgn sind die folgenden beiden Aussagen
äquivalent:
i) F ist gleichgradig integrierbar.
ii) Für alle ² > 0 gibt es
eine integrierbare Zg Y so, daß für alle Zgn
R
X ∈ F aus der Familie gilt |X|>Y |X|dP < ².
iii) HF : [0, 1] → IR ist stetig in 0.
iv) Es gibt eine aufsteigende Funktion ϕ : IR+ → IR+ mit limx→∞ ϕ(x)
=
x
∞ und F ist gleichgradig ϕ-integrierbar.
77
Beweis: i)⇒ ii) Wähle Y als eine Konstante.
ii) ⇒ iii) In der Zerlegung
Z
A
Z
|X|dP =
A∩{|X|>Y }
|X|dP +
Z
A∩{|X|≤Y }
|X|dP ≤
Z
|X|>Y
|X|dP +
Z
A
|Y |dP
ist der erste Term klein durch Wahl des Y. Der zweite Term ist klein in P (A)
klein.
iii) ⇒ i) Zu vorgegebenem ² > 0 wähle ein p > 0 mit HF (p) < ². Wähle
eine Überdeckung (Ai )i von Ω in N = p1 + 1 Mengen vom Maß ≤ p. Dann
gilt gleichmäßig in X ∈ F
Z
|X|dP ≤
Z
∪i A i
|X|dP ≤
XZ
i
Ai
|X|dP ≤ ²N.
Damit gilt
²N
|X|dP
≤
→c→∞ 0
c
c
X
X
R
und supX |X|>c |X| < ² for c sufficiently large.
iv) ⇒ i)
sup P (|X| > c) ≤ sup
Z
|X|>c
|X| =
Z
|X|>c
R
|x|
|X|
ϕ(|X|) ≤ sup
Eϕ(|X|).
ϕ(|X|)
x≥c ϕ(|x|)
Der erste Faktor konvergiert mit c → ∞ gegen 0 und der hintere ist endlich
gleichmäßig für X ∈ F.
P
i) ⇒ iv) Wähle positive Zahlen R0 < bn mit n bn < ∞ und eine aufsteigende
Folge 0 < en →n ∞ mit supX∈F |X|≥en |X| ≤ bn . Definiere die Funktion ϕ
P
= ∞ wegen Monotonie
durch ϕ(x) = n (x − en )+ . Dann gilt limx→∞ ϕ(x)
x
und gleichmäßig in X ∈ F
Z
ϕ(|X|) =
XZ
n
(|X| − en )+ ≤
X
n
bn < ∞.
q.e.d.
Bemerkung Die hier konstruierte Funktion ϕ ist eine Orlicz Funktion
(ϕ ist positiv, konvex und ϕ(0) = 0). Zusätzlich ließe sich ϕ glatt wählen,
eventuell unendlich oft differenzierbar und ϕ(x) > 0 für x > 0.
Der wesentliche Einsatz gleichgradiger Integrierbarkeit besteht in folgendem
Lemma.
78
Lemma 35 Sei Xn , n ∈ IN eine gegen X in Verteilung konvergierende Folge
von Zgn. Ist die Familie (Xn )n gleichgradig integrierbar, so vertauschen für
jede stetige Funktion f mit
lim sup
|x|→∞
|f (x)|
<∞
|x|
(50)
das Integral und der Limes,
lim
Ef (Xn ) = Ef (X).
n
Bew: • Die Familie Xn , n ∈ IN ist gleichgradig f -integrierbar.
(x)|
< ∞. Es gilt
Sei b = supx |f|x|
Z
|f (Xn )|≥c
|f (Xn )| ≤ b
Z
|Xn )|≥ cb
|x| →c 0.
• limn Ef (Xn ) = Ef (X).
Wir benutzen eine Abschneidetechnik. Zu vorgegebenem c > 0 sei fc die
bei c und −c gekappte stetige Funktion,
fc (x) = (f (x) ∧ c) ∨ −c.
Es gilt
|Ef (Xn )−Ef (X)| ≤ E|f (Xn )−fc (Xn )|+E|fc (Xn )−fc (X)|+E|fc (X)−f (X)|.
Der erste und dritte Term sind beliebig klein gleichmäßig in n für c hinreichend
groß wegen der gleichgradigen f -Integrierbarkeit. Der zweite Term ist beliebig
klein für festes c bei hinreichend großem n.
q.e.d.
Korollar 36 Sei Xn , n ∈ IN eine Folge von integrierbaren Zgn, die in Verteilung
gegen X konvergiert. Die Familie Xn , n ∈ IN ist gleichgradig integrierbar
genau dann wenn gilt
lim
E|Xn | = E|X| < ∞.
n
79
Bew: Die Hinrichtung folgt aus obigem Lemma mit f die Betragsfunktion .
Für die Rückrichtung sei fc die gekappte Betragsfunktion wie oben.
Z
|Xn |>c
|Xn | =
≤
Z
Z
|Xn | −
Z
|Xn |≤c
|Xn |
(|Xn | − |X|) +
Z
|Xn |≤c
(−fc (Xn ) + fc (X)) +
Z
|X|>c
fc (X)
Der dritte Term auf der rechten Seite ist beliebig klein für c hinreichend groß
wegen der Markoff Ungleichung. Der erste und zweite Term sind beliebig
klein bei festem c für n hinreichend groß.
q.e.d.
Korollar 37 Seien Xn , n ∈ IN , p-integrierbare Zgn, 1 ≤ p < ∞. Xn
konvergiert in Lp genau dann, wenn Xn stochastisch konvergiert und die
Familie (Xn )n gleichgradig p-integrierbar ist. Im Konvergenzfalle sind der
stochastische und der Lp -Limes gleich.
Bew: Lp -Konvergenz impliziert stochastische Konvergenz
E|Xn − X|p
→n→∞ 0
²p
und diese impliziert Konvergenz in Verteilung. Die gleichgradige p-Integrierbarkeit
folgt aus obigem Lemma.
Für die Rückrichtung argumentiere
P (|Xn − X| ≥ ²) ≤
Z
p
|Xn − X| dP =
Z
|Xn −X|>c
... +
Z
²<|Xn −X|≤c
... +
Z
|Xn −X|≤²
....
Der dritte Term ist beliebig klein für ² hinreichend klein. Der erste Term ist
beliebig klein gleichmäßig in n, ² für c hinreichend groß wegen p-gleichgradiger
Integrierbarkeit (Lemma ?? und beachte |x + y|p ≤ 2p (|x| + |y|).) Der zweite
Term wird abgeschätzt durch ≤ cP (|Xn − X| > ²) und ist klein für n
hinreichend groß bei festem c und ².
q.e.d.
Korollar 38 Sei Xn stochastisch konvergent gegen X und sei 1 ≤ p < ∞.
Dann sind äquivalent:
i) E|Xn |p →n→∞ E|X|p .
ii) (Xn )n∈IN gleichgradig p-integrierbar.
Bew: Der Beweis folgt direkt aus obigem Korollar. Beachte, stochastische
Konvergenz und Konvergenz der p-tem Momente impliziert Lp -Konvergenz.
q.e.d.
80
6.8
Orlicz Räume
Dieser Abschnitt behandelt das ARTV-Resultat.
Eine Orlicz Funktion [18][19] ist eine konvexe Funktion ϕ : IR+ → IR+ mit
ϕ(0) = 0. Jede Orlicz Funktion ist aufsteigend, stetig bis auf eventuell einen
Sprung auf ∞ und hat fast sicher eine rechte und linke Ableitung. Die triviale
Orlicz Funktion überall unendlich bis auf den Nullpunkt wird üblicherweise
ausgeschlosen.
Zu gegebener Orliczfunktion ϕ definiere die Abbildung dϕ auf Zgn
dϕ (X, Y ) := inf{c > 0 | Eϕ
³ |X − Y | ´
c
und
Lϕ := {X : Ω → IR | ∃c > 0 Eϕ
Ohen Beweis geben wir an.
³ |X| ´
c
< 1}
< ∞}.
Proposition 39 Sei ϕ eine Orlicz Funktion. Der Raum (Lϕ , k · kϕ , kXkϕ =
dϕ (X, 0) ist eine separabler Banachraum.
Notation: Lϕ heißt Orlicz Raum und k · k die Orlicz Norm.
7
Die ARTV-Ungleichung
Sei G die Klasse der symmetrischen konvexen Functionen ϕ mit ϕ(0) = 0
und sei G0 die Teilmenge φ ∈ G mit einer konkaven Ableitung auf (0, ∞).
Funktionen aus G0 , die Funktion identisch 0 ausgenommen, sind stetig, strikt
aufsteigend und eine Bijektion von IR+ . .
Beispiele sind die Funktionen x 7→ |x|p für p ∈ [1, 2] und x 7→ (|x| +
p
a) logr (x + a) − ap logr a für p ∈ [1, 2), r > 0 und a > 0 hinreichend groß.
Für ein Martingal M = (Mn , An )n∈IN0 benutzen wir die Martingaldifferenzen
Dk := Mk − Mk−1 , k ∈ IN. Dann gilt
Theorem 40 Sei ϕ aus G0 und M ein Martingal mit Martingaldifferenzen
Dk . Dann gilt
Eϕ(Mn ) − Eϕ(M0 ) ≤ 2
81
n
X
k=1
Eϕ(Dk ).
(51)
Die Konstante 2 ist scharf. Ist M ein positives Martingal oder sind die
Verteilungen der bedingten Differenzen stets symmetrisch, so ist 1 die scharfe
Konstante.
[1]. Das Resultat ist dort für ϕ-integrierbare Martingale bewiesen, gilt jedoch
allgemein.
Ein strukturell ähnliche Ungleichung kann aus der Burkholder-DavisGundy Ungleichung [7][2. Thm. 1] für das Maximum Mn∗ = supi≤n |Mi |
geschlossen werden. Sei a > 0 and G(a) die Klasse aller φ ∈ G mit φ(2x) ≤
aφ(x) für alle x.
Satz 41 (Burkholer-Davis-Gundy) Zu vorgegebenem a > 0 gibt es eine
Konstante Ca ∈ (0, ∞), so das für alle ϕ ∈ G(a) und Martingale M mit
M0 = 0 gilt


Eϕ(Mn∗ )
!1/2
à n
X
2
.
Dk
≤ Ca Eϕ 
k=1
Diese Ungleichung können wir auf G0 anwenden, siehe die folgende Proposition.
Die Funktion ψ, definiert durch ψ(t) := ϕ(t1/2 ) für vorgegebenes ϕ ∈ G0 , ist
P
P
konkav und subadditive (ψ( nk=1 xk ) ≤ nk=1 ψ(xk ) für alle 0 ≤ x1 , . . . , xn
und n ∈ IN ).
Korollar 42 Für jedes ϕ ∈ G0 und jedes Martingal M mit M0 = 0 gilt
Eϕ(Mn∗ ) ≤ C4
n
X
Eϕ(Dk ).
k=1
Proposition 43 Es gilt G0 ⊂ G(4) und ψ ist konkav und subadditiv.
Bew: Sei ϕ ∈ G0 . Die Konkavität von ϕ0 und die Positivität von ϕ0 (0) liefert
ϕ0 (2x) ≤ 2φ0 (x) wegen
1
ϕ0 (2x)
ϕ0 (x) ≥ (ϕ0 (2x) + ϕ0 (0)) ≥
.
2
2
Damit gilt
ϕ(2x) =
Z
0
2x
ϕ0 (t) dt =
Z
0
x
2ϕ0 (2t) dt ≤
82
Z
0
x
4ϕ0 (t) dt = 4ϕ(x)
für alle x ≥ 0.
Nun zur Konkavität. Die Ableitung von ψ ist
√
1
ϕ0 (0)
1 Z x 00
ψ 0 (t) = ϕ( x) √ = √ + √
ϕ (t)dt.
2 x
x
x 0
Da ϕ00 fallend in t ist, ist ψ 0 fallend. Genau genommen haben wir hier xϕ00 (x)−
ϕ0 (x) ≤ 0 für alle x ≥ 0 gezeigt.
Jede positive konkave Funktion ist subadditiv.
q.e.d.
Wir erhalten die folgenden Folgerungen aus der standard Martingaltheorie.
Corollary 44 Sei ϕ aus G0 und nicht identisch 0. Sei M ein Martingal.
Unter der Bedingung
∞
X
k=1
Eϕ(Dk ) < ∞
ist M ein gleichgradig integrierbares Martingal und das Supremum des Martingals
ist ϕ-integrierbar. Weiterhin konvergiert das Martingal fast sicher und im
L1 -Sinne.
Bew: Sei M ein Martingal mit M0 = 0. Das Korollar 42 liefert uns die endliche
∞
P
Schranke c =
Eϕ(Dk ) für Eϕ(Mn∗ ) für jedes n. Insbesonders konvergiert
k=1
das Martingal fast sicher. Für das Maximum M ∗ = supn Mn gilt
Eϕ(M ∗ ) = E lim
ϕ(Mn∗ ) = lim
E$(Mn∗ ) ≤ c < ∞.
n
n
Das Martingal ist gleichgradig integrierbar.
Im Fall M0 6= 0 verwende sinnvoll die Abschätzungen
ϕ(x + y) ≤ ϕ(2x) + ϕ(2y) ≤ 2ϕ(x) + 2ϕ(y)
zum Beweis der Aussagen.
(52)
q.e.d.
Theorem 45 Sei ϕ ∈ G0 und erfülle limx→∞ ϕ(x)
= ∞. Sei M = (Mn , An )n )n∈IN
x
ein Martingal mit supn Eϕ(Mn ) < ∞. Dann ist M ein gleichgradig integrierbares
und gleichgradig ϕ-integrierbares Martingal. Das Supremum des Martingals
ist integrierbar und ϕ-integrierbar. Weiterhin konvergiert das Martingal M
und das Submartingal ϕ(M ) und der Prozeß ϕ(Mn − M∞ ) fast sicher und im
L1 -Sinne.
83
Bew:
sup
n
Z
|Mn |>c
|Mn |dP ≤ sup
n
Z
|Mn |>c
|Mn |
ϕ(Mn )dP
ϕ(Mn )
Z
|y|
sup
≤ sup
ϕ(Mn )dP
|Mn |>c
|y|≥c ϕ(y) n
|y|
sup Eϕ(Mn ) →c→∞ 0.
≤ sup
|y|≥c ϕ(y) n
Die f.s. Konvergenz folgt aus dem Satz von Doob, die L1 -Konvergenz aus der
gleichgradigen Integrierbarkeit.
Die f.s. Konvergenz von ϕ(Mn ) folgt aus Stetigkeit von ϕ.
Wir kommen jetzt zur L1 -Konvergenz des Submartingals ϕ(M ) gegen
ϕ(M∞ ). Seien ϕy die Funktionen IR+ 3 x 7→ (x − y)+ . Jede Orlicz Funktion
ϕ auf IR+ hat eine (Choquet-)Darstellung
ϕ=
Z
0
∞
ϕy µ(dy)
mit einem Maß µ. (Die Funktionen ϕy , y ∈ IR+ sind die extremalen Funktionen
und das Mas̈ ist eindeutig. Die Umkehrung, sofern alles wohldefiniertist,
gilt auch.) Diese Darstellung läßt sich einfacher sehen falls ϕ zweimal stetig
differenzierbar ist.
ϕ=
Z
0
x
0
ϕ (z)dz =
x
Z
0
Z
(
z
0
00
0
ϕ (y)dy + ϕ (0))dz =
Z
∞
0
(x − y)+ ϕ00 (y)dy.
Das Darstellungsmaß ist µ(dy) = φ00 (y)dy.
Im folgenden benutzen wir das Submartingal ϕy (Mn ) = (|Mn | − y)+ , y ∈
IR+ . Der Erwartungswert E(ϕy (Mn ) ist aufsteigend in n und der Satz von
der monotonen Konvergenz liefert
lim
Eϕ(Mn ) = lim
E
n
n
= lim
=
Z
Z
n
0
∞
0
Z
∞
0
∞
ϕy (Mn )µ(dy)
Eϕy (Mn )µ(dy) =
Z
0
∞
lim Eϕy (Mn )µ(dy)
n
Eϕy (M∞ )µ(dy) = Eϕ(M∞ ).
Damit ist das Martingal gleichgradig integrierbar.
84
Die f.s. Konvergenz von ϕ(Mn ) folgt aus dem Satz von Doob und die
L1 -Konvergenz aus der gleichgradigen Integrierbarkeit.
Die letzte Aussage folgt mit A = {|Mn − M∞ | < b} und der Ungleichung
52
Eϕ(Mn − M∞ ) =
≤
Z
ZA
A
ϕ(Mn − M∞ ) +
ϕ(Mn − M∞ ) +
Z
ZA
c
Ac
ϕ(Mn − M∞ )
2ϕ(Mn ) +
Z
Ac
2ϕ(M∞ )
Der zweite und dritte Term sind beliebig klein wegen gleichgradiger Integrierbarkeit
für b hinreichend groß gleichmäßig in n. Der erste Term ist beliebig klein bei
festem c für n hinreichend groß.
q.e.d.
Starke Gesetz der Großen Zahl
.......................................
Projektiver Grenzwert. ...........Kolmogorov.........
CHOW, Y.S. and TEICHER, H. (1997). Probability Theory: Independence,
Interchangeability, Martingales (3rd Edition). Springer, New York.
TOPCHII, V.A. and VATUTIN, V.A. (1997). Maximum of the critical
Galton-Watson processes and left continuous random walks. Theory Probab.
Appl. 42, 17-27.
G. Alsmeyer, U. Rösler: The Best Constant in the Topchii-Vatutin-Inequality
for Martingales
7.1
Abschneidetechnik
Durch Abschneidetechniken werden punktweise Minoranten eines GVP erzeugt.
Die Vorteile sind bessere analytische Eigenschaften der Minoranten.
Der unten gestutzte GVP
Für c > 0 definiere den unten gestutzten GVP, Notation mit hochgestelltem
Index c, durch die Kantengewichte
W c (v, vi) = W (v, vi)11W (v,vi)≥c .
Der unten gestutzte GVP ist eine punktweise Minorante
Lc (v) ≤ L(v)
für alle Knoten v. Diese Ordnung überträgt sich auf Zählfunktionale
νnc ≤ νn
Eνnc ≤ Eνn
85
Die gesamte Familie GVPc , c ≥ 0, wobei wir c = 0 für den Originalprozess
benutzen, ist eine monotone Familie. Die Funktionale W c (v), Lc (v), νnc , Eνnc , mc , (mc )00
sind antiton in c. Ebenfalls isoton ist die Funktion
c 7→
(mc )0
.
mc (α)
Verwende dazu die Proposition 46 mit µc = I11[c,∞) eν mit deer Identitäet I.
R
(mc )0
Dann ist c → ln xµc (dx) = m
c (α) monoton steigend.
Der unten randomisiert gestutzte GVP
Randomisierung wird eingesetzt um Stetigkeit (oder Konvexität) im Parameterraum
zu erreichen.
Für (c, p) ∈ (IR≥ , [0, 1]) definiere GVPc,p durch die Kantengewichte
W c,p (v, vi) = W (v, vi)(11W (v,vi)>c + 11W (v,vi)=c 11U (v,vi)≥p .
Hierbei sind die U (v, vi), v ∈ Vi ∈ IN weitere unabhängige Zgn mit einer
Rechteckverteilung auf dem Einheitsintervall. Der Parameterraum (IR≥ , [0, 1])
bekommt die partielle Ordnung
(c1 , p1 ) ≤ (c2 , p2 ) ⇔ c1 < c2 oder (c1 = c2 und p1 ≤ p2 .
Mit dieser Ordnung ist die Familie GVP( c, p) antiton (isoton) geordnet
wie vorher auch. Der Vorteil der randomisierten Version ist die punktweise
Stetigkeit von (c, p) 7→ W c,p (., .) und deren Abkömmlingen wie mc , (mc )0 , (mc )00 .
Der oben gestutzte GVP
Für c > 0 definiere den oben gestutzten GVP, Notation mit hochgestelltem
Index c, durch die Kantengewichte
W c (v, vi) = W (v, vi)11W (v,vi)≤c .
Der unten gestutzte GVP ist eine punktweise Minorante
Lc (v) ≤ L(v)
für alle Knoten v. Diese Ordnung überträgt sich auf Zählfunktionale
νnc ≤ νn
Eνnc ≤ Eνn
86
Analoge Aussagen gelten für die gesamte Familie GVPc , c ≥ 0, wobei wir
c = 0 für den Originalprozess benutzen, als monotone Familie. Die Funktion
c 7→
(mc )0
mc (α)
wird jetzt antiton.
Der oben randomisiert gestutzte GVP Die Vorteile der Randomisierung
und die Konstruktion ist wie vorher. Wir überschlagen die angepasste Konstruktion.
Weitere Abschneidetechniken Je nach Problemstellung können weitere
Zgn vorteilhaft abgeschnitten werden, wie z.B. die Summe der Kantengewichte
ausgehend von einem Knoten.
7.2
Stochastische Monotonie
Proposition 46 Sei µ ein Maß auf den reellen Zahlen mit µ[a, ∞) < ∞ für
alle reellen Zahlen a. Seien µa die W-mas̈e definiert durch
Z
f dµa =
R
f dµ
µ[a, ∞)
[a,∞)
für positive, mes̈bare Funktionen f und µ[a, ∞) > 0. Dann ist die Familie
(µa )a von W-maßen stochastisch monoton in a.
Beweis: Sei a1 < a2 und 0 < µ[a2 , ∞). Es gilt
l.S. =
µ[x, ∞)
µ[x, ∞)
≤
= r.S.
µ[a1 , ∞]
µ[a2 , ∞]
q.e.d.
87
Literatur
[1] ........
[2] ..............
[3] .............
[4] ........
[5] ...............
[6] ................
[7]
[8] ........
[9] .........
[10] ...........
[11] ......
[12] ...........
[13] .............
[14] ................
[15] ..........
[16] .............
[17] ...........
[18]
[19]
[20]
[21] ,,,,,,,,,,,
88
[22] .........
[23] .................
[24] .....
[25] ...............
89