Gewichteter Verzweigungsprozess

Transcription

1
Verzweigende Stochastische Prozesse
Die Grundidee ist ein genealogischer Baum von Individuen mit einem Urahnen.
Jedes Individuum erhält einen Namen und Eigenschaften, die von der Mutter
mit einem zusätzlichen Zufallseffekt vererbt wurden usw. Der Zufallseffekt
ist unabhängig von Familie zu Familie, ist innerhalb der Familie in der
Regel jedoch korreliert. Wir erhalten einen Stammbaum von Individuen mit
individuellen Kenngrößen wie Lebensdauer, DNS, Intelligenz, Reichtum, Größe
des Individuums. Die mathematische Untersuchung solcher Modelle führt
zu Wahrscheinlichkeitstheorie auf Bäumen mit einer Dynamik, die wie bei
Markoffketten oder dynamischen Systemen fortschreitend von der Wurzel
des Baumes aufsteigend von Knoten zu Knoten führt.
Wir führen den gewichteten Verzweigungsprozess (=GVP) ein. Grob gesprochen bestehen diese aus dem Baum V aller endlichen Folgen natürlicher
Zahlen, einem Zustandsraum S und Transformationen T auf dem Zustandsraum
in sich auf allen Kanten des Baums. Der Zustand eines Individuums ergibt
sich aus dem Zustand der Urmutter und den Transformationen. Eventuell ist
der Zustand selbst nicht direkt beobachtbar, sondern nur eine Funktion U
davon mit Werten in einem Realraum R.
1.0.1
Alphabete und Worte:
n
Sei A eine nichtleere Menge und A∗ = ∞
n=0 A die Menge aller endlichen
0
Tupel über der Menge A. Das Symbol A bezeichnet per Definition die
Menge der leeren Menge {∅}. Die Menge A heißt Alphabet, ein Element
davon Buchstabe und eine endliche Folge von Buchstaben Wort.
Wir stellen die Wortmenge A∗ dar als einen genealogischen Baum, siehe
Bild. Das Bild zeigt den binären Baum für die Grundmenge A = {1, 2}.)
Der Name eines Knotens (vertex=Knoten) v = (v1 , v2 , . . . , vn ) ∈ A∗ wird
gegeben durch den Pfad von der Wurzel ∅ startend bis zum Knoten selbst.
Wir unterdrücken nach Möglichkeit die leere Menge ∅ im Pfadnamen und
Knotennamen.
S
1
³
³³
³³
)³
1 u³
¡@
@
¡
Ru12
@
ª
u
11 ¡
¢A
¢A
¢ A
¢ A
u
u
¢®
Uu
A
¢®
AUu
u∅
³³ PPP
PP
PP
PP
qu2
¡@
@
¡
Ru22
@
ª
21 u¡
¢A
¢A
¢ A
¢ A
u
¢®
AUu212 u
AUu
¢®
Zur schnelleren Schreibweise notieren wir einen Knoten v = (v1 , v2 , . . . , vn ) ∈
A (außer der Wurzel ∅) als v = v1 v2 . . . vn . (Dies ist formal ein kleiner
Notationsmißbrauch.) Der Namen eines Knoten v korrespondiert eineindeutig
mit dem direkten Pfad von der Wurzel ∅ bis zum Knoten v. Dieser Pfad
startet in der Wurzel, besucht dann v1 , von dort v1 v2 , dann v1 v2 v3 usw.
Die Länge |v| des Pfadnamens bzw. die Generation eines Knotens v =
v1 v2 . . . vn ist die Länge n des Pfades von der Wurzel bis zum Knoten. Hierbei
hat der Pfadname ∅ die Länge 0. Das Bild zeigt alle Knoten bis einschließlich
der dritten Generation.
Für m ≤ |v| benutzen wir die Einschränkung v|m = v1 . . . vm . Sei w =
w1 . . . wm ∈ V ein weiterer Knoten, so benutzen wir
∗
vw = v1 . . . vn w1 . . . wm .
Die Verzweigungsstruktur führt auf die genealogische Ordnung ¹g auf
A∗ , definiert durch
v ¹g w ⇔ |v| ≤ |w| and w||v| = v.
(1)
Dies ist eine partielle Ordnung. Wir schreiben v ≺g w genau dann wenn
v ¹g w und v ungleich w gilt. Wir sprechen auch von v ist ein Vorfahre oder
Ahne von w im Fall v ¹g w und von einem von einem echten Vorfahren oder
Ahnen. Ganz allgemein nutzen wir den genealogischen Sprachgebrauch, da er
sehr intuitiv und treffend ist. Einen Knoten, abhängig vom Kontext, nennen
wir Individuum, Teilchen oder Mutter. vi ist ein Kind oder Nachkommen
von v und v ist die Mutter von vi. vw ist ein Nachkomme von v and v ist ein
Vorfahre von vw. Die gegebene Ordnung v ¹ w entspricht der natürlichen
Abstammung der Biologie.
Sei jetzt A mit einer Totalordnung (partielle Ordnung und für alle a, b ∈ A
gilt a ¹ b oder b ¹ a. Die Totalordnung auf dem Alphabet impliziert die
2
lexikografische Ordnung auf dem Folgenraum A∗ . Hierbei gilt v kleiner
gleich w in lexikografischer Ordnung, v ¹l w, falls v ein Anfangsstück von w
ist oder vi < wi gilt für das kleinste i, für welche vi und wi sich unterscheiden.
v ¹l w ⇔ v ¹l w oder vτ < wτ für τ = inf{i ≤ |v|, |w| | vi 6= wi }.
1.0.2
(2)
Bäume als Graphen
Ein Teil der Notation gewichteter Verzweigungsprozesse ist der Graphentheorie entnommen, da Bäume Spezialfälle sind. Daher ein kurzer Ausflug in die
Graphentheorienotation.
Ein Graph (V, E) besteht aus einer nicht leeren Menge V und einer
Teilmenge E von V × V. V heißt Knotenmenge und ein Element v darin
Knoten (=vertex). Ein Element e = (a, b) aus E heißt Kante (edge) mit
Anfangsknoten a und Endknoten b. Ein Pfad in einem Graph ist eine
Folge e1 , . . . , en von Kanten, wobei der Endknoten der Kante ei stets der
Anfangsknoten der folgenden Kante ei+1 ist. Der Anfangsknoten eines Pfades
ist der Anfangsknoten von e1 und der Endknoten der von en . Wir sprechen
auch von einem Pfad von v nach w Ein Pfad heißt Schleife oder Zykel,
falls Anfangsknoten und Endknoten übereinstimmen. Der Knoten w heißt
erreichbar von v, falls es einen Pfad von v nach w gibt. Eine Wurzel eines
Graphen ist ein Knoten v, von dem aus alle andere Knoten erreichbar sind.
Ein Baum in der Graphentheorie ist ein Graph ohne Schleifen. Ein Baum
mit Wurzel heißt auch Wurzelbaum oder gewurzelter Baum. Die Wurzel
ist eindeutig.
Ein gewichteter Graph ist ein Graph mit einer Abbildung K ∈ e 7→ ge ∈ G
von den Kanten in eine Halbgruppe (G, ∗). (Beachte, das Gewicht liegt auf
den Kanten, nicht den Ecken.) Der Wert ge heißt Kantengewicht. Jedem
Pfad p = (e1 , . . . , en ) ordnen wir das Pfadgewicht
gp = ge1 ∗ ge2 ∗ . . . ∗ gen
zu.
In einem gewichtenen Baum mit Wurzel w gibt es eine Bijektion zwischen
Pfaden und Knoten ohne die Wurzel. Dies liefert eine Belegung V \{w} 3 v →
gv ∈ G der Knoten, wobei gv das Pfadgewicht des Pfades von der Wurzel bis
v ist. Die Belegung läßt sich stets auf den ganzen Baum erweitern, indem der
Halbgruppe ein neutrales Element x (∀g ∈ G x ∗ g = g = g ∗ x) zugefügt und
3
gw,w = x gesetzt wird. Ist der Baum in einem Graph eingebettet, so läßt sich
die Baumkantengewichtung zu einer Graphkantengewichtung fortsetzen. Der
Halbguppe fügen wir ein Grab 4 (∀g ∈ G g ∗ 4 = 4 = 4 ∗ g) und belegen
alle noch unbesetzten Kanten e des Graphen werden mit ge = 4.
Nun zur verwendeten Ausprägung. Unsere Wortmenge A∗ versehen mit
den Kanten (a, ai), a ∈ A∗ , i ∈ A ist ein Graph und ein Wurzelbaum mit
der Wurzel ∅. In Anbetracht der Graphentheorienotation benutzen wir das
Symbol V für die Knotenmenge (Vertexmenge). Der Knotenname v = (v1 , v2 . . . , vn )
entspricht dem Pfad von der Wurzel ∅ über die Knoten (∅, v1 ), (∅, v1 , v2 ) usw.
bis hin zum Knoten v. (Aus schreibtechnischen Gründen unterdrücken wir
die Wurzel wenn möglich.) Die Länge n = |v| des Knotennamens entspricht
der Anzahl der besuchten Knoten des zugehörigen Pfades (ohne die Wurzel).
Die n-te Generation Vn eines Baumes besteht aus allen Knoten der Länge
(=Namenslänge, Pfadlänge) n. Sinngemäß bezeichnet V≤n die Knoten bis zur
n-ten Generation und vV den Teilbaum zur Wurzel v.
1.0.3
Das Grab
Durch Einführung eines Grabes ersparen wir uns Fallunterscheidungen verschiedener Bäume und erreichen eine effizientere Notation.
Wir betrachten (fast ausschließlich) Bäume mit unendlich vielen VerzweiS
n
gungen und arbeiten stets auf dem Baum V = ∞
n=0 IN aller endlichen Tupel
zum Alphabet der natürlichen Zahlen IN = {1, 2, 3, . . .}. Binäre Bäume
(das Alphabet ist zweielementig) oder m-verzweigende Bäume (das Alphabet
hat m Elemente) mit endlich viele Ästen usw. sind alles Teilbäume von V
mit Wurzel ∅. Ein Teilbaum bzw. Baum mit Wurzel ∅ wird charakterisiert als
eine Teilmenge B ⊂ V , sodaß jeder Vorfahre eines Individuums in B wieder
in B liegt. (Äquivalent ist B ⊂ V versehen mit den Kanten (B × B) ∩ E ist
ein Wurzelbaum mit Wurzel ∅.)
Formal können wir Teilmengen B der Knotenmenge eindeutig durch eine
Funktion ϕ : V 7→ {0, 1} via ϕ−1 (1) = B beschreiben. Die Antitonie in
genealogischer Ordnung (v ¹g w ⇒ ϕ(v) ¹g ϕ(w)) der Abbildung ϕ ist
äquivalent zur Baumeigenschaft von B mit Wurzel ∅. Wir sprechen dann von
einem beobachtbaren (=lebenden) Individuum v im Falle ϕ(v) = 1 und von
einem nicht beobachtbaren (=toten) im Falle ϕ(v) = 0. Die beobachtbaren
Individuen bilden den Teilbaum B, analog zum genealogischen Stammbaum.
Allgemein, wenn immer wir eine Funktion f von einem Teilbaum B von V
4
in irgendeine Menge S haben, erweitern wir diese Menge S um ein weiteres
Element 4, genannt das Grab, und die Funktion f zur Abbildung von V
nach S ∪ {4}, indem wir jedem Element aus V \B das Grab zuordnen. Im
obigen Fall besteht S aus der 1 und das Grab ist die 0.
Ab jetzt betrachten wir nur den Baum V = IN ∗ der endlichen Folgen
natürlicher Zahlen mit der Pfadindizierung startend in der Wurzel ∅.
1.1
Gewichteter Verzweigungsprozess
Wir führen den gewichteten Verzweigungsprozess (GVP) ein und geben
einige Beispiele.
Generell sei (Ω, A, P ) ein nicht näher bezeichneter Wahrscheinlichkeitsraum.
Wir setzen stets voraus, daß dieser reichhaltig genug ist für alle Konstruktionen
und Zufallsgrößen. Wir unterdrücken, wenn möglich, in allen Zgn die Realisierung ω.
Ein gewichteter Verzweigungsprozess (GVP) besteht aus einem Tupel
(V, W, (G, ∗)). Hierbei ist V der Baum der endlichen Folgen natürlicher Zahlen
einschlies̈lich der leeren Folge ∅. Der Gewichtsraum (G, ∗) ist ein mes̈bare
Halbgruppe mit σ-Algebra σ(G) und einem neutralen Element sowie einem
Grab. Zu jeder Kanten (v, vi), v ∈ V, i ∈ IN des Baumes sind Zgn Wv,i : Ω →
G, genannt Kantengewichte, mit Werten in der Halbgruppe G vorgegeben.
Die Zgn ((Wv,vi )i∈IN ), v ∈ V sind unabhängig und identisch verteilt.
Bem: Beachte die verkürzende Schreibweise Wv,i zur Kante (v, vi). Die
Zgn (Wv,i )i , v ∈ V sind unabhängig, aber für festes v sind die Kantengewichte
Wv,i , i ∈ IN beliebig abhängig voneinander. Als Merkregel, verschiedene
Familien sind unabhängig, aber innerhalb einer Familie können beliebige
Abhängigkeiten bestehen.
Not: Wir verwenden g ∗ h oder sogar gh für ∗(g, h). Das Grab heißt stets
4.
Pfadgewichte Definiere rekursiv die Pfadgewichte Wv,w für die Pfade
(v, vw) von v nach vw durch
Wv,vwi = Wv,w ∗ Wvw,i .
(3)
Not: Wir verwenden Ww (v) =: W (v, w) und Ww = Ww (∅). Aus schreibtechnischen Gründen verwenden wir standardmäßig Wv,v als das neutrale
Element in der Halbgruppe.
5
Die Gleichung (3) schreibt sich allgemeiner als
Wv,wx = Wv,w ∗ Wvw,x
Wwx (v) = Ww (v) ∗ Wx (vw)
Wwx = Ww ∗ Wx (w)
und expliziter v = v1 . . . vn
Wv = Wv1 Wv2 (v1 )Wv3 (v1 v2 ) . . . Wvn−1 (v|n−1 )Wvn (v)
(4)
Die Pfadgewichte Ww (v) lassen sich interpretieren als Pfadgewicht für den
Baum vV zum relativen Pfad w. Das Pfadgewicht Ww (v) ergibt sich durch
Hintereinanderschaltung von den Kantengewichten entlang dem Pfad vom
Knoten v zum Knoten vw.
Ein gewichteter Verzweigungsprozeß mit Nutzenfunktion (=Kostenfunktion)
U , der Buchstabe U steht für utility, ist ein GVP (V, W, (G, ∗)) mit einer
zusätzlichen Belegung Uv der Knoten durch eine Zg mit Werten in R. Hierbei
operiert (G, ∗) transitiv auf R ∗ : G × R → R. Die Zgn ((Wi (v))i , Uv ), v ∈ V
sind unabhängig, identisch verteilt.
Halbgruppen werden gerne via der Komposition von Funktionen dargestellt
und analog für transitive Operationen. Mit dieser Interpretation werden die
realen Werte Uv (Wv )) auf den Knoten v beobachtet. Wir führen dies formal
aus.
Bisher haben wir GVP eher algebraisch betrachtet. Jetzt zur mehr analytischen Sichtweise über Funktionen. Jede Halbgruppe läßt sich darstellen als
ein Funktionenraum F mit der Komposition als Verknüpfung. Die Kantengewichte
Wi (v) entsprechen funktionswertigen Zgn Ti (v) : Ω → S S auf einer Menge S.
Die Menge S heißt Zustandsraum (state space). Die Halbgruppenoperation
∗ entspricht der Komposition von Funktionen
Wi (v) ∗ Wj (vi) = Tj (vi) ◦ Ti (v).
Beachte die Umkehrung der Verknüpfungsordnung. Analog benutzen wir
Tw (v) für Ww (v). Die Nutzenfunktion C als Abbildung C : S S → R erfüllt
W ∗ U = C(W ).
Bei der Schreibweise mit Funktionen ergeben sich Schwierigkeiten mit der
Indizierung W (v) für das Pfadgewicht. Um diesen vorzubeugen, verwenden
wir teilweise Lv , der Buchstabe L für layer, um noch eine eventuelle Auswertung
der Funktion an der Stelle s ∈ S gut betrachten zu können. Oder wir
benutzen die Kantennotation geeignet.
6
Mit der Notation T (v) = (Ti (v))i∈IN lautet die Unabhängigkeitsbedingung
(T (v), Uv ), v ∈ V sind uiv Zgn.
Die wesentlichen interessanten Beispiele für gewichtete Verzwigungsprozesse
mit zufälligen Gewichten werden wir gleich vorstellen. Es gibt aber durchaus
interessante und nichttriviale Beispiele mit deterministischen Gewichten. Als
Beispiel wählen wir die Cantormenge mit dem Cantormaß. (Stellvertretend
für eine ganze Klasse von Beispielen mit dieser Struktur, Kochkurve, Schneeflocke,
usw..)
Bsp: Cantormenge:
Aus dem abgeschlossenen Einheitsintervall entferne das offene mittlere
Drittel. Im nächsten Schritt entferne aus jedem verbleibenden Intervall das
offene mittlere Drittel und fahre rekursiv fort. Die übriggebliebenen Punkte
ist die Cantormenge.
Cantormenge:
0r
r1/3
p
p
p p p p
pppp pppp
p
p
p p p p
pppp pppp
r2/3
p
p
p p p p
pppp pppp
Cantorset Cantorset Can
r1
p
p
p p p p
pppp pppp
Cantorset Cantorset Can
Die formale Definition der Cantormenge C lautet:
3n −1
2
Cn :=
[ 2m 2m + 1
[
m=0
C :=
\
n
Cn = {x =
3n
,
3n
∞
X
xi
i=1
3i
].
| xi ∈ {0, 2}}.
Die Cantormenge hat interessante Eigenschaften:
• Die Cantor Menge ist überabzählbar, abgeschlossen, kompakt, nirgends
dicht (=das Innere vom Abschluß ist leer) und perfekt (=jeder Punkt ist
Häufungspunkt). (Übung)
• Die Cantor Menge ist Borel meßbar und das Lebesgue Maß der Cantor
Menge ist 0. (Übung)
7
• Die Cantormenge ist die größte kompakte invariante Menge bzgl. der
Funktion f : IR 7→ IR, f (x) = 11x≤1/2 3x + 11x>1/2 (1 − 3x). (Eine Menge
A heißt invariant unter f, falls f −1 (A) = A gilt.) (Übung: Benutze die
Trialdarstellung einer reellen Zahl.)
Jetzt zur Beschreibung als gewichtetem Wurzelbaum. Die verzweigende
Struktur wird durch das Aufspalten eines Intervalls in zwei Teile gegeben.
Die Knotennamensgebung startet mit der Wurzel ∅ für das Einheitsintervall.
Nach Entnahme des mittleren Drittels erhält das linke verbleibende Intervall
[0, 1/3] den Namen 1 und das rechte verbleibende Intervall [2/3, 1] den Namen
2. Fahre so fort, indem bei Aufspaltung eines Intervalls mit Namen v das linke
den Namen v1 erhält und das rechte den Namen v2. Wir erhalten den binären
Baum A∗ zum Alphabet A = /1, 2/.
Sind wir nur an der Länge der jeweiligen Intervalle interessiert, bietet sich
eine Modellierung an als ein GVP mit W1 = 1/3 = W2 , W3 = 0 = W4 =
. . . auf den positiven reellen Zahlen G mit der Multiplikation. Das Grab
P
entspricht dem Wert 0 und das neutrale Element der 1. Sei Zn = |v|=n Wv
die Gesamtlängen der Intervalle in n-ter Generation, bzw. das Lebesguemaß
n
von Cn . Eine leichte Überlegung liefert 32 Zn = Zn−1 und damit Zn = 32n →n 0.
Damit erhalten wir Zn →n 0 und das Lebesguemaß λ(C) der Cantormenge
ist ebenfalls 0,
λ(C) = n→∞
lim λ(Cn ) = lim
Zn = 0.
n
Jetzt eine etwas ausfürlichere dynamischere Modellierung als Prozess auf
Intervallen. Sei S die Menge der abgeschlossenen Intervalle in den positiven
reellen Zahlen einschlies̈lich des leeren Intervalls {∅}. Die Kantengewichte
beschreiben wir durch Transformationen der Intervalle auf sich wia
T
[a, b] 7→1 [a, a +
b−a
]
3
T
[a, b] 7→2 [b −
b−a
, b]
3
und T3 = {∅} = T4 = . . . . Die Cantormenge ist der Grenzwert der fallenden
Folge der Mengen ∪|v|=n Lv ([0, 1]).
Auf den Knoten sei die deterministische Kostenfunktion gegeben, die
jedem Intervall I seine Länge |I| zuordnet. Wir erhalten als Gesamtmasse
P
in n-ter Generation Zn = |v|=n |Lv (I)| bei Start in dem Intervall I. Eine
n
leichte Rechnung ergibt Zn = 32n λ(I) mit λ(I) die Länge des Startintervalls.
Benutzen wir die Nutzenfunktion, welches jedem Intervall I die Länge des
Intervalls zur Potenz α zuordnet. Sei α0 derjenige (eindeutige) Wert mit
8
( 23 )α0 = 1. Dann konvergiert Zn(α) := |v|=n |Lv (I)|α mit n → ∞ gegen 0 für
α < α0 , ist konstant für α = α0 und konvergiert gegen unendlich für α > α0 .
(In 4.1 zeigen wir α0 ist die Hausdorffdimension der Cantormenge.)
Ein weiteres interessantes Objekt ist das Cantormaß bzw. Hausdorffmaß.
Definiere die reellwertige Funktion F für dei Kostenfunktion J 7→ λ(J)α0
P
F (x) := n→∞
lim
X
Cv (Lv ).
|v|=n, Lv <x
Hierbei benutzen wir J < x in der Bedeutung, jeder Punkt des Intervalls
J ist strikt kleiner als x. Dann ist F eine stetige Verteilungsfunktion und
differenzierbar auf dem Komplement der Cantormenge mit Ableitung 0. (Aber
nirgendwo auf der Cantormenge. Auf der Cantormenge selbst wäre die Ableitung ∞.) Das Cantormaß ist das Maß gehörend zur Verteilungsfunktion F.
1.2
Beispiele
Wir kommen jetzt zu einer Reihe von Beispielen mit stochastischer Komponente. Die extremen Beispiele sind diejenigen, wo eine der beiden Hauptstrukturen,
die Gewichtung oder die Baumstruktur, ausarten. Falls die Gewichtung nur
einen Wert annehmen kann, neben dem Grab, so behalten wir nur die Baumstruktur. Dies sind die Galton-Watson Prozesse (eventuell mit abzählbar
vielen Nachkommen.) Falls die Baumstruktur degeneriert zu einer Linie,
die dann isomorph zu den natürlichen Zahlen ist, erhalten wir im zufällige
iterierte Funktionensysteme, im reellen Produkte von uiv Zgn. Diese Beispiele
sind eher als einfach oder grundlegend anzusehen, da nur eine Struktur
vorhanden ist. Das Vorliegen beider Strukturen verkompliziert die Lage, da
beide Strukturen einen gegenteiligen Effekt auslösen können (und in der
Regel tun) und es substanzieller Argumente und Abschätzungen bedarf,
welcher Effekt sich durchsetzt.
Bsp: Galton-Watson Prozesse:
Der Galton-Watson Prozess [2] [3] wird beschrieben durch eine Folge von
uiv Zgn Xn,m , m, n ∈ IN mit Werten in den natürlichen Zahlen einschließlich
der 0. Betrachtet wird der Prozess (Zn )n∈IN0 mit Werten in den natürlichen
Zahlen einschließlich der Null, Z0 = 1,
Zn+1 :=
Zn
X
m=1
9
Xn,m .
Dabei hat Xn,m die Interpretation als die Anzahl der Nachkommen des mten Individuums in der n-ten Generation. Zn gibt die Anzahl der (lebenden)
Individuen in n-ter Generation an.
Der Galton-Watson Prozess entspricht einem gewichteten Verzweigungsprozess
zu der multiplikativen Gruppe {1} erweitert um das Grab 4 = 0. Die
Halbgruppe ist G = {0, 1} mit der Multiplikation als Operation ∗.
Die Kantengewichte und Pfadgewichte nehmen nur die Werte 0 oder 1
an. Das Pfadgewicht 1 eines Pfades in der Wurzel startend mit Endknoten
v interpretieren wir als einen lebenden (beobachtbaren) Knoten v und das
Pfadgewicht 0 als nicht beobachtbar (nicht existent, nicht wahrnehmbar, tot,
nicht lebend, nicht realisiert usw. ). Wir erhalten als typische Realisierungen
genealogische Bäume wie etwa folgendes Bild:
³
³³
³³
u³
)
1³
´Q
Q
´
Q
´
Q
su13
Q
u´
u12
?
11 +́
¢A
¢A
¢ A
¢ A
u
u
?A
?
?AUu
¢
® u
Uu
¢u
® u
u∅
³³ PPP
PP
PP
PP
qu3
¡@
¡
@
u
ª
Ru32
@
31 ¡
¢A
¢A
¢ A
¢ A
¢u
®
AUu312 u
AUu
¢®
u2
?
Hierbei wurden nur die beobachtbaren Individuen eingezeichnet.
P
Die Anzahl der Nachkommen eines Individuums v ist X(v) = i Wi (v)
und die Anzahl aller lebenden Individuen in n-ter Generation ist
Zn =
X
Wv .
|v|=n
Die Verteilung von X ist die gleiche wie von Xn,m des GWP und die Zn
sind identisch. Nur die Benennung der Individuen ist veschieden, in unserer
Baumstruktur durch den Namen v induziert durch dne Pfad, im GaltonWatson Prozess als m-tes lebendes Individuum in der n-ten Generation.
Üblicherweise hat ein Galton-Watson Prozess per Definition nur endlich
viele Nachkommen. Eine typische Fragestellungen für den Galton-Watson
Prozess, dies ist auch historisch der entscheidende Anlaß zur Betrachtung
von Galton-Watson Prozessen gewesen, war die Aussterbewahrscheinlichkeit
10
q = limn→∞ P (Zn = 0) eines (adligen) Namens. In dem Modell von GaltonWatson hierzu spielte die Namensgebung der Individuen keine Rolle.
P
Mit geeigneter Normierung 0 < m := E i Wi < ∞ konvergiert
Zn
→n M
mn
als positives Martingal fast sicher gegen einen Grenzwert genannt M . Die
Verteilung der Grenzverteilung von M erfüllt eine stochastische Fixpunktgleichung
D
M=
X Wi
i
m
Mi .
(5)
Hierbei sind (W1 , W2 , . . .), Mi , i ∈ IN unabhängig und Mi hat dieselbe Verteilung
wie M. Hierdurch läßt sich die Verteilung von M charakterisieren. Wir werden
in den folgenden Sektionen dies genauer untersuchen.
Bsp: Iteriertes Funktionensystem:
Ein zufälliges iteriertes Funktionensystem ist die Komposition
Yn := Xn ◦ Xn−1 ◦ . . . X1
n ∈ IN von uiv Zgn Xi , i ∈ IN. Hierbei haben die X-Zgn Werte in einer
Menge von Funktionen von einer Menge S auf sich selbst.
Zufällige iterierte Funktionensysteme sind extreme Spezialfälle gewichteter
Verzweigungsprozesse mit dem Baum der lebenden Individuen ausgeartet zu
einer Linie isomorph zu IN0 . Es bietet sich die Beschreibung eines GVP via
Funktionen an. Die Funktionen mit der Komposition bilden die Halbgruppe.
Das neutrale Element ist die Identität und das Grab ist die Funktion identisch
4, wobei, ebenfalls Grab genannt, 4 dem Zustandsraum zugefügt wird (und
entsprechend der Definitionsbereich aller Funktionen erweitert wird). Die
Kantengewichte sind
W1 (v) = X|v|
falls v nur aus lauter Einsen besteht und ansonsten setze Wi (v) die Grabfunktion.
Die lebenden Individuen bei Start in s ∈ S entsprechen denjeningen Knoten,
deren Wert Lv (s) nicht das Grab ist. Dies können nur Knoten sein mit einem
Namen nur aus Einsen bestehend.
Ein eher einfaches Beispiel dieser Struktur wäre S die positiven reellen
Zahlen und die Funktionen fy , y ∈ IR+ als Multiplikation x 7→ fy (x) = xy.
11
Mit der Identifizierung fy ↔ y von Funktionen mit reellen Zahlen entspricht
die Halbgruppe (G, ∗) den positiven reellen Zahlen mit der Multiplikation.
P
Das Gesamtgewicht Zn = |v|=n Lv (s) der n-ten Generation für den Anfangswert
s ist Yn (s) = Xn Xn−1 . . . X1 s, wobei wir Xi als Zg mit Werten in den positiven
reellen Zahlen genommen haben. Der Logarithmus des Produkts Yn ist eine
Summe von uiv Zgn und darüber ist viel bekannt.
Hier ein etwas anspruchvolleres Beipiel im IR2 . Die Multiplikation wird
nun durch Matrizen ersetzt und ist im allgemeinen nicht mehr vertauschbar.
Bsp: Iterierte affin lineare Abbildungen:
Sei H ein separabler Hilbertraum, endlich dimensional oder nicht [6]. Die
Werte der zufälligen Funktion Xn seien affin lineare Abbildungen auf dem
Hilbertraum H,
H 3 x 7→ Xn (x) = An x + bn .
Hierbei sind (An , bn ) uiv Zgn mit An ist eine (zufällige) lineare Abbildung
und bn ein (zufälliges) Element des Hilbertraumes.
Damit erhalten wir Yn als
Yn = bn + An bn−1 + An An−1 bn−2 + . . . An An−1 . . . A1 b0 + An An−1 . . . A1 A0
= An Yn−1 + bn .
Betrachte den gewichteten Verzweigungsprozess (in der algebraischen Beschreibung)
mit der Halbgruppe der linearen Abbildungen, beschrieben durch Matrizen,
auf dem Hilbertraum H bereichert um das Grab 4. Die Kantengewichte
sind gegeben durch W1 (v) = A|v| falls v nur aus Einsen besteht und Wi (v) ist
ansonsten die konstante Abbildung auf 4. Die Nutzenfunktion Uv : Ω →
R, mit R die Menge der Funktionen von Matrizen in Hilbertraumwerte,
identifizieren wir mit einer Abbildung Ũv : Ω → H durch M 7→ Uv (M ) =
M Ũv durch Auswertung der Matrix M and der Stelle Uv . Setze Ũv = b|v| für
v nur aus Einsen bestehend und ansonsten das Grab. Dann hat Rn
Rn :=
X
Uv (Lv )
|v|<n
dieselbe Verteilung wie Yn bei Start in Y0 ≡ 0. Dies ersieht man aus der
Rückwärtsgleichung
D
Rn = ARn−1 (1) + b
mit Rm (i) der Rm -Term für den Baum mit der Wurzel i. Hierbei sind (A, b), R·
unabhängig und (A, b) verteilt wie oben.
12
Konvergiert Rn in Verteilung gegen ein R [6], so erfüllt die Grenzverteilung
R die stochastische Fixpunktgleichung
D
R = AR + b.
Beispiele hierzu sind die Cantormenge, die Schneeflocke, das Sierpinski
Dreieck, der Farn, . . . .
Bsp: Cantormenge In einer Dimension d = 1 wähle A als eine Konstante
in (0, 1/2] und für die Kosten C nehmen den Wert 0 oder 1 − A mit Wahrsch.
1/2 an. Der stochastische Fixpunkt R hat das Cantormaß als Verteilung im
Fall A = 1/3 und das Lebesguemaß im Fall A = 1/2. Diese Konstruktion
läs̈t sich offensichtlich auch zufällig machen.
Cantor Menge
Bsp: Sierpinski Dreieck In Dimension d = 2 sei
A :=
Ã
1/2
0
0
1/2
!
und Ũ nimmt die Werte (0, 0), (1/4, 1/2), (1/2, 0) jeweils mit Wahrsch. 1/3
an.
13
Sierpinski Dreieck
Bsp: Kochkurve
Wie entsteht die Kochkurve? Folgendes Bild erläutert dies:
Kochkurve
Bsp: Farn Die wesentlichen Daten für den Farn sind: In zwei Dimensionen
d = 2 wähle (A, b) als
ÃÃ
ÃÃ
.02
0
−.139
.246
0
.27
! Ã
.263
.224
14
,
150
0
! Ã
,
!!
171
−10.8
,
!!
,
ÃÃ
.16
.222
ÃÃ
.781
−.032
−.215
.176
! Ã
,
122.4
26.79
!!
,
.034
.739
! Ã
32.25
81
!!
,
,
jeweils mit Wahrsch. 0, 01; 0, 15; 0, 13; 0, 71.
Definiere die Folge Xn von Zgn auf IRd rekursiv zu dem Anfangswert X0
durch
Xn+1 = An Xn + bn
mit (An , bn ), n ∈ IN0 unabhängige Zgn verteilt nach (A, b). Diese Folge für
eine feste Realisierung ω aufgezeichnet, zeigt, bis auf die Anfangspunkte,
fast sicher einen Farn. Die Zg Xn nähert sich nach einer Einschwingphase
dem Farn und springt dort hin und her. Der Träger der Verteilung des
stochastischen Fixpunktes der stochastischen Fipunktgleichung
D
R = AR + b
ist der gezeichnete Farn.
Farn
1.3
GVP mit beiden Strukturen
Bsp: Verzweigende Irrfahrt:
Das vielleicht einfachste Beispiel eines nicht ausgearteten GVP ist die
verzweigende Irrfahrt (Branching Random Walk) [5]. Ein Individuum
startet in 0 und erzeugt pro Zeiteinheit endlich viele Nachkommen. Diese
15
werden zufällig verschoben vom Aufenthaltsort der Mutter nach einer festen
Verteilung platziert. Danach verhalten sich sich alle Individuen unabhängig
voneinander und folgen demselben Teilungs- und Verschiebungsschema.
Die Halbgruppe sind die reellen Zahlen mit der Addition erweitert um
das Grab −∞. Die Verschiebung des i-ten Kindes der Mutter v entsprecht
dem Kantengewicht Wi (v). Die Position des Individuums v ist die Summe
der Einzelverschiebungen des Pfades von der Wurzel ∅ bis nach v.
Von Interesse sind z.B. die exponentiell gewichteten Gesamtverschiebungen
X
Zn :=
eWv
v∈Vn
in nter Generation oder das größte Gewicht in n-ter Generation
sup Wv .
v∈Vn
Die Größe
Zn
mn
P Wi
mit 0 < m = E i e < ∞ ist ein positives Martingal und konvergiert fast
sicher gegen einen Grenzwert. Dieser erfüllt wie oben die Fixpunktgleichung
5.
Die additive Grupps der reellen Zahlen ist isomorph zur multiplikativen
Gruppe der strikt positiven Zahlen. Der Isomorphismus ist die Exponentialfunktion.
Der Isomorphismus dehnt sich auf die Gräber aus, das additive Grab −∞
wird auf das multiplikative Grab 0 abgebildet. Daher sind die additive und
die multiplikative Darstellung äquivalent. Beide Beschreibungen desselben
Modells haben ihre Vor- und Nachteile. Für stochastische Fixpunktgleichungen
auf den reellen Zahlen ist die multiplikative Version vorzuziehen.
BSP: Gewichteter Verzweigungsprozess auf den reellen Zahlen:
Betrachte die multiplikative Gruppe der reellen Zahlen ohne die Null. Die
Gruppe ist isomorph zu der multiplikativen Gruppe IR> × {+1, −1} mit zwei
Zusammenhangskomponenten, den strikt positiven und den strikt negativen
Zahlen. Als Grab fügen wir die 0 hinzu. Die Halbgruppe G sind die reellen
Zahlen mit der Multiplikation.
Von Interesse sind auch hier z.B. das Gesamtgewicht
Zn :=
X
v∈Vn
16
Wv
oder das größte Gewicht
sup Wv
v∈Vn
in n-ter Generation.
Weitere Anwendungen ergeben sich durch Verwendung der Nutzenfunktion
und von Knotengewichten Uv . Wir verwenden Uv Ω → G und lassen Uv auf
G agieren via g 7→ g ∗ Uv . (Das Halbguppenelement wird mit einer Funktion
identifiziert.) Von Interesse sind z.B. die Zgn
Rn :=
X
v∈V<n
Wv ∗ Uv ,
die die Pfadgewichte multipliziert mit den Kosten aller Individuen bis zur nten Generation aufsummiert. Unter geeigneten Voraussetzungen konvergiert
Rn (eventuell nach Normierung) gegen eine Zg Q, die die stochastische Fixpunktgleichung
D
Q=
X
Wi Qi + U
i∈IN
erfüllt. Hierbei sind die Zgn (U, W1 , W2 , . . .), Qi , i ∈ IN unabhängig, Qi verteilt
wie Q und (U, W1 , W2 , . . .) verteilt wie (U∅ , (Wi )i ) des GVP. (Die obige Fixpunktgleichung
gilt auch fast sicher, falls Rn gegen Q fast sicher konvergiert und Rn (i), analog
Rn für den Baum iV, gegen Qi fast sicher konvergiert. Dabei ist U = U∅ .)
Die Zgn Q hat Anwendungen in der Analyse von Algorithmen, [24][25],
und allgemein für stochastische Fixpunktgleichungen. Ein prominentes Beispiel
hierzu ist die Quicksortverteilung [23] als einzige Lösung mit endlichem Erwartungswert
folgender stochastischen Fixpunktgleichung:
D
Q = XQ + (1 − X)Q + f (X).
Hierbei sind X, Q, Q unabhängige Zgn mit X hat eine gleichmäßige Verteilung
auf (0, 1) und Q dieselbe Verteilung wie Q. Die Funktion f : (0, 1) → IR ist
gegeben durch
f (x) = 2x ln x + 2(1 − x) ln(1 − x) + 1.
In der Notation gewichteter Verzweigungsprozesse wäre W1 = X, W2 =
1 − X, W3 = 0 = W4 = . . . , U = g(X).
17
In den bisherigen Beispielen haben wir als Halbgruppe eine mulltiplikative
Gruppe in den reellen Zahlen erweitert um das Grab genommen. Die kleinste
mögliche multiplikative Gruppe {1} fḧrte auf den Galton-Watson Prozess,
die multiplikative Gruppe IR> = (0, ∞) and die verzweigende Irrfahrt und
die multiplikative Produktgruppe (−∞, 0) ∪ (0, ∞) auf Anwendungen zur
Laufzeitanalyse von Algorithmen. Hier noch eine Algorithmenbeispiel mit
Prozesswertigen Zgn.
Bsp: Find oder Quickselect:
Wir beschreiben zuerst den Findprozess [8], wie er als Grenzwert des
Findsuchalgorithmus, (Algorithm 65, FIND oder QUICKSELECT und Algorithm
63, PARTITION, [11],) Anzahl der Vergleiche um die l-kleinste Zahl unter n
(verschiedenen) vorgegebenen zu finden, auftaucht.
Die Halbgruppe besteht aus halboffenen Intervallen [a, b) aus dem Einheitsintervall
mit der Verknüpfung
[a, b) ∗ [c, d) = [a + c(b − a), a + d(b − a)).
Das Grab wird gespielt von dem leeren Intervall und das neutrale Element
durch das halboffene Einheitsintervall I = [0, 1).
Seien Xv , v ∈ V unabhängige Zgn gleichverteilt auf dem Einheitsintervall.
Das Kantengewicht Wi (v) hat den Wert [0, Xv ), das Kantengewicht W2 (v) =
[Xv , 1) ist das Komplement von W1 (v) bzgl. dem halboffenen Intervall I und
alle anderen Kantengewichte Wi (v) sind das Grab.
18
6
r
tr
r
r
rr r r
Betrachte für t ∈ [0, 1) die Zgn
Zn (t) =
X
|v|≤n
|Wv |11t∈Wv ,
|J| die Länge eines Intervalls J, mit Werten in den Funktionen auf dem
halboffenen Einheitsintervall. (Per Definition wird W∅ identisch das neutrale
Element gesetzt.) Die Zgn Zn sind punktweise steigend für jedes t ∈ I. Der
Grenzwert Z = limn Zn ist der Findprozess. Er hat Werte im Raum D der
rechtsstetigen Funktionen mit linksseitigem Grenzwert auf dem halboffenen
Einheitsintervall I. Der stochastische Prozess Z ist ein Fixpunkt der Gleichung
(Z(t))t∈I = (11t<X XZ(
t
t−X
) + 11t≥X (1 − X)Z(
) + 1)t∈I .
X
1−X
(6)
Hierbei sind ist X, Z, Z unabhängig, X ist rechteckverteilt auf dem Einheitsintervall
I und Z hat dieselbe Verteilung in D wie Z. Dies charakterisiert Z eindeutig,
[8].
19
Aus der Fixpunktgleichung ersieht man die allgemeinere Struktur via
eines gewichteten Verzweigungsprozesses. Eine Zg Y : Ω × I, mit I jetzt
das abgeschlossenen Einheitsintervall, wird abgebildet auf
X
(Y (t))t 7→ (
Ai (t)Yi (Bi (t)) + C(t))t .
i
Hierbei sind Ai , C : Ω×I → IR, Bi : Ω×I ×I Zgn, mes̈bar bzgl. der Produkt
σ-Algebra. Die Zgn ((Ai , Bi )i , C), Yj , j ∈ N sind unabhängig und die Yj -Zgn
sind verteilt wie Y.
Wenn wir obige Abbildung mehrfach iterieren, erhalten wir, mit offensichtlicher
Notation,
X
i
Ai Yi ◦ Bi + C =
=
X
j
i
XX
i
=
X
Ai (
j
Ai Aij ◦ Bi Yij ◦ Bij ◦ Bi +
XXX
i
+
j
k
XX
i
Aij ◦ Bi Yij ◦ Bij ◦ Bi + Ci ◦ Bi ) + C
j
X
i
Ci ◦ Bi + C
Ai Aij ◦ Bi Aijk ◦ Bij ◦ Bi Yijk ◦ Bijk ◦ Bij ◦ Bi
Ai Aij ◦ Bi Cij ◦ Bij ◦ Bi +
X
i
Ci ◦ Bi + C
I
Die Halbgruppe G bestehe aus den Funktionen R+
× I I mit der Verknüpfung
∗
(A, B) ∗ (A0 , B 0 ) = (A + A0 ◦ B, B 0 ◦ B).
Die Halbgruppe G operiert auf R = D durch
(A, B) ∗ C = A C ◦ B.
Die Kantengewichte und die Nutzenfunktion ((Wi (v))i , Uv ) sind verteilt wie
((Ai , Bi )i , C).
P
Die Zg Rn := |v|≤n Wv ∗ Uv erfüllt die Rekursion
Rn+1 =
X
i
Wi ∗ Rn (i)
mit Rn (i) entsprechend für den Baum mit Wurzel i. Konvergiert jetzt Rn
geeignet [17], z.B. fast sicher gegen eine Zg R, so gilt die Fixpunktgleichung
R=
X
i
Wi ∗ R(i).
20
Für den Findprozess gilt Zn = Rn und Z = R.
Bsp: Verzweigende Markoff Prozesse:
Wir können verzweigende Markoff Prozesse analog zu Markoffprozessen
definieren. Sei (S, σ(S)) ein meßbarer Raum und K : S × σ(S IN ) → IR ein
Übergangskern. Mit Hilfe des Übergangskernes K definieren wir die Verteilung
des Übergang von Lv (s) nach (Lvi (s))i∈IN , s ein Startwert, unabhängig von
allem anderen. Wir erhalten eine Belegung aller Knoten durch die Pfade
analog wie für Markoffketten.
Einfacher ist die folgende Sichtweise: Unter ganz schwachen Voraussetzungen
kann man zu jedem Überganskern K eine mes̈bare(!) Funktion X : Ω →
S ( S IN ) finden mit
Ω 3 ω 7→ X(ω)(s)
hat Verteilung K(s, ·) für alle s ∈ S. Nehme uiv Kopien X(v) v ∈ V und
bilde den GVP mit den Kantengewichten (Wi (v))i = X(v). Dieser tut’s.
Umgekehrt, jedes iterierte Funktionensystem, wie obiges Beispiel Find,
ist auch eine Markoffkette. Die Übergänge sind S 3 f 7→ A · f ◦ B + C für
Funktionen f auf dem Einheitsintervall in sich.
2
Der vorwärtige und rückwärtige Blick
Zusätzlich habe S eine Struktur, in der Summe (oder Supremum, Infimum
. . . ) einen Sinn machen. Der Einfachheit halber betrachten wir das Gesamtgewicht
Zn der n-ten Generation und +, ∗ erfüllen die Distributivgesetze. Die Rekursion
für Z lautet ausführlich geschrieben,
Zn+1 =
X
v∈Vn+1
W (∅, v1 ) ∗ W (v1 , v2 ) ∗ . . . ∗ W (v|n−1 , v|n ) ∗ W (v|n , v).
Der Vorwärtsblick betrifft den Übergang von Zn nach Zn+1 , indem wir
von der n-ten Generation übergehen in die n + 1-Generation,
Zn+1 =
X X
(
|v|=n i∈IN
L(v) ∗ W (v, vi).
(7)
Der Rückwärtsblick betrifft ebenfalls den Übergang von Zn nach Zn+1 , nur
benutzen wir jetzt den Übergang von der 0-ten Generation zu der ersten,
Zn+1 =
X
i∈IN
W (∅, i) ∗ Zn (i).
21
(8)
Hierbei bezeichnet Zn (i) das Gesamtgewicht n-ter Generation für den Baum
mit Wurzel i.
Die Bedeutung der Begriffe vorwärts und rückwärts ergibt sich aus der
Anschauung. Für die Vorwärtsgleichung fügen wir jedem Individuum der nten Generation die nächste weitere Generation zu. Für die Rückwärtsgleichung
steht der Prozess mit n-Generationen startend von einem Individuum erster
Generation im Vordergrund. Danach werden diese Prozesse gewichtet mit
Wi (∅) und zusammengefaßt.
Die Vorwärtsgleichung wird uns Resultate für Zgn als Funktion liefern,
wie z.B. Konvergenzsätze via Martingalen. Die Methoden sind wahrscheinlichkeitstheoretischer Natur. Die Rückwärtsgleichung wird uns Verteilungsaussagen
für Zgn liefern, wie die Konvergenz gegen eine Grenzverteilung, die eine
stochastische Fixpunktgleichung erfüllt. Die Methoden sind eher maßtheoretischer
Natur, z.B. Kontraktionsmethoden für Maßräume.
Der Beweis für zufällige Iteration affin linearer Funktionen zeigt das
Zusammen- und Wechselspiel beider Anschauungen, mit dem gute Resultate
erzielt werden. Gleiches gilt für Resultate erzielt durch die Martingalstruktur
(Vorwärtsstruktur) und mit Hilfe der Kontraktionsmethode (Rückwärtsstruktur).
22
3
GVP auf den positiven reellen Zahlen.
Wir betrachten gewichtete Verzweigungsprozesse auf der multiplikativen Halbgruppe der positiven reellen Zahlen einschlies̈lich ∞. Das Grab ist die 0 und
P
konventionell gilt 0 ∗ ∞ = 0. GVP mit keinen Nachkommen i 11Wi =0 = 0
P
und GVP mit genau einem Nachkommen i 11Wi =0 ≡ 1 der nur einen Wert
P
annimmt ( i Wi identisch eine Konstante) sind prinzipiell ausgeschlossen.
Die Galton-Watson Prozesse gehören zur Halbgruppe und Kantengewichtsraum {0, 1}. Wir lassen, abweichend von GWP, unendlich viele Kantengewichte
ausgehend von einem Knoten zu. GVP zum Kantengwichtsraum {0, c}, c > 0
können nach Division durch c der Kantengewichte auf die Halbgruppe {0, 1}
zurückgeführt werden. Damit sind wir im Bereich der GWP. Die nächst
einfache Halbgruppe rIN ∪{0} werden erzeugt von einer strikt positiven reellen
Zahl r ungleich 1 erweitert um das Grab 0. Diese multiplikative Halbgruppe
ist isomorph zu der additiven Halbgruppe IN0 . Die weiteren sind rZZ ∪ {0}
usw.
Das Hauptinteresse dieses Abschnittes liegt auf dem Gesamtgewicht
Zn =
X
Wv
i∈IN
in n-ter Generation. Eine wesentliche Rolle werden die Vorwärts- und Rückwärtsgleichung spielen.
3.0.1
Die Vorwärts- und Rückwärtsgleichung
Der Z Prozess erfüllt die Vorwärtsgleichung
Zn+1 =
X X
|v|=n i∈IN
Wv ∗ Wi (v)
(9)
und die Rückwärtsgleichung
Zn+1 =
X X
i∈IN v∈V
Wi ∗ Wv (i) =
X
i∈IN
Wi ∗ Zn (i).
(10)
Hierbei bezeichnet Zn (i) das Gesamtknotengewicht n-ter Generation für den
Baum iV zur Wurzel i.
Die Bedeutungen der Begriffe vorwärts und rückwärts ergeben sich direkt
aus der Anschauung. Für die Vorwärtsgleichung fügen wir jedem Pfad bis zur
23
n-ten Generation alle weiteren Kanten zu. Dies entspricht einer iterativen
Vorgehensweise. Für die Rückwärtsgleichung stehen die Abkömmlinge der
Gründerindividuen i im Vordergrund, von denen dann die Pfade jetzt der
Länge n starten. Der Vorteil dieser Betrachtsweise besteht im Zusammenfassen
aller Pfade in i startend. Dies ist eine rekursive Betrachtung.
Verweilen wir bei den Vorteilen der rückwärtigen Betrachtung. Die Rueckwaertsgleichung liefert uns eine Vorschrift, aus der Verteilung von Zn diejenige
von Zn+1 zu erhalten. Sei K diese Abbildung. Dann hat Zn als Verteilung
die n-fache Iteration K n (δ1 ) bei Start im Punktmaß δ1 auf 1. Ein eventueller
Grenzwert in Verteilung entspricht der Konvergenz der Iterierten K n (δ1 )
gegen einen Fixpunkt von K.
Bezeichne ϕY , ϕY (t) := Ee−tY , t ≥ 0 die Laplace Transformierte einer
Zg Y und sei ϕn = ϕZn die Laplace Transformierte von Zn .
Proposition 1 Die Rückwärtsgleichung (8) schreibt sich in der äquivalenten
Form
Y
ϕn+1 (t) = E ϕn (tWi ).
(11)
i
Beweis:
P
ϕn+1 (t) = Ee−tZn+1 = E(E(e−t i Wi Zn (i) | (Wi )i )))
Y
Y
= E( E(e−tWi Zn (i) | (Wi )i )) = E( ϕn (tWi ))
i
i
q.e.d.
Konvergiert Zn schwach gegen Z, so konvergieren die Laplacetransformierten
ϕn punktweise und monoton in n und die Laplacetransformierte ϕZ von Z
erfüllt die Fixpunktgleichung, verwende mootone Konvergenz in der Rückwärtsgleichung
Y
ϕ(t) = E( ϕ(tWi ))
(12)
i
Hier eröffnet sisch ein potentieller Weg zur Bestimmung und Charakterisierung
der Grenzverteilung von Z.
Jetzt zu den Vorteilen der vorwärtigen Betrachtung. Sei m endlich. Die
Zn
Zgn m
n bildet ein Martingal bzgl. der Filtration An , die kleinste σ-Algebra
aufgespannt von allen Kantengewichten bis zur n-ten Generation
E(Zn+1 | An ) =
X
|v|=n
X
Wv ∗ E(
i
24
Wi (v) | An ) =
X
|v|=n
m = Zn m.
Jedes positive Martingal konvergiert fast sicher. Damit haben wir einen fast
sicheren Grenzwert der Zn gefunden.
Zusammenfassend: Der vorwärtige Blick betrifft Zgn und liefert Konvergenz
von Zgn. mit eher wahrscheinlichkeitstheoretischen Hilfsmitteln. Der rückwärtige
Blick betrifft Verteilungen und liefert Konvergenz von Verteilungen mit eher
mas̈theoretischen Hilfsmitteln.
4
Die Aussterbewahrscheinlichkeiten
Sir Francis Galton, ein Cousin des Naturforschers Charles Darwins, angeregt
durch dessen grundlegendes Buch von 1859, ber die Entstehung der Arten
durch natrliche Zuchtwahl oder Die Erhaltung der begnstigten Rassen im
Kampfe ums Dasein (Original: On the Origin of Species by Means of Natural
Selection, or the Preservation of Favoured Races in the Struggle for Life),
versuchte auf der Vererbungsgrundlage in seinem Buch Heriditary Genius
(Deutsch: Genie und Vererbung) den Niedergang adliger Familien zu erklären.
Später schrieb er: Es gibt viele Beispiel dafür, dass Nachnamen, die einst
verbreitet waren, seltener wurden oder ganz verschwanden. Die Tendenz ist
überall zu beobachten und zu ihrer Erklärung wurde vorschnell der Schluss
gezogen, dass eine Zunahme an physischem Komfort und intellektueller Fähigkeit
notwendigerweise mit einer Minderung der Fruchtbarkeit einhergeht. Galton
bot eine andere, gesellschaftliche Erklärung an: Männer, deren Status sich
kürzlich erhöht hat, versuchen ihre Position abzusichern, indem sie Erbinnen
heiraten - per Definition Frauen aus Familien ohne Söhne. Solche Frauen
würden auch selbst mit geringerer Wahrscheinlichkeit Söhne gebären.
Nach dem Einwand des Schweizer Botanikers Alphonse de Candolle auf
ein rein zufälliges Phänomen, stellt er diese wahrscheinlichkeitstheoretische
Frage 1873 im Journal Educational Times. Der Reverend, Schullehrer und
Mathematiker Reverend Henry William Watson gab eine Antwort, die gemeinsam
1874 erschien, On the probability of extinction of families. Dies ist die Grundlage
des Galton-Watson Pozesses. (Dies Konzept, wie erst viel später herausgefunden
wurde, war (unabhängig) früher von I. J. Bienaym diskutiert worden [13] [10].
Die übliche Definition eines Galton-Watson Prozesses ist: Seien Xn,i , n, i ∈
IN0 uiv Zgn mit Werten in IN0 . Der Galton-Watson Prozess (Zn )n ist rekursiv
25
definiert durch
Zn+1 =
Zn
X
Xn,i
(13)
i=1
mit der Anfangsbedingung Z0 = 1. Die Verteilung von X heißt die Nachkommenschaftsverteilung
Wir schliessen per Definition den uninteressanten Fall X identisch 1 oder
identisch 0 aus.
Galton-Watson Prozesse sind spezielle gewichtete Verzweigungsprozesse
auf der multiplikativen Halbgruppe G = {0, 1}. Beobachtet werden die lebenden
Nachkommen, alle Knoten v mit Wv = 1. Die Verteilung der Nachkommen
P
Xv = i Wi (v) des Individuums v ist die Nachkommenverteilung. Während
der gewichtete Verzweigunsprozess eine namensgebung nach der Abstammung
vergibt, nummeriert der Galton-Watson Prozess die Individuum n-ter Generation
willkürlich.
Wir wollen eine unendliche Nachkommenanzahl zulassen. Der GWP betrachtet
nur endlich viele Nachkommen, was biologisch sinnvoll erscheint. Für abstraktere
Anwendungen des GVP benötigen wir unendlich viele Nachkommen.
Sei qn = P (Zn = 0) die Wahrscheinlichkeit, dass der Prozess in nter Generation bereits ausgestorben ist. Aus Monotoniegründen konvergiert
qn aufsteigend gegen die Aussterbewahrscheinlichkeit q = P (∃nZn =
0) = limn qn . Sehr viele Aussagen von Galton-Watson Prozessen, wie auch
die Analyse über Aussterbewahrscheinlichkeiten, basieren auf dem Studium
erzeugender Funktionen.
Erzeugende Funktionen Die erzeugende Funktion fY einer Zg Y mit
Werten in den natürlichen Zahlen einschlies̈lich der 0 und ∞ ist die Funktion
[0, 1] 3 s 7→ fY (s) := EsY . Beachte, das Y eventuell Masse auf ∞ hat und
nur das halboffene Intervall (0, 1) für die erzeugende Funktion betrachten.
Die erzeugende Funktion ist wohl definiert. Aus der erzeugenden Funktion
erhalten wir die Verteilung von Y durch die Koeffizienten, die sich durch
Ableitungen ermittlen lassen, eindeutig zurück. Die Masse P (Y = ∞) ergibt
sich aus 1−lims%1 f (s). Dies ergibt eine Bijektion zwischen Wahrscheinlichkeitsverteilungen
auf IN0 und erzeugenden Funktionen.
Die erzeugende Funktion hat viele schöne Eigenschaften, aufsteigend,
konvex, steitig in [0, 1), stetig differenzierbar in (0, 1) usw. Ein Unstetigkeitspunkt
ist eventuell 1 da 1 − lims%1 f (s) der Masse P (Y = ∞) entspricht.
Lemma 2 Seien Yi , i ∈ IN uiv Zgn mit Werten in N 0 und sei τ eine davon
unabhängige Zg ebenfalls mit Werten in N 0 . Sei f die erzeugende Funktion
26
der Y -Zgn und g die erzeugende Funktion von τ. Dann hat die Zg
die erzeugende Funktion g ◦ f.
Bew: Die Zg
Pτ
i=0
Es
Pτ
i=0
Yi
Yi ist wohldefiniert.
P
i≤τ
Yi
= E
∞
X
11τ =j s
j=0
Pj
i=1
X
11τ =j E(
X
11τ =j E(
X
11τ =j
= E(
j
Y
j
Y
j
i=1
X
j
= E(
sYi | τ = j))
sYi ))
i=1
j
= E(
j
Y
i=1
j
= E(
Yi
E(
j
Y
sYi ))
i=1
11τ =j f (s)) = Ef τ (s) = g(f (s)).
j
q.e.d.
Wir verwenden f für die erzeugende Funktion der Nachkommenschaftsverteilung
P
Xv = i Wi (v) in der GVP-Notation. Sei m = f 0 (1−) und fn die n-fache
Komposition von f.
P
Sei Zn = |v|=n Wv die Anzahl der lebenden Individuen eines GWP in der
GVP-Notation. Beachte die Vorwärtsdarstellung und die Rückwärtsdarstellung
Zn+1 =
X X
Wv Wi (v) =
|v|=n i∈IN
X X
Wi Wv (i).
i∈IN |v|=n
Proposition 3 Die erzeugende Funktion von Zn aus (13) ist fn .
Bew: Wir zeigen die Behauptung durch Induktion nach n. Die erzeugende
Funktion von Z1 ist f nach Definiton von Z1 = X. Nun der Induktionsschritt
von n auf n+1. Beachte hierbei die Unabhängigkeit von Zn und der Xv , |v| ∈
V
EsZn+1 = Es
P
i∈IN
sup|v|=n Wi Wv (i)
(sWi s
Y
= EE(
i
Y
= EE(
i
sWi E(s
P
v
Wv
P
v
Wv
) | Wi , i ∈ IN )
| Wi , i ∈ IN ) = f (fn (s)) = fn+1 .
q.e.d.
27
Satz 4 Die Aussterbewahrscheinlichkeit q eines GWP mit eventuell unendlich
vielen Nachkommen ist der kleinste Fixpunkt der erzeugenden Funktion f. Es
gilt q < 1 genau dann wenn entweder f (1−) < 1 oder f (1−) = 1 und m > 1
gilt.
Bew: Die W-keiten qn = P (Zn = 0) = fn (0) erfüllen
f (qn ) = f (fn (0)) = fn+1 (0) = qn+1 .
Sei f (1−) = 1. Damit gilt, beachte f ist eine stetige, monoton steigende
Funktion auf dem gesamten abgeschlossenen Einheitsintervall
f (q) = f (lim
qn ) = lim
f (qn ) = lim
qn+1 = q.
n
n
n
Für die Eindeutigkeit sei r ein weiterer Fixpunkt von f . Es gilt 0 ≤ r und die
Monotonie von f bzw. fn impliziert fn (0) ≤ fn (r) = r. Im Grenzwert folgt
q ≤ r. Da [0, 1] 3 s 7→ f (s) − s eine strikt konvexe Funktion ist, (wir hatten
X ≡ 0 ausgeschlossen), hat f maximal zwei Fixpunkte. Der Wert 1 ist stets
ein Fixpunkt. f hat einen zweiten Fixpunkt genau dann, wenn f 0 (1)−1 strikt
positiv ist. Dies ist äquivalent zu f 0 (1) = m > 1.
Im Fall f (1−) < 1 hat f mindestens einen Fixpunkt s0 < 1, da f stetig
ist auf [0, 1) und [0, 1) 3 s 7→ f (s) − s das Vorzeichen wechselt. Zeige per
Induktion qn ≤ s0 und verwende dann die Stetigkeit wie eben um q als
kleinsten Fixpunkt zu erhalten.
q.e.d.
Ohne Beweis sei angefügt, f hat stets höchstens einen Fixpunkt in [0, 1)
und keinen genau dann wenn f (1−) = 1 und m ≤ 1 gilt.
Diesen Satz wenden wir auf einen GVP an. Sei 4 das Grab und Zn =
P
1Wv 6=4 die Anzahl der Knoten n-ter Generation, denen nicht durch die
|v|=n 1
Pfade der Wert 4 zugeordnet wird. Die Anzahl der lebenden Nachkommen
P
des Individuums v ist Xv = i 11Wi (v)6=4 . Hiermit ergeben sich, sei Zn die
Anzahl der lebenden Nachkommen in n-ter Generation, die Aussterbewahrscheinlichkeiten
qn = P (Zn = 0) und q = P (∃n Zn = 0) = limn qn eines GWP. Das
Anwendung von Satz 4 auf GVP lautet:
Korollar 5 Die Aussterbewahrscheinlichkeit q eines GVP ist der kleinste
Fixpunkt der erzeugenden Funktion f. Es gilt f (qn ) = qn+1 ↑n q. Die Aussterbewahrscheinlichkeit
q ist 1 genau dann wenn f (1−) = 1 und m ≤ 1 gilt.
28
Watson, der diese Charakterisierung der Aussterbewahrscheinlichkeit gezeigt
hatte, machte kurz vor dem Ziel einen Schnitzer. Er setzte als Beispiel die
5
erzeugende Funktion als f (s) = (3+s)
an, was durchaus akzeptabel ist,
210
übersah aber die Lösung f (0, 55) = 0, 55. Stattdessen erhielt er als Aussterbewahrscheinlichkeit
den Wert 1 und schrieb: Alle Nachnamen haben daher die Tendenz auszusterben.
Dieses Resultat war eigentlich vorhersehbar, denn ein Nachname, wenn er erst
verloren ist, kann niemals wiederhergestellt werden, und mit jeder nachfolgenden
Generation erhöht sich die Chance des Verlustes. Damit war die Chance
vertan.
4.1
Das Gesamtknotengewicht Zn
Wie groß ist in der Regel das Gesamtknotengewicht
Zn =
X
Wv
|v|=n
Zn
der n-ten Generation? Den Schlüssel liefert das Martingal Mn = m
n.
Mit An bezeichnen wir die kleinste σ-Algebra erzeugt von allen Kantengewichten
Wi (v), |v| < n, i ∈ IN für Kanten (v, vi) bis zur n-ten Generation. Sei
P
Xv = i Wi (v) und m = EX.
Satz 6 Sei der durchschnittliche Zuwachs m strikt positiv und endlich. Dann
ist M = (Mn )n∈IN ein positives Martingal bzgl. der Filtration (An )n∈IN und
konvergiert fast sicher gegen einen Grenzwert, genannt M∞ , mit Erwartungswert
0 ≤ EM∞ ≤ 1.
v
( Xmv −
Beweis: Die Differenz Dn = Mn −Mn−1 hat die Darstellung |v|=n−1 mWn−1
1). (Dies folgt aus der Vorwärtsgleichung.) Die Martingaleigenschaft ist äquivalent
zu E(Dn | An−1) = 0 für alle n,
P
Wv Xv
(
− 1) | An−1 )
mn−1 m
|v|=n−1
E(Dn | An−1 ) = E(
=
X
Wv
Xv
E(
− 1) | An ) = 0.
n−1
m
m
|v|=n−1
X
Jedes positive Martingal konvergiert fast sicher gegen einen Grenzwert. Das
Lemma von Fatou liefert
1 = limninf EMn ≥ E limninf Mn = EM∞ ≥ 0.
29
q.e.d.
Das Gesamtknotengewicht n-ter Generation ist pfadweise von der Größenordnung
Zn ∼ M ∞ m n .
Bsp: Die Hausdorffdimension zufälliger Cantormengen.: Anstelle
des mittleren Drittels wie bei der (deterministischen) Cantormenge 1.1 schneiden
wir zufällig ein Intervall heraus.
Formal: Seien (Av , Bv ), v ∈ V uiv Zgn mit 0 ≤ Av , Bv ≤ 1, Av +
Bv < 1. Sei S die Menge der abgeschlossenen Intervalle in den positiven
reellen Zahlen einschlies̈lich des leeren Intervalls {∅}. Die Kantengewichte
sind Transformationen von S nach S
Tv,1
Tv,2
[a, b] 7→ [a, a + Av (b − a)]
[a, b] 7→ [b − Bv (b − a), b]
und Tv,3 = {∅} = Tv,4 = . . . . Die zufälligen Cantormengen sind die Grenzwerte
C = C(ω) der fallenden Folgen Cn := ∪|v|=n Lv ([0, 1]) von abgeschlossenen
Mengen bei vorgegenem ω ∈ Ω.
Die Hausdorffdimension H(C) einer Menge C aus den reellen Zahlen wird
definiert als das Infimum aller α < 0 mit lim²→0 Hα,² (C) < ∞. Hierbei ist
P
Hα,² (C) das Infimum aller Summen n∈IN |Un |α , wobei jedes Un ein Intervall
höchstens der Länge ² ist und ∪i∈IN Ui eine Überdeckung der Menge C ist.
Wir behaupten, die Hausdorffdimension einer zufälligen Cantormenge ist
fast sicher kleiner gleich α0 , wobei α0 > 0 durch EAα1 0 + EB1α0 = 1 gegeben
wird. Wir betrachten die Folge Uv = Lv ([0, 1]), |v| = n von Überdeckungen.
Das Supremum sup|v|=n |Uv | der n-ten Überdeckung ist absteigend. Es konvergiert
gegen 0, da der Erwartungswert
E( sup |Uv |)2α0 ≤ E
|v|=n
X
|v|=n
|Uv )|2α0 = mn →n 0
2α0
0
= EA2α
+ EB12α0
i |Ti ([0, 1))|Uv |
1
P
ist Hα0 ,² (C) ≤ |v|=n |Uv |α0 =: Mn für
m = E
< 1 gegen 0 konvergiert.
hinreichend gros̈es n. Das
Folglich
Martingal Mn konvergiert fast sicher gegen einen endlichen Wert. Dies zeigt
lim²→0 H²,α0 (C) ≤ limn Mn < ∞ fast sicher und damit die Behauptung.
Der Wert α0 ist tatsächlich die Hausdorffdimension [22]. Dies Ergebnis
umfasst auch die deterministische Cantormenge mit Av und Bv identisch 1/3.
P
4.1.1
Momente von Zn
Wie groß ist das Gesamtknotengewicht Zn in n-ter Generation? In diesem
Abschnitt berechnen wir die ersten beiden Momente.
30
Da diese Aufgabenstellung die Verteilung betrifft, liegt es nahe, die Rückwärtsgleichung
zu benutzen. Wir erhalten gute Rekursionen, die sich explizit lösen lassen.
Die Rechnungen für natürliche Momente werden kürzer (und etwas einfacher)
Zn
durch konsequente Ausnutzung der Martingalstruktur von Mn = m
n bzgl der
σ-Algebren An erzeugt von allen Kantengewichte bie zur n-ten Generation.
Wir nutzen die Martingaldifferenzdarstellung des Martingals Mn als Teleskopsumme
Mn − 1 =
n
X
Di
i=1
mittels der Martingaldifferenzen Di = M − i − Mi−1 .
P
P
(2)
Sei Zn(2) := |v|=n Wv2 , m(2) := EZ1 = E i Wi2 und σ 2 = Var X
.
m
Proposition 7 Die Nachkommenschaft Xv = i Wi (v) habe endliches erstes
Moment m = EX < ∞ und endliche Varianz σ 2 = VarX. Es gilt
P
E
E
Zn
= 1
mn
Zn(2)
= 1
m2 (n)





Zn
Var( n ) = σ 2 m2n 
m


mn (2)
m2n
m(2)
1− 2
m
falls
m(2) 6= m2
n
falls
m(2) = m2
1−

Beweis: Wir benutzen die Darstellung des Martingals Mn − 1 = ni=1 Di über
P
v
die Martingaldifferenzen Di = M − i − Mi−1 = |v|=i−1 mWi−1
( Xmv − 1). Der
Erwartungswert der Martingaldifferenzen
P
E(Di ) = EE(Di | Ai−1 ) = E
Wv Xv
E(
− 1 | Ai−1 ) = 0
mn
m
|v|=i−1
X
ist natürlich 0.
Die zweite Behauptung folgt aus der ersten für den GVP mit Kantengewichten
(2)
Wi2 (v). (Dann ist mZnn(2) ein Martingal.)
Die Varianz von Mn berechnet sich zu
n
X
E(Mn − 1)2 = E(
i=1
Di ) = E
n
X
Di2 + E
i=1
31
X
1≤i6=j6=n
Di Dj = E
n
X
i=1
Di2 .
Beachte, die gemischten Terme EDi Dj sind 0 für i 6= j. Zum Beispiel für
i < j benutze die bedingte Erwartungen EDi Dj = EE(Di Dj | Aj−1 ) =
E(Di E(Dj | Aj−1 )) = 0.
Wv Xv
(
− 1))2
i−1 m
m
|v|=i−1
EDi2 = E(
X
Wv2 Xv
(
− 1))2 + 0
2(i−1) m
m
|v|=i−1
= E(
=
X
X
|v|=i−1
= σ2
E(
Wv2
Xv
)E((
− 1))2 )
m2(i−1)
m
mi−1 (2)
.
m2(i−1)
W w Xw
W v Xv
Alle gemischten Terme E( m
n ( m − 1)) mn ( m − 1)) sind 0, da wir auf Ai−1
bedingen können, Unabhängigkeit ausnutzen und E( Xmv − 1) = 0 gilt. Wir
erhalten
n−1
X mi (2)
Zn
.
Var n = σ 2
2i
m
i=0 m
Dies ist eine geometrische Reihe mit dem Faktor m(2)
. Die Fallunterscheidung
m2
nach dem Faktor gleich oder ungleich 1 liefert das Resultat.
q.e.d.
Auch höhere Momente ließen sich berechnen, falls notwendig. Die Ausdrücke
werden mit steigender Potenz schwieriger. Aber es ist machbar und man
erhält (durchaus handhabbare) Formeln.
Eine typische Anwendung ist:
Korollar 8 Sei m(2) < m2 und EX 2 < ∞. Dann ist M gleichgradig integrierbar
und gleichgradig 2-integrierbar. Damit konvergiert das Martingal M fast sicher
und in L2 .
Beweis: Der Satz folgt direkt aus dem Theorem 45 des Anhangs.
q.e.d.
Beispiel: Für einen superkritischen (1 < m < ∞) Galton-Watson Prozess
Zn
mit endlicher Varianz der Nachkommenschaft ist Mn = m
n ein gleichgradig
2-integrierbares Martingal. Die Varianz von Z∞ berechnet sich als Grenzwert
der Varianzen der Zn .
32
4.1.2
Andere Momente
Aus der Martingaldifferenzdarstellung erhalten wir Abschätzungen für pMomente 1 < p < 2 von Z.
Lemma 9 Sei m endlich und es existiere ein 1 < p ≤ 2 mit endlichem
P
m(p) = E i Wip und EX p . Es gilt

¯p  n
¯
¯
¯
X
EMnp ≤ 1 + E ¯¯ − 1¯¯  1−( m(p)
)n
mp
m
1−
m(p) = mp
falls
sonst
m(p)
mp
Im Fall m(p) < mp ist das Martingal M gleichgradig p-integrierbar und
konvergiert fast sicher und in Lp .
Beweis: Wir wollen die ARTV-Ungleichung (??) aus dem Anhang anwenden.
− 1|p .
Sei zur Abkürzung a = E| X
m
Sei zuerst n fest und ϕ : Vn−1 → IN eine Abzählung (=bijektive Abbildung)
von Vn−1 . Dann ist
Yj :=
X
ϕ(v)≤j
Wv
mn−1
Ã
!
X(v)
−1
m
ein Martingal mit den Martingaldifferenzen
Yj − Yj−1
Wv
=
11ϕ(v)=j n−1
m
|v|=n−1
X
Ã
!
X(v)
−1 .
m
Eine Anwendung der ARTV-Ungleichung auf das positive Martingal (Mn−1 +
Yj )j liefert
p
E(Mn−1 + Yj ) −
p
EMn−1
≤
X
X
|v|=n ϕ(v)≤j
≤ a
X
ϕ(v)≤j
Ã
¯
¯
¯ W v ¯p
¯
E ¯ n−1 ¯¯
m(p)
≤ a
mp
33
¯
Ã
!¯p
¯ W
¯
X(v)
v
¯
E ¯¯ n−1
− 1 ¯¯¯
m
m
m
!n−1
< ∞.
(14)
(15)
(16)
Daher ist (Mn−1 + Yj )j ein positives Lp -Martingal und konvergiert in Lp und
f.s. gegen den Grenzwert Mn . Wir erhalten
Ã
m(p)
E|Mn |p − E|Mn−1 |p ≤ a
mp
!n−1
.
Eine erneute Anwendung der ARTV-Ungleichung mit der Funktion x 7→
x liefert
p
p
E|Mn | − 1 ≤ 2
n
X
j=1
p
p
(E|Mj | − E|Mj−1 | ) ≤ a
n
X
i=1
Ã
m(p)
mp
!n−1
Im Fall m(p) < m ist E|Mn |p gleichmäßig beschränkt durch 1 + a
damit das Martingal gleichgradig p-integrabel.
.
1
1−
m(p)
mp
und
q.e.d.
Korollar 10 Sei m endlich und es existiere ein 1 < p ≤ 2 mit m(p) < mp
und EX p < ∞. Dann ist M gleichgradig integrierbar und gleichgradig pintegrierbar. Damit konvergiert das Martingal M fast sicher und in Lp .
Beweis: Der Satz folgt direkt aus dem Theorem 45.
q.e.d.
Beispiel: Für einen superkritischen (1 < m ≤ 2) Galton-Watson Prozess
mit endlichem p-ten Moment der Nachkommenschaft für ein 1 < p ≤ 2 ist
Zn
Mn = m
n ein gleichgradig p-integrierbares Martingal für 1 < p ≤ 2.
4.1.3
Die stochastische Fixpunktgleichung von M
Ziel der nächsten Sektionen ist es die Menge M = 0 genauer zu betrachten.
Die Aussage Zn (ω) ist von der Größenordnung M (ω)mn macht erst besonders
Sinn, falls M (ω) > 0 gilt.
Eine Verteilung µ erfüllt die Fixpunktgleichung
D
X=
X
Ai Xi + C
(17)
i
bzgl. dem Wertebereich B falls alle Zgn Werte in B haben und die Verteilung
P
der rechten Seite als Grenzwert der Verteilungen i≤n Ai Xi +C wohldefiniert
ist. Die Zgn (C, A1 , A2 , . . .), Xi , i ∈ IN sind unabhängig und alle X-Zgn haben
D
dieselbe Verteilung µ. Das Symbol = steht für Gleichheit der Verteilung. Aber
34
Vorsicht, die Regelregeln mit Gleichheit und Gleichheit in Verteilung sind
verschieden. (Zum Beispiel kann man im letzteren keine Zgn auf beiden Seiten
addieren.) Sprachlich benutzt man auch, eine Zg erfüllt eine stochastische
Fixpunktgleichung, wenn dies für die Verteilung der Zg gilt. Die Unabhängigkeit
ist Bestandteil der Definition und wird nicht jedesmal neu gefordert.
Wenn wir die Angabe des Wertebereiches weglassen, ist das default setting
die reellen Zahlen. Implizit wird damit auch die Wohldefiniertheit der rechten
Seite gegeben. Durch Annahmen in Sätzen wird diese dann gewährleistet.
Da wir nur positive Zgn betrachten und den Wert ∞ zulassen, haben wir in
diesem Abschnitt keine Probleme mit der Wohldefiniertheit. Falls notwendig,
werden wir dies spezifizieren.
Beachte, wenn wir eine Lösung X der Lösung der Fixpunktgleichung (??)
P
haben, so gibt es Versionen von X, Xi und ((Ai )i , C) mit X = i Ai Xi + C
fast sicher. Definiere einfach X durch vorgegebenen Zgn auf der rechten Seite
als Zgn durch die rechte Seite.
Äquivalent zur Fixpunktgleichung ist die Gleichung
ϕ(t) = EetC
Y
ϕ(tAj )
(18)
j
für Laplace- oder Fouriertransformierte ϕ und der Parameter t geeignet reell
oder imaginär. Aus der stochastischen Fixpunktgleichung ?? folgt für die
Transformierte ϕ(t) = EetX mit bedingten Erwartungen
ϕ(t) = EE(etC
Y
j
etAj Xj | A, C) = E(etC
Y
j
E(etAj Xj | A, C)) = EetC
Y
ϕ(tAj ).
j
Umgekehrt aus einer Lösung von Gleichung (18) durch eine Transformierte ϕ
ergibt sich aus der Eindeutigkeit eine Lösung der stochastischen Fixpunktgleichung
??.
q.e.d.
Lemma 11 Gegeben sei ein GVP auf den positiven reellen Zahlen mit m <
∞. Dann erfüllt M die Gleichung
M=
X Wi
m
i
M (i)
(19)
mit M (i) der entsprechende Grenzwert auf dem Baum iV. Insbesonders erfüllt
M die Fixpunktgleichung ??
D
X=
X Wi
i
35
m
Xi
(20)
Es gilt EM ≤ 1.
Beweis: Definiere das Gesamtknotengewicht Zn (i) = |v|=n Wv (i) der n-ten
Generation des Baumes iV mit Wurzel i und betrachte die Rückwärtsdarstellung
P
Mn+1 =
X Wi Zn (i)
Zn+1
=
.
n+1
n
m
i m m
Die linke Seite konvergiert f.s. als positives Martingal gegen M. Das Lemma
von Fatou liefert EM = E limn Mn ≤ limn EMn = 1.
Falls wir auch auf der rechten Seite zum Grenzwert übergehen dürften,
würde Gleichung (19) und damit Gleichheit in Verteilung. Der Grenzübergang
ist nicht offensichtlich und benötigt ein Argument.
P
P
i Zn (i)
i
Für endliches N konvergiert i≤N W
gegen i≤N W
M (i). Dieser
m mn
m
Wert ist punktweise dominiert bei M und konvergiert mit N → ∞ gegen
P Wi
i m M (i) ≤ M∞ . Nehmen wir auf beiden Seiten den Erwartungswert, so
erhalten wir fast sichere Gleichheit.
q.e.d.
Die Fixpunktgleichung ?? hat eventuell mehrere Lösungen. Vielfache einer
Lösung sind ebenfalls ein Lösung. X ≡ 0 ist stets eine Lösung, wenn auch
eine triviale. Es gibt Fälle in denen M ≡ 0 gilt. (Siehe den Satz von KestenStegum oder die Sektionen über Maßtransformierte.) Ist das Martingal M
jedoch gleichgradig integrierbar, so konvergiert Mn in L1 und die Zg M hat
Erwartungswert 1. Insbesonders ist M∞ nicht ausgeartet und wir haben einen
nicht trivialen Fixpunkt.
Natürlich ließe sich obiges Resultat auch mit Transformierten erreichen.
Betrachte die Laplace Transformierten ϕn , ϕn (t) = Ee−tMn , t ≥ 0 von Mn .
Diese sind punktweise aufsteigend in n, verwende Jensens Ungleichung und
P
die vorwärtige (=iterative) Blickweise, Yv = i Wi (v),
−t
ϕn+1 (t) = Ee
= EE(
Wv Yv
|v|=n mn m
P
Y
Wv Yv
m
e−t mn
|v|=n
= E(
Wv Yv
m
Y
E(e−t mn
Y
e−t mn E m |An ) )
|v|=n
≥ E(
| An )
|v|=n
Wv
Yv
= E(e−tMn ) = ϕn (t).
36
| An ))
ϕn konvergiert punktweise gegen einen Grenzwert, und dies muß die Laplace
Transformierte ϕ von M sein (eventuell ausgeartet). Aus der Rückwärtsgleichung
1 erhalten wir
ϕn+1 (t) = ϕn+1 (t) = E
Y
ϕn (tWi ) = E
i
Y
ϕn (tWi )
i
und damit für den punktweisen Grenzwert
ϕ(t) = E
Y
ϕ(tWi ).
i
Dies entspricht der stochastischen Fixpunktgleichung 20 wegen der Eindeutigkeit
der Laplace Transformierten. Beachte auch, alles ist wohldefiniert in IR+ .
q.e.d.
4.1.4
Die W-keit P (M∞ = 0).
Wann ist M∞ identisch 0. Als Folgerung aus der stochastischen Fixpunktgleichung
(20) berechnen wir die Wahrscheinlichkeit P (M∞ = 0).
P
Sei X̂ = i 11Wi 6=0 die Anzahl der Nachkommen und f die erzeugende
Funktion [0, 1] 3 s 7→ f (s) = EsX̂ von X̂. (Im Punkt 0 benutzen wir die
stetige Fortsetzung durch die Konvention 00 = 1.) Wir lassen unendlich viele
Nachkommen zu (X̂ kann den Wert unendlich annehmen).
Lemma 12 Sei Y eine Lösung der Fixpunktgleichung
D
Y =
X
Wi Yi
(21)
i
auf dem Wertebereich B = [0, ∞). Dann ist P (Y = 0) ein Fixpunkt von f.
Beweis:
P (Y = 0) =
N
X
lim P (
N →∞
X
= lim
N
= lim
N
Wi Yi = 0)
i=1
J⊂{1,2,...,N }
X
J
P (J = {i ≤ N | Wi > 0}, ∀j ∈ J : Yj = 0)
P (J = {i ≤ N | Wi > 0})P (∀j ∈ J : Yj = 0)
37
= lim
N
= lim
N
=
X
J
N
X
l=0
X
P (J = {i ≤ N | Wi > 0})P |J| (Y = 0)
N
X
P(
11Wi >0 = l)P l (Y = 0)
i=1
P (X̂ = l)P l (Y = 0)
0≤l<∞
= f (P (Y = 0)).
Damit ist P (Y = 0) ein Fixpunkt von f. Der Rest folgt aus Lemma ??. q.e.d.
Korollar 13 Entweder ist M∞ identisch 0 oder M∞ ist strikt positiv auf der
Überlebensmenge.
Bew: Die Zgn identisch 0 ist immer eine Lösung der obigen Fixpunktgleichung.
Wenn die Zg M∞ ein strikt positives Moment besitzt, so kann sie nicht
degeneriert sein. Die Menge M∞ > 0 ist enthalten in der Überlebensmenge
P
U des GWP mit Nachkommenschaftverteilung wie X̂ = i 11Wi 6=0 . Da beide
dieselbe W-keit besitzen, sowohl P (M∞ = 0) als auch 1−P (U ) sind Fixpunkte
ungleich 1 von f und oEdA hat f höchstens zwei Fixpunkte, gilt fast sichere
Gleichheit. Folglich konvergiert Mn auf der Überlebensmenge gegen den strikt
positiven Grenzwert M∞ und nur dort.
q.e.d.
Wie sieht die Verteilung von M∞ aus auf der Überlebensmenge? Der
strikt positive Teil einer nichttrivialen Fixpunktlösung löst noch eine andere
Fixpunktgleichung. Damit lassen sich lästige Fallunterscheidungen manchmal
vermeiden.
Proposition 14 Sei X eine positive Lösung einer stochastischen Fixpunktgleichung
D
X=
X
Ai Xi
i
mit positiven Koeffizienten und 0 < P (X = 0) < 1. Sei Y die Verteilung von
X gegeben X ist strikt positiv. Dann erfüllt Y die stochastische Fixpunktgleichung
D
Y =
X
A0i Yi .
(22)
i
Hierbei ist die Verteilung von (A0i )i diejenige von (Ai Bi )i bedingt auf i Ai Bi >
0 wobei Bi , i ∈ IN Zgn mit Bernoulli Verteilung zum Parameter P (X > 0)
sind und unabhängig von den (Ai )i .
P
38
Beweis: Beachte die Darstellung von X in der Form BY mit Y, B unabhängig,
B eine Zg mit Bernoulli Verteilung zum Parameter P (X > 0) und die
Verteilung von Y wie oben beschrieben. Die Fixpunktgleichung für X liefert
D
BY =
X
Ai Bi Yi .
i
Die Einschränkung auf strikt positive Werte lifert
D
11B=1 Y = 11P
A B >0
i i i
X
Ai Bi Yi .
i
Es folgt P (B = 1) = P ( i Ai Bi > 0) und stochastische Gleichheit (22) bei
Bedingung auf strikt positive Werte.
q.e.d.
: Ex. GWP: Welcher Transformation entspricht dies beim GWP? Sei
i
m > 1 und die Ai entsprechen den W
mit den Werten 0 oder m1 . Sei p =
m
P (B = 1), f die erzeugende Funktion des GWP und j ∈ IN.
P
X
P(
A0i = mj) = P (
X
i
i
=
=
=
=
g(s) :=
X
j
A − jBj > 0)
P ( i Ai Bi = mj)
P
P ( j Aj Bj > 0)
1 X
E
11J={j|Aj >0} 11P Bi =j
i∈J
p J⊂IN
P
Ã
!
|J| j |J|−j
1 X
pq
11J={j|Aj >0}
E
j
p J⊂IN
Ã !
1 X
k j k−j
E
pk
pq
p k≥j
j
X
sj P (
j∈IN
=
Ai Bi = mj |
1X
p
k
X
i
Ã !
X
k j k−j
1X
pq )
sj
pk (
A0i = mj) =
j
p k
1≤j≤k
pk ((sp + q)k − q k ) =
f (sp + q) − q
.
p
Aus der erzeugenden Funktion läßt sich die Nachkommenschaftsverteilung
berechnen. Die beiden Erwartungswerte m = f 0 (1−) und g 0 (1−) der Nachkommenschaft
sind gleich. Die Laplacetransformierte ϕ des Fixpunktes X erfüllt ϕ(t) =
39
f (ϕ( mt )) und der Fixpunkt Y mit Laplacetransformierter ψ erfüllt ψ(t) =
g(ψ( mt )).
Für den GWP bedingt aufs Aussterben siehe den Abschnitt Maßtransformierte
Prozesse. Prozess als bedingt auf Nichtaussterben. ......................Name.......................
40
5
Maßtransformierte Prozesse
Zn
Wir kommen langfristig jetzt zur L1 -Konvergenz des Martingals m
n . Ein
starkes Hilfsmittel von eigenständiger Bedeutung sind maßtransformierte
Prozesse bzw. ein Maßwechsel. Die Idee eines Maßwechsels ist es eine stochastische
Aussage bzgl. eines Maßes auf eine andere stochastische Aussage unter einem
anderen Maß zu erhalten.
Hintergrund: Sei (An )n eine Filtration und Pn das auf An eingeschränkte
Maß. Sei (Mn )n ein adaptiertes Martingal. Die Familie Qn := Mn Pn von Wmaßen habe einen projektiven Grenzwert, genannt Q. Die Idee ist, eventuelle
Aussagen für den W-raum (Ω, A, Q) beweisen zu können und damit Aussagen
für den Originalwahrscheinlichkeitsraum (Ω, A, P ) zu erhalten.
Zur Orientierung sehen wir uns zeitlich homogene Markoffketten und
Doobsche h-Transformierte an. Sei (Xn )n eine zeitlich homogene Markoffkette
zur Übergangsmatrix P = (pi,j )i,j∈S auf dem abzählbaren Zustandsraum S
an. Sei h eine harmonische (in der Wahrscheinlichkeitstheorie P h = h ≥
0), überall auf dem Zustandsraum strikt positive Funktion. Die Doob hTransformierte ist die Markoffkette mit den Übergangswahrscheinlichkeiten
q(i, j) =
1
p(i, j)h(j).
h(i)
n)
P entsteht durch
Beachte (h(Xn ))n ist ein Martingal und das Maß Qn = h(X
h(X0 ) n
obigen Maßwechsel. Zur Interpretaion, betrachte ein terminales Ereignis A
(meßbar bzgl. σ(∪n≥m An ) für alle m) und benutze die harmonische Funktion
h(x) = Px (A). Es gilt Q = P (. | A). Das Martingal h(Xn ) konvergiert
gegen 11A und Q ist das W-maß bedingt auf das termninale Ereignis Q =
P (. | A). Der h-transformierte Prozess ist der Originalprozess bedingt auf
das terminale Ereignis A.
Ein Beispiel für einen superkritischen GWP als Markoffkette gesehen, ist
die Harris-Sevastyanov [9] Transformierte zur harmonischen Funktion n 7→ q n
mit q die Aussterbewahrscheinlichkeit. Dies ist wieder ein GWP. Er hat die
erzeugende Funktion s 7→ f (sq)
. Anschaulich gesprochen ist dies der Original
q
GWP bedingt darauf, auszusterben. (Siehe nachfolgende Erklärungen.)
Ein Maßtheoretiker würde auf demselben meßbaren Raum einen Wechsel
des Maßes vornehmen und die Zgn unverändert lassen. Ein Wahrscheinlichkeitstheoretiker würde den W-raum unverändert lassen und die Zgn ändern.
41
Beide Sichtweisen haben Ihre Bedeutung und Vorteile. Wir werden in folgenden
Abschnitten [21] beide Sichtweisen verwenden.
Der nächste Teilabschnitt entwickelt etwas Theorie und Notation, um
solche Transformierten auch für GVP nutzen zu können.
5.0.5
Maßtransformation zu einer Filtration
Seien P, Q zwei W-maße auf demselben meßbaren Raum (Ω, A) und (An )n
eine Filtration. Seien die Einschränkungen Pn , Qn der Maße auf die n-te σAlgebra An absolut stetig, etwa sei Qn << Pn . Die Radon-Nikodym Ableitung
bildet ein positives Martingal mit Erwartungswert 1. Umgekehrt ein positives
Martingal Mit Erwartungswert 1 liefert auch eine Folge von konsistenten Wmaßen Qn und damit als projektiven Grenzwert ein W-maß Q.
Wir geben zuerst einige allgemeine Sachverhalte zu Maßtransformationen
mit Martingalen an.
Ein Maß ν heißt absolut stetig bzgl. einem Maß µ, geschrieben ν << µ,
falls alle µ-Nullmengen auch ν-Nullmengen sind, (µ(A) = 0 ⇒ ν(A) = 0).
Ein Maß µ heißt singulär oder orthogonal bzgl. einem Maß ν, geschrieben
µ⊥ν, falls es eine Menge A gibt mit µ(A) = 0 und ν(Ac ) = 0. Jedes Maß ν
hat bzgl. µ eine eindeutige Zerlegung ν = νc + ν⊥ in den absolut stetigen Teil
νc und den singulären Teil νs jeweils bzgl. µ.
Der Satz von Radon-Nikodym besagt für W-maße (σ-endliche Maße),
ν << µ dann und nur dann, wenn
es eine
positive meßbare Funktion f gibt
R
R
mit dν = f dµ. (Ausführlicher gdν = f gdµ für alle positiven, meßbaren
Funktionen g.) Die Radon-Nikodym Ableitung f ist µ fast sicher eindeutig.
dν
= f (oder seltener dν = f dµ).
Wir werden auch schreiben ν = f µ oder dµ
Beachte, die Relation singulär ist symmetrisch, die Relation absolut stetig
im allgemeinen nicht. (Beispiel: P, Q seien die Bernoulliverteilung zum Parameter
1/2 bzw. 1.) Symmetrie für absolute Stetigkeit liegt vor, falls die RadonNikodym Ableitung P -fast sicher strikt positiv ist.
Sei (An )n eine Filtration (=aufsteigende Folge von σ-Algebren) bzw. die
kanonische Filtration zu einem Prozess Xn )n . (An ist die kleinste von Xi , i ≤
n aufgespannte σ-Algebra.) Eine Folge Xn von Zgn heißt adaptiert zur Filtration
(An )n falls Xn meßbar ist bezüglich An für jede natürliche Zahl n. Seien P
und Q W-maße auf dem meßbarem Raum (Ω, A). Wir benutzen Pn = P|An
für die Einschränkung von P auf die σ-Algebra An und analog Qn .
42
Proposition 15 Sei (Mn )n ein positives Martingal mit Erwartungswert 1
bzgl. der Filtration (An )n . Dann ist Qn definiert surch Qn := Mn Pn eine
projektive Familie im Sinne Qn eingeschränkt auf Am ist Qm für m < n.
Umgekehrt, sei Qn absolut stetig bzgl. Pn für alle n ∈ IN und sei Mn =
dQn
die Radon-Nikodym Ableitung von Qn bzgl. Pn . Dann ist (Mn )n ein
dPn
positives Martingal bzgl. P zu der Filtration (An )n mit Erwartungswert 1.
Beweis: Das Objekt Qn ist ein wohldefinertes W-maß. Die Projektivität wird
nachgerechnet. Sei A aus An−1 .
Qn (A) =
=
Z
ZA
A
Mn dPn =
Z
A
Mn dP =
Z
E(11A Mn | An−1 )dP
Mn−1 dP = Qn−1 (A).
Die Radon-Nikodym Ableitung ist Pn -f.s. und damit P -f.s. eindeutig. Die
Martingaleigenschaft wird nachgerechnet. Für alle A ∈ An−1 gilt
Z
A
E(Mn | An−1 )dP =
Z
A
Mn dP = Qn (A) = Qn−1 (A) =
Z
A
Mn−1 dP.
Die Eindeutigkeit der bedingten Erwartung liefert die Teilaussage.
q.e.d.
Bemerkung: Die Existenz eines projektiven Grenzwertes der projektiven
Familie (Qn )n muss separat gezeigt werden und erfordert weitere Voraussetzungen
wie polnische Räume oder die endliche Durchschnittseigenschaft. In den meisten
Fällen gibt es den projektiven Grenzwert.
Lemma 16 Sei A erzeugt von der Filtration (An )n . Seien Q, P zwei Wmaße auf (Ω, A) und die Einschränkung Qn von Q auf An absolut stetig
bzgl. der Einschränkung Pn von P auf An . Sei (Mn )n die Radon-Nikodym
Ableitung von Qn nach Pn und M der P -fast sichere Grenzwert. Es gilt
L1 (P )
Mn →n M ⇔ Q << P
M ≡ 0 P-f.s. ⇔ Q⊥P
Im Falle Q << P gilt Q = M P.
Bew: Betrachte die Menge M der A-meßbaren Mengen A, für die es eine
Folge von An -meßbaren Mengen An gibt, sodaß bzgl. dem Maß P + Q die
symmetrischen Differenz An 4A von An und A gegen 0 konvergiert.
43
M ist nicht leer und abgeschlossen bzgl. der Komplementbildung und
endlicher Vereinigung und Durchschnitt. Dies ist einfach.
• M ist abgeschlossen bzgl. abzählbarer Vereinigung.
Für An ∈ M, n ∈ IN haben wir B = ∪n An ∈ M zu zeigen. Sei BN :=
∪n≤N An und CN,n ∈ An mit (P + Q)(BN 4CN,n ) →n 0. Wähle Nn →n ∞
geeignet und argumentiere
(P + Q)(B4CNn ,n ) ≤ (P + Q)(BNn 4CNn ,n ) + (P + Q)(B\BNn ) →n 0.
•M=A
M ist eine σ-Algebra enthalten in A und enthält einen Erzeuger von A.
L1 (P )
• Mn →n M ⇒ Q << P.
Sei P (A) = 0. Dann gibt es eine Folge An -meßbarer Mengen An mit
(P + Q)(An 4A) →n 0. Dies impliziert P (An ) → P (A) = 0 und Q(An ) →n
Q(A). Aus
Q(A) ←n Q(An ) = Qn (An ) =
Z
An
Mn dPn =
Z
An
Mn dP =
Z
An
M dP →n 0
folgt die Teilaussage.
L1 (P )
• Q << P ⇒ Mn →n M und Q = M P.
Die L1 -Konvergenz ist äquivalent zur schwachen Konvergenz und der
Konvergenz des ersten Momentes. (Und äquivalent zur gleichgradigen Integrierbarkeit
der Folge, siehe Anhang.) Sei M∞ die Radon-Nikodym Ableitung von Q
bzgl. P. Es gilt E(M∞ | An ) = Mn fast sicher wegen der Eindeutigkeit der
bedingten Erwartung. Die linke Seite konvergiert in n gegen M∞ und die
rechte gegen M P-fast sicher. Daher gilt M = M∞ P -f.s. Aus EMn = 1 =
EM∞ folgt die Teilbehauptung.
• M ≡ 0 P-f.s. ⇒ Q⊥P
Sei (Mn )n eine feste Version und B das Ereignis lim inf n Mn = 0. Es gilt
P (B) = 1 nach Voraussetzung und Q(B) = 0 wegen
Q(B) ≤
=
Z
Z
1lim inf n Mn <² dQ
limninf 11Mn <² dQ
≤ limninf
44
Z
11Mn <² dQ
= limninf
≤ limninf
Z
Z
11Mn <² dQn
11Mn <² ² dPn
≤ ² →²→0 0.
• Q⊥P ⇒ M ≡ 0 P-f.s.
Es gibt eine meßbare Menge B mit Q(B) = 0 und P (B) = 1. Da B
auch in M liegt, existiert eine An -meßbare Folge An mit der symmetrischen
Differenz zu B konvergiert dem Maße P + Q nach gegen 0. Damit liefert
Z
Z
M dP ←n
An
M dP =
Z
lim Mm dP ≤ limminf
An m
Z
An
Mm dP
= limminf Qm (An ) = Q(An ) →n Q(B) = 0
die Teilbehauptung.
q.e.d.
Korollar 17 Seien Q, P zwei W-maße auf demselben meßbaren Raum (Ω, A).
Sei für jedes n ∈ IN das W-maß Qn absolut stetig bzgl. Pn und Mn die RadonNikodym Ableitung. Dann gilt auf An
(
Der Prozess
1
Mn
1
)Qn = Pn (· ∩ 0 < Mn < ∞)).
Mn
ist ein Q-Supermartingal. Es gilt
Mn → ∞ Q-f.s. ⇔ Mn →n 0 P-f.s..
Sei M der fast sichere Grenzwert des Martingals (Mn )n unter P. Es gilt
lim sup Mn < ∞Q − f.s. ⇔ Mn → M in L1 (P ).
n
Es gilt Q = M P falls lim supn Mn < ∞Q−f.s. gilt und Q⊥P im Fall lim supn Mn =
∞Q−f.s.
Beweis: Für jedes A ∈ An gilt
Z
A
Z
Z
Z
1
1
1
1
dQn =
dQn +
dQn +
dQn
Mn
A∩{0<Mn <∞} Mn
A∩{0=Mn } Mn
A∩{Mn =∞} Mn
=
Z
A∩{0<Mn <∞}
dPn + 0 + 0 = Pn (A ∩ {0 < Mn < ∞})
45
Für die Supermartingaleigenschaft argumentiere
Z
1
1
EQ (
(
| An )dQ =
dQn+1
Mn+1
A
A Mn+1
Z
= Pn+1 (A, 0 < Mn+1 < ∞) ≤ Pn (A, 0 < Mn < ∞) =
Z
A
(
• Mn → ∞ Q-f.s. ⇒ Mn →n 0 P-f.s..
Für reelle Zahlen 0 < c < d betrachte
Z
Z
1
1
1
dQn =
dQn +
dQn
P (c < Mn ) =
c<Mn <d Mn
d≤Mn Mn
c<Mn Mn
1 1
1
≤
+ Q(c < Mn < d) →n→∞ →d→∞ 0.
d c
d
Z
Da Mn fast sicher gegen M konvergiert, erhalten wir P (c < M ) ≤ lim inf n P (c <
2Mn ) = 0 für jedes c > 0 und damit M = 0 P -fast sicher.
• Mn → 0 P-f.s. ⇒ Mn →n ∞ Q-f.s..
Q(Mn < d) =
Z
Mn <c
Mn dPn +
Z
cMn <d
Mn dPn
≤ c + P (c < Mn < d)d →n→∞ c →c→0 0.
Aus der Submartingaleigenschaft ergibt sich Mn konvergiert Q-f.s. und der
Grenzwert kann nach obigem nur ∞ sein.
• lim supn Mn < ∞ Q-f.s. ⇒ Mn →n M in L1 (P ).
Wir zeigen die äquivalente Eigenschaft gleichgradige Integrierbarkeit der
(Mn )n .
sup
n
Z
Mn >c
Mn dP = sup Qn (Mn > c) = sup Q(Mn > c) ≤ Q(sup Mn > c) →c→∞ 0.
n
n
n
• Mn →n M in L1 (P ) ⇒ lim supn Mn < ∞ Q-f.s. und Q = M P.
Aus Lemma (16) wissen wir Q = M P. Mit gleichgradiger Integrierbarkeit
folgt
Z
sup Q(Mn > c) = sup
M dP →c→∞ = 0
n
n
Mn >c
und wegen der Submartingaleigenschaft lim supn Mn < ∞ Q-f.s.
Der Rest folgt aus Lemma (16).
46
q.e.d.
1
dQ
Mn
5.0.6
Maßtransformation für den GWP
Hier einige Beispiele eines Maßwechsels für den GWP gesehen als Markoffkette.
Der GWP bedingt aufs Aussterben: Sei A = {∃n Zn = 0} das
Aussterbeereignis und die Aussterbewahrscheinlichkeit q = P (A) in dem
offenen Einheitsintervall. Die Funktion x 7→ h(x) = Px (A) = q x ist eine
harmonische, strikt positive Funktion und h(Zn ) eine Martingal. Der maßtransformierte
n)
P ist eine zeithomogene Markoffkette
Prozess zu den Übergansw-keiten Qn = h(Z
h(Z0 ) n
mit den Übergangswahrscheinlichkeiten
qy
q(x, y) = x p(x, y)
q
y
und der Halbgruppe q n (x, y) = qqx pn (x, y), n ∈ IN0 . Die erzeugende Funktion
P
∗
n
y
fn,x
(s) = ∞
y=0 q (x, y)s berechnet sich zu
gn,x (s) =
Ã
fn (sq)
q
!x
.
Aus dieser Darstellung heraus identifiziert sich der Q-Prozess als ein GWP
zu der erzeugenden Funktion
s 7→ g(s) =
f (sq)
.
q
Der transformierte Prozess entspricht dem Originalprozess bedingt aufs Aussterben.
Mit Markoffkettennotation gilt
Px (Zn = y | A) =
Px (Zn = y, A)
1
= x Px (Zn = y)Px (A | Zn = y) = q n (x, y).
Px (A)
q
Bevor wir ein weiteres Beispiel einer Maßtransformierten betrachten, führen
wir GWP mit Immigration bzw. GWP mit ewigem Partikel ein.
GWP mit Immigration: Ein Galton-Watson Prozess mit Immigration
(GWPI) ist ein Prozess (Zn )n rekursiv definiert durch
Zn+1 =
Zn
X
Xn,i + Cn .
i=1
47
Die Zgn Xn,i , Cn , i, n ∈ IN0 sind unabhängig mit Werten in den positiven
ganzen Zahlen IN0 . Die X-Zgn haben alle dieselbe Verteilung und die C-Zgn
haben alle dieselbe Verteilung. Der Anfangswert Z0 ist zusätzlich unabhängig
von allem anderen gegeben, standardmäßig als eie Konstante, etwa 1.
Der Immigrationsprozess (Zn )n ist eine Markoffkette auf den positiven
ganzen Zahlen. Die erzeugende Funktion gn,x (s) = Ex sZn von Zn bei Start
in Z0 = x erfüllt die Rekursion
gn+1,x = cgn,x ◦ f
mit c(s) = EsC1 und dem Anfangswert g0,x (s) = sx . (Dies folgt direkt aus
der Rekursionsgleichung und die bedingte Erwartung genommen bzgl. Zn .)
Durch Iteration erhalten wir
gn,x = c(c ◦ f )(c ◦ f2 ) . . . (c ◦ fn−1 )fnx .
(23)
GWP mit ewigem Partikel: Die Immigration läßt sich interpretieren
als Nachkommenschaft eines ewig lebenden Partikels, das ewige Partikel nicht
mitgezählt. Wenn wir es mitzählen, ändert sich nicht viel am Prozess. Wir
erhalten für Ẑn = Zn + 1 die rekursive Beziehung
Ẑn+1 =
ẐX
n −1
Xn,i + Cn + 1.
i=1
Die erzeugende Funktion von Ẑn bei Start in Ẑ0 = x ergibt sich als
ĝn,x (s) = Ex sẐn = sEx−1 sZn = sgn,x−1 (s)
wie oben berechnet. Die Rekursion (nachrechnen) lautet
ĝn+1,x (s) =
c(s)s
gn,x (f (s)).
f (s)
GWP mit Königswahl: Eine andere Interpretation wäre, anstelle des
mitgezählten ewigen Partikels jetzt von Generation zu Generation ein Partikel,
genannt den König, pro Generation auszuwählen, welches sich mit einer
anderen Nachkommenschaftsverteilung reproduziert. Die auswahl kann mit
Gleichverteilung über alle Individuen der n-ten Generation erfolgen, oder
stets aus der Königsfamilie wird ein Nachkomme ausgewählt oder..... Die
48
Gesamtgröße der n-ten Generation ist stets die gleiche (in Verteilung) unabhängig
von der speziellen Auswahl des Königs. Wir kommen hierauf zurück.
Zn
mn
Zn
Die Transformierte zu m
n : Sei Q die Maßtransformation zum Martingal
und dem GWP Prozess (Zn )n . Es ergibt sich
q n (x, y) =
Die erzeugende Funktion gn,x (s) =
gn,x (s) =
∞
X
y n
p (x, y).
xmn
P∞
y=0
q n (x, y)sy von q n (x, .) ergibt sich als
1
s
y n
p (x, y)sy =
sDs fnx (s) = n fnx−1 (s)fn0 (s).
n
n
xm
m
y=0 xm
Sie erfüllt die rekursive Gleichung
gn+1,x (s) =
sf 0 (s)
gn,x (f (s)).
mf (s)
Dies ist dieselbe Rekursion wie für einen GWPE, wenn wir eine Verteilung
von C finden mit
sc(s)
sf 0 (s)
=
.
mf (s)
f (s)
Der maßtransformierte Prozess ist ein GWP mit Immigration zu derselben
Nachkommenschaftsverteilung (pk )k und der Immigrationsverteilung kpmk . Zu
der Immigrationsverteilung berechnen wir
c(s) =
1 X
1
kpk sk = sf 0 (s).
m k
m
(24)
Bemerkung: Der konstruierte maßtransformierte Prozess ist ein Doob htransformierter Prozess. Ein direkter Übertragungsversuch scheitert sofort
Zn
an der formalen Schwierigkeit, daß das Martingal m
n sich nicht als eine
harmonische Funktion angewandt auf Zn darstellen läßt. Wir benötigen den
Umweg über Raum-Zeit Prozesse.
Sei (Xn )n eine Markoffkette mit den Übergangswahrscheinlichkeiten
m,n
(p (i, j))i,j∈S , m ≤ n ∈ IN0 . Der Raum-Zeit Prozess ist eine Markoffkette
mit dem Zustandsraum S̃ = S × ZZ und den Übergangsmatrizen
p̃m,n ((i, s), (j, t)) = 11t−s=n−m pm,n (i, j)
49
m ≤ n ∈ IN0 . Eine harmonische Funktion für diese Markoffkette ist eine
P
positive Funktion h auf dem Raum-Zeitzustandsraum S̃ mit h(i, m) = j,t p̃m,n ((i, m), (j, t))h(j, t
für alle n ≥ m. Mit der Notation hn = h(., n) schreibt sich die Harmonizität
für den Raum-Zeit Prozess als
hm = P m,n hn .
Der Doob h-transformierte Raum-Zeitprozess hat die Übergangsw-keiten
q̃ m,n ((i, s), (j, t)) =
h(j, t) m,n
p̃ ((i, s), (j, t)).
h(i, s)
Falls h faktorisiert (h(i, m) = f (i)g(m)) mit g ein Charakter, g(x + y) =
g(x)g(y), und die Markoffkette zeitlich homogen ist, (pm,n = pm−n ), folgt
q̃ m,n ((i, s), (j, t)) =
f (j)
pn−m (i, j).
f (i)g(m − n)
Die linke Seite ist die Übergangsmatrix einer zeitlich homogenen MK.
Der GWP Zn ist eine zeitlich homogene MK, die Funktion h(x, n) = mxn
ist eine faktorisierende harmonische Funktion mit dem Charakter g(n) = m1n .
5.1
Maßtransformation für den GVP
Wir konstruieren eine spezielle Prozessversion der Maßtransformierten zum
Zn
Martingal m
n . Dies ist der Königsprozess oder Rückgratprozess (im Englischen
Spine). Der Königsprozess hat entlang dem Rückgrat (in der Königslinie) eine
andere Nachkommenschaftsverteilung als die anderen Individuen.
Königsprozess: Mathematisch ist der Königsprozess ein GVP mit Immigration
analog zum GWP mit Immigration. Wir benutzen einen GVP mit einem
zufällig ausgewählten Pfad, wobei die Kantengewichtsvektoren für Knoten
auf dem Pfad durch uiv Zgn. geändert werden. Die Kantengewichtung auf
dem ausgewählten Pfad entscheidet die L1 -Konvergenz des Z-Martingals.
Definiere ein neues Maß µ̂ auf IRIN durch
Z
gdµ̂ = EP (g(W )
X
)
m
(25)
mit W = (W1 , W2 , . . .), X = i Wi für alle positiven, meßbaren Funktionen
g : IRIN → IRIN . (Vergleiche mit (24).) Die rechte Seite ist eine lineare,
P
50
positive und σ-stetige Abbildung auf Funktionen, die die 1 auf die 1 abbildet.
Daher existiert das Wahrscheinlichkeitsmaß µ̂.
Sei Ŵ stets eine Zg mit Werten in IR+ IN und Verteilung µ̂ bezüglich dem
Wahrscheinlichkeitsmaß P,
EP (g(Ŵ )) =
Z
gdµ̂ = EP g(W )
X
.
m
Beachte weiterhin X̂ := i Ŵi ist P -fast sicher strikt positiv. (P (X̂ = 0)) =
E11{0} (X̂) = E X
11 (X) = 0.)
m {0}
Sei (Ŵ , A), A steht für Auswahl des Königs, eine Zg mit Werten in IR+ IN ×
IN. Hierbei ist Ŵ wie oben und die Verteilung der Zg Â ist gegeben durch
P
P (A = i | Ŵ ) =
Ŵi
.
X̂
Damit ist die Verteilung von (Ŵ , A) wohlbestimmt und es gibt Zgn mit dieser
Verteilung. Zum Beispiel bei gegebenem Ŵ wähle eine gleichverteilte Zg U
und definiere A als dasjenige i welches genau
i−1
X
Ŵj
j=1
X̂
≤U <
i
X
Ŵj
j=1
X̂
erfüllt. Dies tut es. Wir haben an dieser Stelle X̂ > 0 P f.s. benutzt. Die
gemeinsame Verteilung von (Ŵ , Â) berechnet sich hieraus zu
E(11A=i g(Ŵ )) = E(g(Ŵ )E(11A=i | Ŵ ) = E(g(W )
Wi
).
m
(26)
Seien W (v), v ∈ V, (Ŵ n , An ), n ∈ IN0 unabhängige Zgn. Die Zgn W (v), v ∈
V geben die uiv Kantenvektoren für einen GVP und die Zgn (Ŵ n , An )
haben die Verteilung von (Ŵ , A). Die unendliche Folge (A0 , A1 , A2 , . . .) der
Auserwählten heißt Königspfad oder Rückgrat (oder Spine in Denglisch).
Anschaulich, im Knoten v des Pfades wird das Kind A|v| auserwählt.
Definiere die Kantengewichtsvektoren W̃ durch
W̃ (v) :=
(
Ŵ |v|
W (v)
falls
51
v = A|v|−1
.
sonst
Dieser Prozess heißt Königsprozess oder Rückgratprozess. (Für Dengländer
auch Spineprozess.)
Zn
Die Maßtransformierte des GVP Sei Qn = m
n Pn die Maßtransformation
Zn
auf der Filtration An = σ(W (v), |v| < n) zu dem P -Martingal m
n.
Lemma 18 Die Verteilung der Kantengewichtsvektoren (W (v))v∈V<n unter
Qn ist genau die Verteilung des Königsprozesses (W̃ (v))v∈V<n unter P für
alle n ∈ IN.
Beweis: Sei ϕn , ϕ̃n : Ω → (IRIN )V<n , ϕn = (W (v))v∈V<n die Projektion des
original GVP bzw. des Königsprozesses bis zur n-ten Generation (aussschließlich).
Für die Verteilungsgleichheit
Pn (ϕ̃n ∈ B) = Qn (ϕn ∈ B)
(27)
für alle borelmeßbaren Mengen B aus (RIN )V<n reicht es für alle w ∈ Vn zu
zeigen
Ww
(28)
E11A|n =w 11ϕ̃n ∈B = E n 11ϕn ∈B
m
mit A|n = (A0 , A1 , . . . , An−1 ). Denn eine einfache Rechnung zeigt
Pn (ϕ̃n ∈ B) =
X
w∈Vn
Qn (ϕn ∈ B) =
E11A|n =w 11ϕ̃n ∈B
X
w∈Vn
E
Ww
11ϕ ∈B .
mn n
Für die Aussage (28) reicht es Zylindermengen B = v∈V|n Bv mit Bv
borelmeßbar aus RIN ) zu nehmen. Sei gv = 11Bv . Beachte die Produktformen
Qn−1
Qn−1
11A|n =w = j=0
11Aj =wj+1 und vom Pfadgewicht Ww = j=0
11Wwj+1 (w|j ).
Q
Linke Seite

= E 

= E 

n−1
Y
= 
j=0
Y
V<n 3v¹w
n−1
Y
j=0

gv (W̃ (v)) 
Y
V<n−1 3v6¹w
j

(gw|j (Ŵ )11Aj =wj+1 ) 

E(gw|j (Ŵ j )11Aj =wj+1 )
52

gv (W̃ (v))
Y
V<n−1 3v6¹w
Y
V<n−1 3v6¹w

gv (W (v))
Egv (W (v))
Rechte Seite




Y
Y
Ww
gv (W̃ (v))
= E n 
gv (W̃ (v)) 
m
V<n 3v¹w
V<n−1 3v6¹w


n−1
Y

Wwj+1 (w|j )   Y
= E  (gw|j (W (w|j ))
)
gv (W (v))
m
j=0
V<n−1 3v6¹w

n−1
Y
!
Ã
Y
Wwj+1 (w|j ) 
Egv (W (v))
E gw|j (W (w|j ))
= 
m
j=0
V<n−1 3v6¹w
Ein Vergleich mit Hilfe von 26 zeigt die Gleichheit
Egw|j (Ŵ j )11Aj =wj+1 = Egw|j (W (w|j ))
Wwj+1 (w|j )
m
für alle j.
q.e.d.
Lemma 19 Die Folge (Qn ) von W-maßen ist eine projektive Familie mit
einem projektiven Grenzwert, genannt Q, auf der von An erzeugten kleinsten
σ-Algebra. Die Verteilung der Kantengewichtsvektoren (W (v))v∈V unter Q
ist genau die Verteilung des Königsprozesses (W̃ (v))v∈V unter P.
Beweis: Die beiden σ-Algebren An und die Borelsche Bn auf (IRIN )V<n sind
isomorph, siehe Anhang. Die Isomorphie ist ϕ−1 : Bn → An . Wir können
daher Qn auf (Ω, An ) mit einem Maß µn auf (IRIN )V<n , Bn ) identifizieren. Die
(Qn )n bilden eine projektive Familie und ebenso die (µn )n bzgl. der üblichen
Projektion. Da µn auf Borelräumen lebt, liefert der Satz von Kolmogoroff ??,
einen projektiven Grenzwert µ der µn . Das W-maß Q, Q(·) = µ(ϕ∞ (·)), ist
der projektive Grenzwert der Folge (Qn ). Der projektive Grenzwert lebt auf
der kleinsten von An erzeugten σ-Algebra.
Da die W-maße P und Q auf einem Erzeuger übereinstimmen, sind sie
gleich.
q.e.d.
5.2
Regularitäet des Martingals Mn .
Zn
Wann ist das Martingal Mn = m
n ein reguläres Martingal, d.h. L1 konvergent
gegen M ? Verbunden damit ist die Frage, wann der obige projektive Grenzwert
sich als transformeirte Q = M P schreiben läßt. Die Konvergenzfragestellung
ist äquivalent zur gleichgradigen Integrierbarkeit 50 der Familie (Mn )n von
Zgn.
53
Für den GWP ist die L1 -Konvergenz äquivalent zur sogenanten L-log-LBedingung nach einem Satz von Kesten und Stigum [15].
Satz 20 (Kesten-Stigum) Für eine superkritischen GWP sind äquivalent
• EZ1 ln Z1 < ∞
• P (M > 0) > 0
• EM = 1
• Mn →n M in L1 .
• E supn Mn < ∞.
Als Folgerung bekommen wir die Dichotomie entweder EM = 1 oder EM =
0. Der Beweis von Kesten-Stigum oder andere zum Satz, [3], lassen sich
nicht auf den GVP übertragen, da an irgendeiner Stelle entscheidend ein
Zählargument eingeht, das Pfadgewicht Wv ist 1 oder 0. (Diese Bedingung
ließe sich für den GVP kopieren unter der Bedingung Wv ist 0 oder gleichmäßig
von 0 weg beschränkt.)
Wir präsentieren hier den konzeptionellen Beweis von Lyons, [20] bzw.
Lyons, Pemantle, Peres [21] mit Hilfe einer geschickten Maßtransformation.
Die beiden Fälle EM = 1 bzw. M ≡ 0 P-fast sicher entsprechen nach der
Proposition 16 den Fällen Mn konvergiert fast sicher unter dem transformierten
Qn
= Pn ). Auf
Maß Q gegen eine endliche Zg oder gegen unendlich (betrachte M
n
dem Originalwahrscheinlichkeitsraum entsprechen diese Fälle genau (M̃n )n
konvergiert fast sicher unter dem Maß P gegen eine endliche Zg oder gegen
unendlich. Dies werden wir zeigen.
Wir benutzen die Notation wie eben. Zur Abkürzung verwenden wir a =
P i
P
i
E ln ŴmA = E i W
ln W
und b = E ln X̂
= E( X
ln X
) mit X = i Wi . Der
m
m
m
m
m
Erwartungswert a sei wohldefiniert im Lebesguesinne, wobei wir die Werte
∞ oder −∞ zulassen.
Satz 21 Der Erwartungswert des Martingalgrenzwertes M unter dem Maß
P ist entweder 1 oder 0.
• Sei a = ∞ oder b = ∞ und a > −∞. Dann gilt M = 0 P-fast sicher.
• Sei jetzt b < ∞.
54
(i) Sei ln m ≤ a < ∞. Dann gilt M = 0 P-fast sicher.
(ii) Sei a < ln m. Dann gilt EM = 1.
Beweis: Sei M der fast sichere Grenzwert des positiven Martingals Mn =
Der Rückgratprozess Z̃n erfüllt eine rekursive Beziehung
X
Z̃n =
Zn
.
mn
Ŵi0 Zn−1 (i) + ŴA0 0 Z̃n−1 (A0 ).
i6=A0
Hierbei benutzen wir Zm (i) für das Gesamtknotengewicht der m-ten Generation
im Baum iV. Diese Beziehung iterieren wir. Sei U i =
Y k :=
k−1
Y
Ŵ i i
A
m
und Y k das Produkt
U i.
i=0
Leichter ist die rekursive Definition Y 0 = 1 und Y k := Y k−1 Ui . Sei M̃n =
Z̃n = ŴA0 0 Z̃n−1 (A0 ) +
X
Z̃n
.
mn
Ŵi0 Zn−1 (i)
i6=A0
M̃n = U0 M̃n−1 (A0 ) +
X Ŵ 0 (i)
i6=A0
m
= U0 U1 M̃n−2 (A0 A1 ) + U0
Mn−1 (i)
X Ŵi1
i6=A1
n
= Y +Y
n−1
X
i6=An−1
+ Y2
X Ŵi2
i6=A2
≥ Y n−1
m
m
Mn−2 (A0 i) +
X Ŵi0
i6=A0
m
Mn−1 (i)
Ŵin−1
+ ...
m
Mn−3 (A0 A1 i) + Y 1
X Ŵi1
i6=A1
m
Mn−2 (A0 i) +
X Ŵi0
i6=A0
m
Mn−1 (i)
X̂ n−1
m
Der Summand mit Y k anfangend bezeichnet den Beitrag aller Knoten, deren
Vorfahren bis zur k-ten Generation einschließlich Könige waren und anschließend
Bürgerliche.
55
Die Zgn Y n−1 sind ein Produkt von n uiv Faktoren mit Verteilung U =
ŴA
. Der Erwartungswert von ln U berechnet sich zu
m
E ln U = E
X Ŵi
i
X̂
ln
Ŵi
X X Wi Wi
= E(
ln
= a.
m
m i X
m
Das starke Gesetz der Großen Zahl 7 impliziert die fast sichere Konvergenz
ln Y n →n→∞ a
gegen den Erwartungswert a, wobei wir die Werte +∞ und −∞ zulassen.
• a = ∞ impliziert lim supn M̃n = ∞ P -f.s.
Verwende aus obiger Abschätzung
ln M̃n ≥ ln Y n−1 + ln
X̂ n−1
.
m
(29)
Das starke Gesetz der großen Zahl liefert die Aussage.
• b = ∞ und a > −∞ impliziert lim supn M̃n = ∞ P -f.s.
In der Abschätzung (29)
n−1
ln X̂m
1
1
ln M̃n ≥ ln Y n−1 +
n
n
n
(30)
ist der erste Term auf der rechten Seite fast sicher nach unten beschränkt
n−1
ln X̂ m
und konvergiert nach dem starken GGZ gegen a. Die Ereignisse
≥c
n
treten nach Borel-Cantelli unendlich oft ein für jedes c > 0. (Die Ereignisse
P
n−1
sind unabhängig und n P (ln X̂m ≥ nc) = ∞, da der Erwartungswert b
von ln X̂
unendlich ist.)
m
• b < ∞ und 0 < a < ∞ impliziert lim supn M̃n = ∞ P -f.s.
In der Abschätzung (30) konvergiert der erste Term auf der rechten Seite
ln
X̂ n−1
nach dem starken GGZ gegen a > 0. Es reicht also lim supn nm ≥ a2 zu
zeigen. Dies folgt z.B. aus Borel-Cantelli.
• b < ∞, a = 0 und WA keine Konstante impliziert lim supn M̃n = ∞
P -f.s.
Nach einem Satz von Spitzer Kesten-Spitzer [14] gilt für jede Irrfahrt
Sn , d.h. n-te Partialsummen von uiv zentrierten nicht ausgearteten Zgn,
56
lim supn Sn = ∞ P -f.s. Im Fall a = 0 ist ln Y n−1 eine Irrfahrt und der Limes
superior P -f.s. ∞. Sei ni → ∞ eine (meßbare) Folge mit limi ln Y ni = ∞. Die
Folge X̂ ni ist unendlich oft größer als ein vorgegebenes c mit P (X̂ > c) > 0.
(Verwende wieder Borel-Cantelli wie oben.) Aus beiden Aussagen folgt die
Teilbehauptung.
• b < ∞, a = 0 und ŴA eine Konstante, aber X nicht, impliziert M ≡= 0
P -f.s.
Sei W identisch die Konstante c. Aus der Maßtransformation Eg ŴA =
P i A
gWi für alle positiven meßbaren g erkennt man Wi = c oder 0. Der
E iW
m
Prozess mit den Kantengewichten Wc i ist ein GWP. Aus
0=a=E
X Wi
i
m
ln
Wi
X
c
c
= E ln
= ln
m
m m
m
folgt c = m und E i Wc i = 1. Ein GWP mit durchschnittlicher Nachkommenschaft
m = 1 stirbt fast sicher aus, es sei denn, die Nachkommenschaft ist identisch
1. (Dieser Fall war prinzipiell ausgeschlossen und entspräche hier X ist ebenfalls
eine Konstante.)
• lim supn M̃n = ∞ P -f.s. impliziert M ≡= 0 P -f.s.
Die Verteilung von Z̃n unter P entspricht der Verteilung von Zn unter Qn .
Daher gilt lim supn Mn = ∞ unter Q. Das Korollar 17 liefert das gewünschte.
• b < ∞ und a < 0 impliziert Mn konvergiert in L1 (P ).
Sei Y die σ-Algebra erzeugt von allen Zgn (Ŵ i , Ai ). Durch Iteration, wie
oben ausgeführt, erhalten wir
P
E(M̃n | Y ) =
n−1
X
i=0
Yi
X̂ i
+Yn
m
E M̃n = E(E(M̃n | Y)) =
=
n−1
X
n−1
X
i=0
E(Y i )E(
X̂ i
) + E(Y n )
m
ci d + cn
i=0
i
mit c = E(U ) und d = E X̂m . Wegen EU ≤ ea < 1 (Jensen Ungleichung) ist
dies eine geometrische konvergente Reihe. Es folgt limn E M̃n < ∞.
Dies impliziert EQ Mn < ∞ unter dem Mass Q.Da Mn bzw M1n fast sicher
unter Q konvergieren, erhalten wir lim supn Mn < ∞ Q-f.s. Das Korollar (17)
liefert die Teilbehauptung.
57
q.e.d.
Der Satz von Kesten-Stigum ist ein Korollar unseres Satzes 21.
5.2.1
Der Spineprozess als GVP
Die obige Maßtransformation bildet einen GVP mit Zustandsraum IR+ auf
einen GVP ab mit einem anderen Zustandsraum. Mathematisch gesehen
verbleibt man in derselben Klasse unter der Masstransformation. (Dieser
Abschnitt ist nicht wichtig für alles folgende, beim ersten Lesen überschlagen.)
..................................................
Wenn der Spineprozess ein GVP ist, brauchen wir zumindest zwei verschieden
Typen von Individuen, Prinz oder nicht Prinz. Weiterhin müssen wir das
Problem beseitigen, dass die Nachkommenschaft des n-ten Prinzen durch
eine Zgn beschrieben wird, die von der jeweiligen Generation abhängt, aber
nicht von der Familie. (Prinzen verschiedener Familien in derselben n-ten
Generation haben dieseben Nachkommen (Ŵ n , An ). Zuerst einige andere
Betrachtungen.
GVP mit Immigration. Wir betrachten den Prozess ohne die Königsfamilien.
Die Nichtprinzen der Königsfamilie werden dem Prozess als Immigranten
zugefügt und vermehren sich anschließend wie normale Individuen. Die Verteilung
der Folge der Gesamtgewichte in den Generationen ist dieselbe wie für den
Spineprozess.
GVP mit ewig lebendem Individuum. Im obigen Modell sehen wir
den jeweiligen Prinzen als dasselbe, ewig lebende Individuum versehen mit
Generationenweise wechselndem Gewicht. Dieses wird an die Kinder entsprechend
weitergegeben. Die Gewichte sind dieselben wie im Immigrationsprozess, nur
die Interpretation ist verschieden.
Umnummerierung. Wir ändern die Namensgebung etwas. Die Prinzen
erhalten als Namen im Baum stets Folgen bestehend nur aus Einsen. Es
verbleibt einen Prozess zu definieren, der zwei verschieden Typen von Individuen
hat und ein GVP ist. Dies wird in Allgemeinheit im nächsten Beispiel beschrieben.
Die Verteilung der Folge der Gesamtgewichte in den Generationen für diesen
Prozess ist dieselbe wie für den Spineprozess.
GVP mit Matrixen. Wir verwenden als S den Raum der 2×2 Matrixen
mit der üblichen Matrizenmultiplikation als Verknüpfung.
Seien W (v), Ŵ (v), A(v)), v ∈ V unabhängig identisch verteilte Zgn. Hierbei
seien W (v) wie eben und (Ŵ (v), A(v)) habe die masstransformierte Verteilung.
58
Definiere die Kantengewichte durch
W i (v) =
Ã
Wi (v)
0
11A(v)6=i Ŵi (v)
11A(v)=i Wi (v)
!
.
Sei Z n das Gesamtkontengewicht |v|=n L(v) in n-ter Generation. Ei x0 der
Vektor (1, 0) und x1 der Vektor (0, 1). Dann hat (Z n x0 )n die Verteilung wie
der Original W -GVP und (Z n x1 )n wie der Spineprozess.
Der allgemeine Weg. Wir konstruieren einen GVP (V, (S, σ(S), ◦), W , L)
einschließlich einer Abbildung ◦S,R in die reale Welt, so dass die Beobachtung
von (Z n ) sich als (Zn )n ergibt.
Der Zustandsraum S bestehe aus den Funktionen von S1 × S2 in sich
selbst. Hierbei sind S1 = {0, 1} und S2 = [0, ∞). (Die Markierung als Prinz
erfolgt durch 1 aus S1 und das eigentliche Gewicht wird durch eine reelle Zahl
aus S2 gegeben.) Die betrachteten Zustände sind die Funktionen f werden
mit einem Tupel (z, x, y) S1 × S2 × S2 identifiziert, durch
P
f (s1 , s2 ) = (zs1 , 11s1 =0 xs2 + 11s1 =0 ys2 ).
Die Komposition von zwei Funktionen f ↔ (z, x, y) ergibt sich durch
f ◦ f ↔ (zz, xx, 11z=0 xy + 11z=0 yy).
Die reale Welt ist R = S1 × S2 (Typ des Partikels und Gewicht) mit der
Verknüpfung ◦S,R als f ◦S,R (s1 , s2 ) = f (s1 , s2 ).
Seien W (v), Ŵ (v), A(v)), v ∈ V unabhängig identisch verteilte Zgn. Hierbei
seien W (v) wie eben und (Ŵ (v), A(v)) habe die masstransformierte Verteilung.
Definiere die Kantengewichte durch W i (v) ↔ (11A(v) = i, Wi (v), Ŵi (v)). Dann
hat die Familie der Knotengewichte L(v) ◦S,R (1, 1))v dieselbe Verteilung wie
Q
(L(v))v . (Der Beweis via den massbestimmenden Produkten v gv und einer
Induktion ist länglich ohne Besonderheiten und wir überschlagen ihn.)
Der Königspfadprozess Dies ist ein spezieller GVP. Die Kantengewichte
P
Wi sind positiv und erfüllen i Wi = 1. In n-ter Generation sind alle Gewichte
0 bis auf genau ein v mit Gewicht L(v) = 1. Alle diese Knoten mit Gewichte
1 liegen auf einem Pfad nach unendlich. Definiere den unendlichen Pfad
S ∈ IN IN durch L(S|n = 1. (Oder rekursiv S0 = ∅, S1 = i mit demjenigen I
welches W (∅, i) = 1 erfüllt. S2 = W (S1 , s1 i) = 1 usw. Die Rekursionsformel
lautet, Sn+1 = i) mit W (S|n , S|n i) = 1 mit S = (S1 , S2 , . . .). Die leere Menge
wird in der Indizierung weggelassen.)
59
Rückgratprozess als GVP Definiere ein neues Maß µ̂ auf IRIN durch
Z
gdµ̂ = EP (g(W )
X
)
m
mit X = i Wi für alle positiven, meßbaren Funktionen g : IRIN → IRIN . Die
rechte Seite ist eine lineare, positive und σ-stetige Abbildung auf Funktionen,
die die 1 auf die 1 abbildet. Daher existiert das Wahrscheinlichkeitsmaß µ̂.
Sei Ŵ stets eine
Zg mit Verteilung µ̂ bezüglich dem Wahrscheinlichkeitsmaß
R
P
P, EP (g(Ŵ )) = gdµ. Beachte weiterhin X̂ := i Ŵi > 0 fast sicher. (Die
Menge X̂ = 0 hat µ̂-Maß 0.)
Sei (W 2 , W 3 ) mit Index 2, 3 eine Zgn mit Werten in IR+ IN × IN. Die
Verteilungsfunktion der W 2 Kantengewichte ist durch µ̂ wie oben gegeben
P
und die Verteilung von W 3 wird gegeben durch, 0 ≤ Wi3 , i Wi3 = 1 und
den bedingten W-keiten
P
P (Wi3 = 1 | W 2 ) =
Wi2
X̂
mit X̂ = i Wi2 .
Es bedarf eines Arguments, daß wir eine Verteilung (W 2 , W 3 ) mit dieser
Eigenschaft wählen können. Zum Beispiel sei U eine von W unabhängige
Zg mit einer gleichmäßigen Verteilung auf [0, 1). Dann definiere Wi3 = 1 für
dasjenige i welches genau
P
i−1
X
j=1
Wj2 ≤ U
X
j∈IN
Wj2 <
i
X
Wj2
j=1
erfüllt. Dies tut es. Wir haben an dieser Stelle j Wj2 > 0 P -f.s. benutzt. Die
gemeinsame Verteilung berechnet sich hieraus zu
P
E(Wi3 g(W 2 )) = E(g(W 2 )Wi3 ).
(31)
Seien W 1 (v), (W 2 (v), W 3 (v)), v ∈ V, unabhängige Zgn. Die Zgn W (v)
sind die original Kantengewichte eines GVP, die (W 2 , W 3 ) Zgn wie oben
definiert.
Hier ist eine algorithmische und verbale Beschreibung des Spineprozesses.
Am Anfangspunkt ∅ wähle das Kantengewichte W 2 (∅) und setze S1 als
dasjenige Kind i fest mit W 3 (∅) = i. In erster Generation starte von jedem
60
Individuum v ungleich S1 einen ordinären GVP mit den Kantengewichten
W 1 (v) wie bisher. Für das Individuum S1 , dem Prinzen in der ersten Generation,
wähle als neue Kantengewichte (von der ersten zur zweiten Generation)
die Zgn W 2 (S1 ). Der Prinz (S1 , S2 ) in zweiter Generation wird der Knoten
v ∈ V2 mit L3 (v) = 1. Alle anderen Knoten in zweiter Generation bekommen
Nachkommen wie der gewöhnliche GVP, der Prinz (S1 , S2 ) hat Nachkommen
gegeben durch W 2 mit der maßtransformierten Verteilung und wählt W 3
einen neuen Prinzen in der nächsten Generation usw.
Für die formale Beschriebung als GVP seien fa,b,c : IR2 → IR2 , a, b, c ∈ IR
die Funktionen
fa,b,c (x, y) = (11cy6=1 ax + 11cy=1 by, cy).
Betrachte den GVP mit den Kantengewichten
W̃ (v) = fW 1 (v),W 2 (v),W 3 (v) .
Die Knotenlängenfunktion sei L̃(v) = (L̃1 (v), L̃2 (v)).
Jedem Knoten v ordnen wir als Knotengewicht die Projektion C(v) = C
des IR2 auf die erste Koordinate zu. Der Prozess
V 3 v 7→ C L̃(v)(1, 1)
von Knotengewichten heißt Rückgratprozess oder Spineprozess. Die Menge
der Knoten v mit einer zweiten Koordinate 1 von L(v)(1, 1) liegen alle auf
einem Pfad, dem Königspfad. (Betrachte den GVP mit Kantengewichten
W 3 (v) und dessen Knotenlängen. Diese geben den Königspfad.) Das Rückgrat
oder Spine des Prozesses ist dieser Pfad S = (S1 , S2 , S3 , . . .) der Auserwählten.
61
6
Maximum
In diesem Abschnitt betrachten wir einen nicht ausgearteten gewichteten
Verzweigungsprozess mit positiven Kantengewichten. Unser Hauptinteresse
P
gilt dem Tailverhalten des zufälligen Maßes νn = |v|=n δWv und dessen
Funktionen
ξn (t) := νn ([t, ∞)) =
Fn (t) := Eξn (t)
X
|v|=n
11Wv ≥t
(32)
(33)
für t > 0.
Die Funktion Fn erweist sich als n−fache Faltung von F1 . Die Theorie
großer Abweichungen liefert dann das asymptotische Verhalten
ln Ln
→n a0
n
für den maximalen Wert
Ln := sup Wv
|v|=n
in n-ter Generation, Korollar 27. Der Wert a0 ist die Nullstelle I(a0 ) = 0 der
P
Fenchel-Legendre Transformation I zu α 7→ m(α) = E i Wiα .
6.1
Faltungseigenschaft
Wir benutzen F = F1 . Als monoton fallende Funktion korrespondiert F zu
einem Maß
dF auf den strikt positiven reellen Zahlen IR> = (0, ∞). Wir
R
benutzen f dF = F (f ) für Funktionen f, fallls wohldefiniert. Sei F n∗ die nfache Faltung von F (bzw. dF ) bezüglich der multiplikativen Gruppe (IR> , ·)
Z
n∗
f (x)dF (dx) =
Z
...
Z
f (x1 x2 . . . xn )dF (x1 ) . . . dF (xn )
für alle positiven meßbaren Funktionen f.
Proposition 22
Fn = F n∗
62
(34)
Bew: Wir zeigen die Behauptung durch Induktion nach n. Für den Induktionsschritt
n → n + 1 benutzen wir die Vorwärtsdarstellung. (Die Rückwärtsdarstellung
wäre analog möglich.) Sei f eine positive meßbare Funktion.
Fn+1 (f ) = E
X X
|v|=n i∈IN
=
X
E
|v|=n
Z
X
f (Wvi ) =
E(E(
|v|=n
f (Wv x)dF (x) =
X
i∈IN
Z Z
f (Wv Wi (v)) | Wv ))
f (xy)dF (x)dFn (dy)
= (Fn ∗ F )(f ) = F (n+1)∗ (f ).
q.e.d.
6.2
Das Tailverhalten von Fn .
Wir benutzen im folgenden
m(α) := E
∞
X
Wiα
m0 (α) := E
i=1
X
m00 (α) := E
Wiα ln Wi
Wi >0
X
Wiα ln2 Wi
Wi >0
für α > 0, falls die Terme wohldefiniert sind als absolut konvergierende
Reihen. Falls m differenzierbar ist, sind dies die entsprechenden Ableitungen
von m. Sei
m0 (α)
J(a) := ln m(α) − aα
J = J(a(α)).
a(α) :=
m(α)
Satz 23 Sei α eine strikt positive reelle Zahl mit 0 < m(α) < ∞. Dann gilt
für jede reelle Zahl a und jede positive reelle Zahl b
Fn (bean ) ≤ b−α enJ(a)
(35)
an
ln Fn (be )
lim sup
≤ J(a).
(36)
n
n→∞
Ist m0 (α) eine wohldefinierte reelle Zahl, so gilt für alle a < a(α) ∈ IR und
b>0
ln Fn (bena(α) )
= J
n
Sei 0 < m00 (α) < ∞. Dann gilt für jedes b > 0
lim
n→∞
lim
n→∞
√
ln Fn (bena(α) )
n
− J) = 0
n
Ã
!
63
(37)
(38)
Bew: Mit dem Erwartungswert auf beiden Seiten der Markoff Abschätzung
ξn (t) =
X
|v|=n
11Wv ≥t ≤
X Wvα
|v|=n
tα
=
Zn(α)
tα
(39)
und t = bean eingesetzt ergibt
ξn (t) ≤
Zn(α) nJ(a) −α
e
b
mn (α)
(40)
und die Aussage (35).
Die Aussage (36) ist eine direkte Folgerung aus (35).
a(α)n )
≥ J zu
Wegen (36) reicht es die untere Abschätzung lim inf n ln Fn (ben
zeigen. Definiere das W-mas̈ µ̂ zu dem W-mas̈ µ mit Verteilungsfunktion F
durch
Z
Z
xα
f (x)µ̂(dx) = f (x)
dµ(x)
m(α)
für alle positiven mes̈baren Funktionen f. Dieses existiert.
P
Seien Yn , n ∈ IN uiv Zgn mit Verteilung µ̂ und Sn = ni=1 ln Yi die n−te
Partialsumme der logarithmierten Zgn.. Beachte
E ln Y = E
1 Z α
m0 (α)
= a(α)
x ln x ν(dx) =
m(α)
m(α)
und die Verteilung von eSn =
µ̂n∗ mit
Qn
i=1
µ̂n∗ (dx) :=
Yi ist die n-fache multiplikative Faltung
xα
µn∗ (dx).
n
m (α)
Damit erhalten wir, t = bean
Fn (t) =
Z
11t≤x µn∗ (dx)
n
= m (α)
Z
11t≤x x−α µ̂n∗ (dx)
= mn (α)E11t≤eSn e−αSn
≥ mn (α)e−αn(a(α)+²) E11 ln b +a≤ Sn ≤a(α)+² .
n
n
Der Erwartungswert konvergiert für n → ∞ gegen 1 wegen der fast sicheren
Konvergenz Snn → a(α). Mit ln und lim inf auf beiden Seiten und dann ² → 0
folgt die untere Abschätzung für (37).
64
Für die Aussage 38 zeige zuerst die Wohldefiniertheit von m0 (α) ∈ IR.
(Übung). Die Ungleichung (36) liefert den oberen Grenzwert 0.
Nun zum unteren Grenzwert. Sei Sn wie oben. Die Zgn Sn∗ = Sn√−na(α)
, mit
nσ 2
00
(α)
− a2 die Varianz von ln Y, konvergiert nach dem ZGS gegen eine
σ 2 = mm(α)
standard Gaußverteilung. Wir erhalten mit einer noch wählenden Konstanten
c>0
Fn (bena(α) ) = mn (α)e−αna(α) E11 √ln b
≥ enJ e−α
√
nσ 2
nσ 2 c
E11 √ln b
nσ 2
−α
∗e
≤Sn
√
∗
nσ 2 Sn
∗ ≤c
≤Sn
Der Erwartungswert =: en in obiger Gleichung wird für gros̈e n nach dem
zentralen Grenzwertsatz dicht bei 0 < Φ(c)−Φ(0) < 1, Φ die Verteilungsfunktion
der Normalverteilung, liegen. Wir erhalten
limninf
√
n(
ln en
ln Fn (bena(α) )
− J) ≥ −αcσ + limninf √ →n −αcσ.
n
n
Mit c > 0 klein genug erhalten wir die Teilbehauptung.
q.e.d.
Bemerkung 24 Einige Ergebnisse lassen sich auch erzielen falls m0 (α) nicht
wohldefiniert ist oder den Wert ∞ annimmt. [12]
6.3
Das Tailverhalten des zufälligen Maßes νn
Wir betrachten das asymptotische Verhalten von ξn (t) = v∈Vn 11Wv ≥t . Dies
ist nur auf der Überlebensmenge U interessant, wenn nicht alle Pfadgewichte
einer Generation Null sind.
Die Markoff Ungleichung (39) liefert auch punktweise eine obere Abschätzung.
Zusammen mit Martingalkonvergenz ergibt sich eine obere asymptotische
Schranke
M (α)
ξn (t)
≤ ∞
(41)
lim sup n
m (α)
tα
n
P
(α)
(α)
mit M∞
der Grenzwert des Martingals mZnn(α) .
Für Galton-Watson Prozesse ergeben sich untere asymptotische Schranken
leicht, da jedes Individuum das Gewicht 0 oder 1 trägt und Zn(α) = Zn gilt.
65
Der nächste Satz liefert untere asymptotische Schranken für den GVP. Wir
verwenden a(α), J wie eben.
Wir sprechen vom Galton-Watson Fall, falls es eine Konstante c gibt,
sodass alle Kantengwichte entweder 0 oder c sind.
Satz 25 Der Galton-Watson Fall sei ausgeschlossen. Sei α > 0 und 0 <
m(α) < ∞.
Für J(a) < 0 gilt für jedes b > 0 bis auf endlich viele n
ξn (bena ) = 0.
(42)
(α) −α
lim sup ξn (bena ) ≤ M∞
b .
(43)
Für J(a) = 0 gilt
n
Für J(a) > 0, m0 (α) eine wohldefinierte reelle Zahl gilt für jedes a, b > 0
lim sup
n
ln ξn (bena )
≤ J(a).
n
(44)
Auf der Überlebensmenge U gilt
lim
n
ln ξn (bena(α) )
= J.
n
(45)
Bew: Gelte J(a) < 0. In der Gleichung (40) konvergiert das positive Martingal
(α)
Zn
(α)
fast sicher gegen einen endlichen Grenzwert genannt M∞
. Daher konvergiert
n
m (α)
an
an
ξn (be ) fast sicher mit n → ∞ gegen 0. Da ξn (be ) nur ganzzahlige Werte
annehmen kann erhalten wir die erste Aussage.
Der Fall J(a) = 0 folgt wie oben aus der Martingalkonvergenz.
Sei jetzt J(a) > 0. Gleichung (40) und die Martingalkonvergenz liefern
(44).
Für a < a(α) zeigen wir zuerst lim inf n n1 ln ξn (bena ) ≥ d für jedes 0 <
P
d < J unter der zusätzlichen Voraussetzung i Wiα ist gleichmäßig nach
oben beschränkt durch c < ∞.
Für den Beweis zählen wir ausgewählte Individuen nur entlang der Generationen
mit einem Vielfachen von k als Index. Zu vorgegebenem 0 < d < J wähle ein
k ∈ IN und a < a1 < a(α) mit Fk (eka1 ) ≥ ekd > 1. Dies ist möglich nach Satz
23. Zu diesem k konstruieren wir einen GWP, Notation mit überstrichenen
66
Symbolen, auf dem Baum B = ∪n≥0 Vnk mit den Kanten (v, vw), v ∈ B, |w| =
k und den Pfadgewichten
W w (v) = 11Ww (v)≥ea1 k .
Der Baum B ist isomorph (als Graph) zu V. Die Knotengewichte W v , v ∈ B,
sind 0 oder 1.
P
Der Prozeß Z n := |v|=nk W v in n ist ein Galton-Watson Prozess. Beachte,
nach Konstruktion gilt für v ∈ B
Wv ≥ ea1 |v| W v
ξk (ea1 k ) = Z 1
ξnk (ea1 nk ) ≥ Z n .
• Der GWP (Z n )n ist superkritisch.
Die durchschnittliche Nachkommenschaft ist
m := EZ 1 = Fk (ea1 k ) ≥ ekd > 1.
• Der GWP (Z n )n ist quadratintegrierbar.
Die Nachkommenschaft Z 1 ≤ c ist beschränkt.
Zn
• Das Martingal m
n konvergiert in L2 gegen eine Zg genannt M ∞ .
Das Martingal ist gleichgradig 2-integrierbar 36 da das Supremum der
Varianzen des Martingals beschränkt ist.
• Die Menge M ∞ > 0 hat strikt positives Maß.
Folgt aus Positivität und der L2 −Konvergenz.
(ea1 kn )
> d auf der Menge M ∞ > 0.
• lim inf n ln ξknnk
Mit Monotonieüberlegungen folgt
limninf
ln ξkn (eka1 n )
ln Z n
≥ limninf
nk
nk
Zn
1
ln m
ln n +
= lim inf
n
nk m
k
ln ekd
≥ 0+
=d
k
(46)
(47)
(48)
auf der Menge M ∞ > 0.
an )
≥ d auf M ∞ > 0 für jedes b > 0.
• lim inf n ln ξn (be
n
Jedes n hat eine eindeutige Zerlegung n = mk + r mit 0 ≤ r < k. Wähle
zu für jedes r ein vr = vr (ω) ∈ V1 mit Wvr > 0 und argumentiere mit der
67
Rückwärtsgleichung
X
ξn (t) =
ξmk,v (
|v|=r
t
t
).
≥ ξmk,vr (
Wv
W vr
Hierbei ist ξi,j analog zu ξi für den Baum jV. Für t setze bean ein und
argumentiere für hinreichend große n Wbv ean ≤ ea1 mk für alle r. Der Rest
r
folgt aus dem oberen.
an )
Sei A die Menge lim inf n ln ξn (be
≥ d für jedes b > 0. Sei A(i) das
n
Äquivalent von A auf dem Teilbaum iV gestartet mit dem Gewicht 1 auf i.
• Ai ∩ {Wi > 0} ⊂ A für jedes i ∈ IN.
Die rückwärtige Betrachtung des Prozesses liefert, t = bean ,
X
ξn (t) =
ξn−1,j
j:Wj >0
Ã
t
Wj
!
≥ 11Wi >0 ξn−1,i
µ
t
.
Wi
¶
Die Summe wird nur genommen über j mit Wj > 0 (oder alternativ benutze
die Konvention 0b = ∞ für b > 0). Der Rest folgt.
• P (Ac ) ≤ f (P (Ac )) für die erzeugende Funktion f (s) = EsX , X =
P
1Wi >0 , s ∈ [0, 1].
i1
P (Ac ) ≤ P (∩j (Acj ∪ {Wj = 0}))
= lim P (∩j≤N (Acj ∪ {Wj = 0}))
N →∞
= lim
N
= lim
N
= lim
N
= lim
N
P (J = {i ≤ N | Wi > 0}, ∩j∈J (Acj ∪ {Wj = 0})
X
P (J = {i ≤ N | Wi > 0}, ∩j∈J Acj )
J⊂{1,2,...,N }
= lim
N
X
J⊂{1,2,...,N }
X
J
X
J
N
X
P (J = {i ≤ N | Wi > 0})P (∩j∈J Acj )
|
P (J = {i ≤ N | Wi > 0})P |J (Ac )
N
X
P(
l=0
= f (P (Ac ))
11Wi >0 = l)P l (Ac ) =
i=1
∞
X
P (X = l)P l (Ac )
l=0
• P (Ac ) ≤ q mit q der kleinste Fixpunkt von f in [0, 1].
68
Die Funktion f : [0, 1] → [0, 1] ist monoton steigend, strikt konvex und
stetig. Die Werte s mit s ≤ f (s) sind genau die Werte 0 ≤ s ≤ q oder s = 1.
Dies impliziert P (Ac ) ≤ q oder P (Ac ) = 1. Da A die Menge M ∞ enthält, hat
sie strikt positives Maß hat und die Aussage folgt.
• P (Ac ) = q und A = U fast sischer.
Da A eine Untermenge der Überlebensmenge U sein muss, folgt P (A) ≤
P (U ). Die Überlebensmenge U hat W-keit 1−q, Satz 4. Jetzt ergibt P (Ac ) ≤
q = P (U c ) = 1 − P (U ) ≤ P (Ac ) die Teilbehauptung.
na )
Damit haben wir lim inf n ln ξn (be
≥ J auf der Überlebensmenge U gezeigt
n
unter zusätzlichen Beschränktheitsbedingungen. Von diesen werden wir uns
jetzt lösen durch eine Abschneidetechnik 7.1. Definiere einen neuen GVP mit
den Kantengewichten
W̃i (v) := Wi (v)11P
j≤i
Wjα (v)≤c .
Der neue GVP ist eine Minorante, es gilt stets W̃v ≤ Wv .
Der neue GVP erfüllt die benötigte zusätzliche Eigenschaft und unser
Resultat liefert
ln ξ˜n (bena )
≥ J˜
(49)
limninf
n
für alle b > 0 und a < ã(α) auf der Überlebensmenge Ũ . Wegen Monotonie,
W̃v ≤ Wv , gilt (49) auch für ξ˜n ersetzt durch ξn .
Wir machen jetzt den Übergang c → ∞. Der Wert m̃(α) konvergiert
˜
(monoton) gegen m(α), m̃(α) konvergiert gegen m̃0 (α), und folglich ã(α), J(a)
gegen a(α), J(a). Die Überlebensmenge Ũ ist aufsteigend in c und eine Teilmenge
von U. 1 − P (Ũ ) ist der kleinste Eigenwert q̃ der erzeugenden Funktion
P
P
f˜(s) = n sn P ( i 11W̃i >0 = n). Da f˜ monoton gegen f aufsteigt (und schöne
Eigenschaften hat), erhalten wir q̃ →c q mit etwas Epsilontik. Damit folgt
P (Ũ ) =%c P (U ) und Ũ %c U.
na) )
Damit haben wir lim inf n ln ξn (be
≥ J für alle a < a(α) bewiesen (ohne
n
Zusatzbedingungen).
Wir kommen jetzt zu (45). Der Trick ist eine Abschneidetechnik, die eine
Minorante mit ã(α) > a(α) liefert. Diesmal müssen wir kleine Kantengewichte
wegschneiden, etwa W̃i (v) = Wi (v)11Wi (v)≥c , und machen dann den Grenzübergang
0 < c → 0. Wir überlassen dem Leser die Einzelheiten. (Eventuelle muß
randomisiert werden und/oder c konvergiert absteigend gegen einen endlichen
Grenzwert.)
q.e.d.
69
Zum Abschluss formulieren wir noch ein Korollar. Die Fenchel-Legendre
Transformierte, siehe Anhang,
I(a) := inf (ln m(α) − aα)
α≥0
ist strikt antiton, sofern I endlich ist. Sofern I in einer Umgebeung von a
endlich ist, ordnen wir jedem a dasjenige α = α(a) = arginfI(a) zu, an dem
0 (α)
I(a) das Infimum annimmt. Dies geschieht bei a = m
. Der Galton-Watson
m(α)
Fall sei wieder ausgeschlossen.
Korollar 26 Sei I(a) > 0 und es gebe ein α > 0 mit a =
Funktion m ist endlich in einer Umgebung von α. Dann gilt
m0 (α)
m(α)
und die
1
ln ξn (bena ) →n I(a)
n
fast sicher auf der Überlebensmenge.
Obiges Korollar fogt aus Satz 25. Da α ein Stetigkeitspunkt von m ist, kann
m (unendlich oft) differenziert werden.
6.4
Maximaler Wert
Der Galton-Watson Fall sei wieder ausgeschlossen und die Funktion m endlich
in mindestens einem Wert.
Wir betrachten jetzt den maximalen Wert
Ln = sup Wv
|v|=n
in n-ter Generation. Der Zusammenhang mit ξn ergibt sich aus
Ln ≥ t ⇔ ξn (t) > 0.
Anders formuliert
Ln = inf{t | ξn (t) = 0} = sup{t | ξn (t) > 0}.
Die Fenchel-Legendre Transformierte, siehe Anhang,
I(a) := inf (ln m(α) − aα)
α≥0
70
ist strikt antiton, sofern I endlich ist. Sofern I in einer Umgebeung von a
endlich ist, ordnen wir jedem a dasjenige α = α(a) = arginfI(a) zu, an dem
0 (α)
I(a) das Infimum annimmt. Dies geschieht bei a = m
.
m(α)
Sei
a0 := inf{a | I(a) < 0}.
Ist a0 ein Stetigkeitspunkt von I so gilt I(a0 ) = 0. Anderenfalls ist a0 ein
Randpunkt von I −1 (IR) und es gilt I(a0 ) = −∞.
Korollar 27 Sei a0 ∈ (0, ∞) ein Stetigkeitspunkt von I. Sei α mit a0 =
und α ein innerer Punkt von m−1 (IR). Dann gilt
m0 (α)
m(α)
ln Ln
→n a0
n
auf der Überlebensmenge.
Bew: Sei a > a0 dicht bei a0 und I(a) < 0. Es gibt ein α1 mit I(a) =
ln m(α1 ) − aα1 < 0. Der Satz 25 liefert
lim sup 11ln Ln ≥an = lim sup 11ξn (ean )>0 = 0.
n
n
Dies impliziert lim supn lnnLn ≤ a0 .
Sei a < a0 dicht bei a0 . Die strikte Monotonie von I impliziert I(a) >
0. Wir können daher den Satz 25 anwenden (mit a und α(a)). Auf der
Überlebensmenge U gilt
limninf 11ln Ln ≥an = limninf 11ξn (ean )>0 ≥ limninf 11 ln ξn (ean ) >0 ≥ 11I(a)>0 = 1.
n
Wir erhalten auf der Überlebensmenge
a ≤ limninf
ln Ln
ln Ln
≤ lim sup
≤ a0 .
n
n
n
q.e.d.
Das Korollar 26 ermöglicht Abschätzungen der Anzahl der Individuen.
Korollar 28 Seien a1 < a2 < a0 und α(a1 ), α(a2 ) innere Punkte vom Definitionsbereich
der Funktion m. Dann gilt
1
ln |{v ∈ Vn | ea1 n ≤ Wv < ea2 n }| →n I(a1 ).
n
71
Bew: Sei Xn := ξn (ea1 n ) > Yn := ξn (ea2 n ).
1
1
ln |{v ∈ Vn | ea1 n ≤ Wv < ea2 n }| =
ln(Xn − Yn )))
n
n
¶
µ
1
1
Yn
=
ln(Xn ) + ln 1 −
n
n
Xn
Der erste Term konvergiert gegen I(a1 ), Korollar 26. Der zweite Term konvergiert
gegen 0, da 1 ≥ XYnn →n 0 fast sicher konvergiert. Dies folgt punktweise für n
hinreichend gros̈ aus
I(a2 )−I(a1 )
ln Yn −ln Xn
Yn
n
2
≤ en
→n 0.
= en
Xn
(Wir haben die strikte Monotonie von I benutzt.)
q.e.d.
Die Resultate zum Maximum folgen im wesentlichen der Arbeit Biggins,
Chernoff’s Theorem in the branching random walk, J. Appl. Prob. 14, 630636 (1977).
72
6.5
Logkonvexität der characteristischen Kantenfunktion
Durchgehend ist der Zustandsraum enthalten in den positiven reellen Zahlen.
Das Hauptresultat dieses Abschnittes ist die Logkonvexität der (erweiterten)
Funktion m
X
m
(0, ∞) 3 α 7→= E
Wiα .
i
Die erweiterte Funktion m ist immer wohldefiniert, kann jedoch den Wert
∞ annehmen. m heißt die charakteristische Kantenfunktion.
Sei D = m−1 (IR) die Menge der strikt positiven α mit endlichem Kantenfunktionswert
m(α). Dies ist stets ein Intervall, mit oder ohne die Randpunkte αl , αr ∈
[0, ∞]. Der Definitionsbereich D von m hae stets ein nicht leeres Inneres.
Eine Funktion f : I → IR mit Definitionsbereich I ⊂ IR heißt konvex, falls
f (tx+(1−t)y) ≤ tf (y)+(1−t)f (y) für alle reellen Zahlen x, y, tx+(1−t)y aus
dem Definitionsbereich und t aus dem Einheitsintervall gilt. Wir sprechen von
strikter Konvexität, falls in der Ungleichung stets strikt kleiner steht, sofern
t aus dem offenen Einheitsintervall (0, 1) stammt und x 6= y gilt.
Die charakteristische Funktion m ist antiton (monoton fallend), wenn alle
Kantengewichte aus dem Einheitsinterval sind und isoton (monoton steigend),
falls alle Kantengewichte größer oder gleich 1 sind.
Die Kantenfuntion m|D eingeschränkt auf D ist konvex. (Sie ist Summe
positiver konvexer Funktionen und damit konvex.) Sie ist sehr stark konvex,
genauer gesagt logarithmisch konvex. Eine Funktion f : I → IR> heißt
(strikt) logarithmisch konvex oder logkonvex, falls der Logarithmus der
Funktion (strikt) konvex ist. Die logarithmische Konvexität einer Funktion
f ist äquivalent zu
f (tx + (1 − t)y) ≤ f t (x)f 1−t (y)
für alle t aus dem Einheitsintervall und reelle Zahlen x, y, tx + (1 − t)y aus
dem Definitionsbereich.
Proposition 29 Eine logarithmisch konvexe Funktion ist konvex, eine strikt
logarithmisch konvexe ist strikt konvex. Eine logarithmisch konvexe Funktion,
die nicht konstant ist auf einem offenen Intervall, ist strikt konvex.
Bew: Sei ϕ(x) = eψ(x) mit ψ konvex und zweimal stetig differenzierbar.
Dann gilt ϕ00 = eψ (ψ 00 + (ψ 0 )2 ). Konvexität ist äquivalent zur Positivität
73
der zweiten Ableitung und strikte Konvexität zur strikten Positivität bis auf
eine abgeschlossene Menge mit leerem Inneren.
Ohne Differenzierbarkeit sind die Aussagen (schreibtechnisch aufwändiger)
ebenfalls herleitbar.
q.e.d.
Lemma 30 Ein Integral über logkonvexe Funktionen bzgl. einem Mas̈ ist
logkonvex. Das Integral ist strikt logkonvex, falls für alle x 6= y und t ∈ (0, 1)
es keine Konstante c gibt mit µ({f | f (x) 6= cf (y)}) = 0.
R
Bew: Sei h = f µ(df ) ein Integral über logkonvexe Funktionen f und sei
1
t ∈ (0, 1). Wir benutzen die dualen Zahlen p = 1/t, q = 1−t
mit p1 + 1q = 1.
h(tx + (1 − t)y) =
Z
f (tx + (1 − t)y)µ(df ) ≤
Z
f t (x)f 1−t (y)µ(df )
= kf t (x)f 1−t (y)k1 ≤ kf t (x)kp kf 1−t (y)kq = ht (x)h1−t (y)
Die erste Ungleichung beruht auf Logkonvexität und ist strikt für strikt
logkonvexe Funktionen. Die zweite Ungleichung ist die Hölder Ungleichung.
Gleichheit gilt genau dann, wenn für festes x, y stets f (x) dasselbe Vielfache
von f (y) µ fast sicher ist.
q.e.d.
Bemerkung: Das Lemma schließt Summen ein als ein Integral bzgl. dem
Zählmaß.
Satz 31 Die Funktion m|D eingeschränkt auf D ist logkonvex. Sie ist strikt
logkonvex, falls m keine Konstante ist.
Bew: Die Funktionen α → xα für x ≥ 0 sind logkonvex. Die Funktion m(α) =
P
E i Wiα ist als Integral über logkonvexe Funktionen logkonvex nach Lemma
30. Für die strikte Kogkonvexität müssen wir konstante Kantenfunktionen
ausschließen.
q.e.d.
Eine Funktion f auf de reellen Zahlen heißt oberhalb (unterhalb) stetig,
falls für alle y ∈ IR die Menge {x ∈ E | f (x) > y} ({x ∈ E | f (x) < y})
offen ist. Äquivalent ist die Aussage, für jede konvergente Folgen xn → x gilt
lim inf n f (xn ) ≥ f (x) (lim supn f (xn ) ≤ f (x)).
Lemma 32 Sei m|D keine Konstante und sei D nicht leer oder einelementig.
Die Funktion m ist strikt konvex und unterhalbstetig. Die Funktion ist unendlich
74
oft differenzierbar im Inneren von D und die Ableitungen haben stetige Erweiterungen
auf die Randpunkte von D. Es gilt
lim
α→∞
ln m(α)
= ln esssupi Wi
α
Die Funktion m ist strikt logkonvex.
Beweis: Wir benutzen die Zerlegung
m(α) = E
X
Wiα + E
Wi <1
X
Wiα + E
Wi =1
X
Wiα .
i:Wi >1
Der linke Term ist fallend in α, der mittlere unabhängig von α und der rechte
aufsteigend. Wir erhalten strikte Logkonvexität und strikte Konvexität.
Für die Unterhalbstetigkeit reicht es die Stetigkeit in den Randpunkten
von D nachzuweisen. Dies folgt aus monotoner Konvergenz.
• Unendlich oft differenzierbar.
P
Die formale Ableitung ist m(k) (α) = E i Wiα lnk Wi . In der Zerlegung
wie oben ist jede der drei Summen und auch deren Ableitungen monoton in
α (monotonen Konvergenz).
• lim inf ln m(α)
≥ ln s wobei s = esssupWi ist.
α
Sei r < s dicht bei s. Aus
∞ > m(α) ≥ E
X
wi >r
Wiα ≥ rα E
X
Wi >r
≥ ln r. Der Term E
folgt die untere Abschätzung lim inf α→∞ ln m(α)
α
ist positiv und endlich.
≤ ln s
• lim sup ln m(α)
α
Sei α ≥ α0 und m(α0 ) < ∞. Sei s < ∞. Es gilt
m(α) = sα E
X µ W i ¶α
i
s
P
wi >c1
≤ sα−α0 m(α0 )
und hieraus die Teilbehauptung.
q.e.d.
Die charakteristische Kantenfunktion m eingeschränkt auf D ist stetig
im Inneren von D und hat eventuelle Sprünge nach ∞ auf den Endpunkten
von D. Eine Sprungstelle tritt genau dann auf, wenn m an dem Randpunkt
endlich ist.
75
6.6
Die Fenchel-Legendre Transformierte
Sei m endlich in mindestens einem Punkt α0 > 0 und der Galton-Watson
Fall liegt nicht vor.
Definiere das Aktionsfunktional I : (−∞, ∞) → IR
I(a) := inf (ln m(α) − aα).
α>0
I ist wohldefiniert. I kann nicht den Wert ∞ annehmen, denn es gilt stets
I(a) ≤ ln m(α0 ) − aα0 < ∞.
Sei c das essentielle Supremum esssupi Wi aller Kantengewichte.
Proposition 33 Die erweiterte Funktion I ist monoton fallend, konkav und
oberhalb stetig.
Beweis: • Monotonie.
Für jedes α ≥ 0 ist die Funktion a 7→ ln m(α) − aα fallend. Das Infimum
fallender Funktionen ist fallend.
• Konkavität.
Mit entsprechender Notation haben wir I(ta+(1−t)b) ≥ tI(a)+(1−t)I(b)
zu zeigen. Zu vorgegebenem ² wähle 0 ≤ α mit I(ta + (1 − t)b) ≥ ln m(α) −
(ta + (1 − t)b)α − ². Dann gilt
I(ta+(1−t)b) ≥ t(ln m(α)−aα)+(1−t)(ln m(α)−bα)−² ≥ tI(a)+(1−t)I(b)−².
Da ² beliebig war folgt die Teilbehauptung.
• Oberhalbstetigkeit.
Für jedes α ist die Funktion a 7→ ln m(α) − aα oberhalb stetig. Das
Infimum oberhalb stetiger Funktionen ist oberhalb stetig. (Nachrechnen.)
q.e.d.
Bei fallenden Monotonie ist Oberhalbstetigkeit äquivalent zur Linksstetigkeit.
Das Infimum I(a) wird angenommen entweder durch ein α = α(a) aus
0 (α )
l
dem Rand von D oder im Inneren von D. αl tut es für a ≤ m
und ar tut
m(αl )
0
(αl )
es für a ≥ m
. In allen anderen Fällen liegt α im Inneren von D und ist
m(αl )
eindeutig bestimmt durch
m0 (α)
.
a=
m(α)
Viele weitere Eigenschaften liessen sich aufzeigen: Ist m(αl ), m(αr ) < ∞
so ist I eine Funktion. Und damit auch stetig. Sei c das essentielle Supremum
76
aller Kantengewichte. Ist c < 1, so ist I(a) = −∞ für a > 0. Ist 1 < c < ∞
und αr = ∞, so gilt I(a) = −∞ für a > ln c. Im Fall c = ∞ und αr = ∞ ist
I eine Funktion.
6.7
Gleichgradige Integrierbarkeit
Eine Familie F von Zgn heißt gleichgradig integrierbar, falls gilt
g(c) := sup
X∈F
Z
{|X|>c}
|X|dP −→c→∞ 0.
Eine Familie F von Zgn heißt gleichgradig f -integrierbar, falls die Familie
f (X), X ∈ F gleichgradig integrierbar ist. Im Falle f (x) = xp , p > 0
sprechen wir von gleichgradiger p-Integrierbarkeit.
Bemerkung: Gleichgradige Integrierbarkeit ist eine Eigenschaft der Verteilungen
der Zgn und hängt nicht von der Realisation der Zgn ab. Eine Familie
gleichgradig integrierbaren Zgn erfüllt stets supX E|X| ≤ c + g(c) < ∞.
Für eine Zg X definiere H = HX : [0, 1] 7→ IR
Z
HX (t) := sup{
A
|X|dP | P (A) ≤ t}.
Für eine Familie F von Zgn benutzen wir
HF (t) := sup HX (t).
X∈F
Falls der W-raum reichhaltig genug ist und eine gleichförmig verteilte Zg
besitzt, so gilt
Z
HX (t) =
1
1−t
F −1 (u)du,
mit F die Verteilungsfunktion zu |X|. Übung.
Satz 34 Für eine Familie F von Zgn sind die folgenden beiden Aussagen
äquivalent:
i) F ist gleichgradig integrierbar.
ii) Für alle ² > 0 gibt es
eine integrierbare Zg Y so, daß für alle Zgn
R
X ∈ F aus der Familie gilt |X|>Y |X|dP < ².
iii) HF : [0, 1] → IR ist stetig in 0.
iv) Es gibt eine aufsteigende Funktion ϕ : IR+ → IR+ mit limx→∞ ϕ(x)
=
x
∞ und F ist gleichgradig ϕ-integrierbar.
77
Beweis: i)⇒ ii) Wähle Y als eine Konstante.
ii) ⇒ iii) In der Zerlegung
Z
A
Z
|X|dP =
A∩{|X|>Y }
|X|dP +
Z
A∩{|X|≤Y }
|X|dP ≤
Z
|X|>Y
|X|dP +
Z
A
|Y |dP
ist der erste Term klein durch Wahl des Y. Der zweite Term ist klein in P (A)
klein.
iii) ⇒ i) Zu vorgegebenem ² > 0 wähle ein p > 0 mit HF (p) < ². Wähle
eine Überdeckung (Ai )i von Ω in N = p1 + 1 Mengen vom Maß ≤ p. Dann
gilt gleichmäßig in X ∈ F
Z
|X|dP ≤
Z
∪i A i
|X|dP ≤
XZ
i
Ai
|X|dP ≤ ²N.
Damit gilt
²N
|X|dP
≤
→c→∞ 0
c
c
X
X
R
und supX |X|>c |X| < ² for c sufficiently large.
iv) ⇒ i)
sup P (|X| > c) ≤ sup
Z
|X|>c
|X| =
Z
|X|>c
R
|x|
|X|
ϕ(|X|) ≤ sup
Eϕ(|X|).
ϕ(|X|)
x≥c ϕ(|x|)
Der erste Faktor konvergiert mit c → ∞ gegen 0 und der hintere ist endlich
gleichmäßig für X ∈ F.
P
i) ⇒ iv) Wähle positive Zahlen R0 < bn mit n bn < ∞ und eine aufsteigende
Folge 0 < en →n ∞ mit supX∈F |X|≥en |X| ≤ bn . Definiere die Funktion ϕ
P
= ∞ wegen Monotonie
durch ϕ(x) = n (x − en )+ . Dann gilt limx→∞ ϕ(x)
x
und gleichmäßig in X ∈ F
Z
ϕ(|X|) =
XZ
n
(|X| − en )+ ≤
X
n
bn < ∞.
q.e.d.
Bemerkung Die hier konstruierte Funktion ϕ ist eine Orlicz Funktion
(ϕ ist positiv, konvex und ϕ(0) = 0). Zusätzlich ließe sich ϕ glatt wählen,
eventuell unendlich oft differenzierbar und ϕ(x) > 0 für x > 0.
Der wesentliche Einsatz gleichgradiger Integrierbarkeit besteht in folgendem
Lemma.
78
Lemma 35 Sei Xn , n ∈ IN eine gegen X in Verteilung konvergierende Folge
von Zgn. Ist die Familie (Xn )n gleichgradig integrierbar, so vertauschen für
jede stetige Funktion f mit
lim sup
|x|→∞
|f (x)|
<∞
|x|
(50)
das Integral und der Limes,
lim
Ef (Xn ) = Ef (X).
n
Bew: • Die Familie Xn , n ∈ IN ist gleichgradig f -integrierbar.
(x)|
< ∞. Es gilt
Sei b = supx |f|x|
Z
|f (Xn )|≥c
|f (Xn )| ≤ b
Z
|Xn )|≥ cb
|x| →c 0.
• limn Ef (Xn ) = Ef (X).
Wir benutzen eine Abschneidetechnik. Zu vorgegebenem c > 0 sei fc die
bei c und −c gekappte stetige Funktion,
fc (x) = (f (x) ∧ c) ∨ −c.
Es gilt
|Ef (Xn )−Ef (X)| ≤ E|f (Xn )−fc (Xn )|+E|fc (Xn )−fc (X)|+E|fc (X)−f (X)|.
Der erste und dritte Term sind beliebig klein gleichmäßig in n für c hinreichend
groß wegen der gleichgradigen f -Integrierbarkeit. Der zweite Term ist beliebig
klein für festes c bei hinreichend großem n.
q.e.d.
Korollar 36 Sei Xn , n ∈ IN eine Folge von integrierbaren Zgn, die in Verteilung
gegen X konvergiert. Die Familie Xn , n ∈ IN ist gleichgradig integrierbar
genau dann wenn gilt
lim
E|Xn | = E|X| < ∞.
n
79
Bew: Die Hinrichtung folgt aus obigem Lemma mit f die Betragsfunktion .
Für die Rückrichtung sei fc die gekappte Betragsfunktion wie oben.
Z
|Xn |>c
|Xn | =
≤
Z
Z
|Xn | −
Z
|Xn |≤c
|Xn |
(|Xn | − |X|) +
Z
|Xn |≤c
(−fc (Xn ) + fc (X)) +
Z
|X|>c
fc (X)
Der dritte Term auf der rechten Seite ist beliebig klein für c hinreichend groß
wegen der Markoff Ungleichung. Der erste und zweite Term sind beliebig
klein bei festem c für n hinreichend groß.
q.e.d.
Korollar 37 Seien Xn , n ∈ IN , p-integrierbare Zgn, 1 ≤ p < ∞. Xn
konvergiert in Lp genau dann, wenn Xn stochastisch konvergiert und die
Familie (Xn )n gleichgradig p-integrierbar ist. Im Konvergenzfalle sind der
stochastische und der Lp -Limes gleich.
Bew: Lp -Konvergenz impliziert stochastische Konvergenz
E|Xn − X|p
→n→∞ 0
²p
und diese impliziert Konvergenz in Verteilung. Die gleichgradige p-Integrierbarkeit
folgt aus obigem Lemma.
Für die Rückrichtung argumentiere
P (|Xn − X| ≥ ²) ≤
Z
p
|Xn − X| dP =
Z
|Xn −X|>c
... +
Z
²<|Xn −X|≤c
... +
Z
|Xn −X|≤²
....
Der dritte Term ist beliebig klein für ² hinreichend klein. Der erste Term ist
beliebig klein gleichmäßig in n, ² für c hinreichend groß wegen p-gleichgradiger
Integrierbarkeit (Lemma ?? und beachte |x + y|p ≤ 2p (|x| + |y|).) Der zweite
Term wird abgeschätzt durch ≤ cP (|Xn − X| > ²) und ist klein für n
hinreichend groß bei festem c und ².
q.e.d.
Korollar 38 Sei Xn stochastisch konvergent gegen X und sei 1 ≤ p < ∞.
Dann sind äquivalent:
i) E|Xn |p →n→∞ E|X|p .
ii) (Xn )n∈IN gleichgradig p-integrierbar.
Bew: Der Beweis folgt direkt aus obigem Korollar. Beachte, stochastische
Konvergenz und Konvergenz der p-tem Momente impliziert Lp -Konvergenz.
q.e.d.
80
6.8
Orlicz Räume
Dieser Abschnitt behandelt das ARTV-Resultat.
Eine Orlicz Funktion [18][19] ist eine konvexe Funktion ϕ : IR+ → IR+ mit
ϕ(0) = 0. Jede Orlicz Funktion ist aufsteigend, stetig bis auf eventuell einen
Sprung auf ∞ und hat fast sicher eine rechte und linke Ableitung. Die triviale
Orlicz Funktion überall unendlich bis auf den Nullpunkt wird üblicherweise
ausgeschlosen.
Zu gegebener Orliczfunktion ϕ definiere die Abbildung dϕ auf Zgn
dϕ (X, Y ) := inf{c > 0 | Eϕ
³ |X − Y | ´
c
und
Lϕ := {X : Ω → IR | ∃c > 0 Eϕ
Ohen Beweis geben wir an.
³ |X| ´
c
< 1}
< ∞}.
Proposition 39 Sei ϕ eine Orlicz Funktion. Der Raum (Lϕ , k · kϕ , kXkϕ =
dϕ (X, 0) ist eine separabler Banachraum.
Notation: Lϕ heißt Orlicz Raum und k · k die Orlicz Norm.
7
Die ARTV-Ungleichung
Sei G die Klasse der symmetrischen konvexen Functionen ϕ mit ϕ(0) = 0
und sei G0 die Teilmenge φ ∈ G mit einer konkaven Ableitung auf (0, ∞).
Funktionen aus G0 , die Funktion identisch 0 ausgenommen, sind stetig, strikt
aufsteigend und eine Bijektion von IR+ . .
Beispiele sind die Funktionen x 7→ |x|p für p ∈ [1, 2] und x 7→ (|x| +
p
a) logr (x + a) − ap logr a für p ∈ [1, 2), r > 0 und a > 0 hinreichend groß.
Für ein Martingal M = (Mn , An )n∈IN0 benutzen wir die Martingaldifferenzen
Dk := Mk − Mk−1 , k ∈ IN. Dann gilt
Theorem 40 Sei ϕ aus G0 und M ein Martingal mit Martingaldifferenzen
Dk . Dann gilt
Eϕ(Mn ) − Eϕ(M0 ) ≤ 2
81
n
X
k=1
Eϕ(Dk ).
(51)
Die Konstante 2 ist scharf. Ist M ein positives Martingal oder sind die
Verteilungen der bedingten Differenzen stets symmetrisch, so ist 1 die scharfe
Konstante.
[1]. Das Resultat ist dort für ϕ-integrierbare Martingale bewiesen, gilt jedoch
allgemein.
Ein strukturell ähnliche Ungleichung kann aus der Burkholder-DavisGundy Ungleichung [7][2. Thm. 1] für das Maximum Mn∗ = supi≤n |Mi |
geschlossen werden. Sei a > 0 and G(a) die Klasse aller φ ∈ G mit φ(2x) ≤
aφ(x) für alle x.
Satz 41 (Burkholer-Davis-Gundy) Zu vorgegebenem a > 0 gibt es eine
Konstante Ca ∈ (0, ∞), so das für alle ϕ ∈ G(a) und Martingale M mit
M0 = 0 gilt


Eϕ(Mn∗ )
!1/2
Ã n
X
2
.
Dk
≤ Ca Eϕ 
k=1
Diese Ungleichung können wir auf G0 anwenden, siehe die folgende Proposition.
Die Funktion ψ, definiert durch ψ(t) := ϕ(t1/2 ) für vorgegebenes ϕ ∈ G0 , ist
P
P
konkav und subadditive (ψ( nk=1 xk ) ≤ nk=1 ψ(xk ) für alle 0 ≤ x1 , . . . , xn
und n ∈ IN ).
Korollar 42 Für jedes ϕ ∈ G0 und jedes Martingal M mit M0 = 0 gilt
Eϕ(Mn∗ ) ≤ C4
n
X
Eϕ(Dk ).
k=1
Proposition 43 Es gilt G0 ⊂ G(4) und ψ ist konkav und subadditiv.
Bew: Sei ϕ ∈ G0 . Die Konkavität von ϕ0 und die Positivität von ϕ0 (0) liefert
ϕ0 (2x) ≤ 2φ0 (x) wegen
1
ϕ0 (2x)
ϕ0 (x) ≥ (ϕ0 (2x) + ϕ0 (0)) ≥
.
2
2
Damit gilt
ϕ(2x) =
Z
0
2x
ϕ0 (t) dt =
Z
0
x
2ϕ0 (2t) dt ≤
82
Z
0
x
4ϕ0 (t) dt = 4ϕ(x)
für alle x ≥ 0.
Nun zur Konkavität. Die Ableitung von ψ ist
√
1
ϕ0 (0)
1 Z x 00
ψ 0 (t) = ϕ( x) √ = √ + √
ϕ (t)dt.
2 x
x
x 0
Da ϕ00 fallend in t ist, ist ψ 0 fallend. Genau genommen haben wir hier xϕ00 (x)−
ϕ0 (x) ≤ 0 für alle x ≥ 0 gezeigt.
Jede positive konkave Funktion ist subadditiv.
q.e.d.
Wir erhalten die folgenden Folgerungen aus der standard Martingaltheorie.
Corollary 44 Sei ϕ aus G0 und nicht identisch 0. Sei M ein Martingal.
Unter der Bedingung
∞
X
k=1
Eϕ(Dk ) < ∞
ist M ein gleichgradig integrierbares Martingal und das Supremum des Martingals
ist ϕ-integrierbar. Weiterhin konvergiert das Martingal fast sicher und im
L1 -Sinne.
Bew: Sei M ein Martingal mit M0 = 0. Das Korollar 42 liefert uns die endliche
∞
P
Schranke c =
Eϕ(Dk ) für Eϕ(Mn∗ ) für jedes n. Insbesonders konvergiert
k=1
das Martingal fast sicher. Für das Maximum M ∗ = supn Mn gilt
Eϕ(M ∗ ) = E lim
ϕ(Mn∗ ) = lim
E$(Mn∗ ) ≤ c < ∞.
n
n
Das Martingal ist gleichgradig integrierbar.
Im Fall M0 6= 0 verwende sinnvoll die Abschätzungen
ϕ(x + y) ≤ ϕ(2x) + ϕ(2y) ≤ 2ϕ(x) + 2ϕ(y)
zum Beweis der Aussagen.
(52)
q.e.d.
Theorem 45 Sei ϕ ∈ G0 und erfülle limx→∞ ϕ(x)
= ∞. Sei M = (Mn , An )n )n∈IN
x
ein Martingal mit supn Eϕ(Mn ) < ∞. Dann ist M ein gleichgradig integrierbares
und gleichgradig ϕ-integrierbares Martingal. Das Supremum des Martingals
ist integrierbar und ϕ-integrierbar. Weiterhin konvergiert das Martingal M
und das Submartingal ϕ(M ) und der Prozeß ϕ(Mn − M∞ ) fast sicher und im
L1 -Sinne.
83
Bew:
sup
n
Z
|Mn |>c
|Mn |dP ≤ sup
n
Z
|Mn |>c
|Mn |
ϕ(Mn )dP
ϕ(Mn )
Z
|y|
sup
≤ sup
ϕ(Mn )dP
|Mn |>c
|y|≥c ϕ(y) n
|y|
sup Eϕ(Mn ) →c→∞ 0.
≤ sup
|y|≥c ϕ(y) n
Die f.s. Konvergenz folgt aus dem Satz von Doob, die L1 -Konvergenz aus der
gleichgradigen Integrierbarkeit.
Die f.s. Konvergenz von ϕ(Mn ) folgt aus Stetigkeit von ϕ.
Wir kommen jetzt zur L1 -Konvergenz des Submartingals ϕ(M ) gegen
ϕ(M∞ ). Seien ϕy die Funktionen IR+ 3 x 7→ (x − y)+ . Jede Orlicz Funktion
ϕ auf IR+ hat eine (Choquet-)Darstellung
ϕ=
Z
0
∞
ϕy µ(dy)
mit einem Maß µ. (Die Funktionen ϕy , y ∈ IR+ sind die extremalen Funktionen
und das Mas̈ ist eindeutig. Die Umkehrung, sofern alles wohldefiniertist,
gilt auch.) Diese Darstellung läßt sich einfacher sehen falls ϕ zweimal stetig
differenzierbar ist.
ϕ=
Z
0
x
0
ϕ (z)dz =
x
Z
0
Z
(
z
0
00
0
ϕ (y)dy + ϕ (0))dz =
Z
∞
0
(x − y)+ ϕ00 (y)dy.
Das Darstellungsmaß ist µ(dy) = φ00 (y)dy.
Im folgenden benutzen wir das Submartingal ϕy (Mn ) = (|Mn | − y)+ , y ∈
IR+ . Der Erwartungswert E(ϕy (Mn ) ist aufsteigend in n und der Satz von
der monotonen Konvergenz liefert
lim
Eϕ(Mn ) = lim
E
n
n
= lim
=
Z
Z
n
0
∞
0
Z
∞
0
∞
ϕy (Mn )µ(dy)
Eϕy (Mn )µ(dy) =
Z
0
∞
lim Eϕy (Mn )µ(dy)
n
Eϕy (M∞ )µ(dy) = Eϕ(M∞ ).
Damit ist das Martingal gleichgradig integrierbar.
84
Die f.s. Konvergenz von ϕ(Mn ) folgt aus dem Satz von Doob und die
L1 -Konvergenz aus der gleichgradigen Integrierbarkeit.
Die letzte Aussage folgt mit A = {|Mn − M∞ | < b} und der Ungleichung
52
Eϕ(Mn − M∞ ) =
≤
Z
ZA
A
ϕ(Mn − M∞ ) +
ϕ(Mn − M∞ ) +
Z
ZA
c
Ac
ϕ(Mn − M∞ )
2ϕ(Mn ) +
Z
Ac
2ϕ(M∞ )
Der zweite und dritte Term sind beliebig klein wegen gleichgradiger Integrierbarkeit
für b hinreichend groß gleichmäßig in n. Der erste Term ist beliebig klein bei
festem c für n hinreichend groß.
q.e.d.
Starke Gesetz der Großen Zahl
.......................................
Projektiver Grenzwert. ...........Kolmogorov.........
CHOW, Y.S. and TEICHER, H. (1997). Probability Theory: Independence,
Interchangeability, Martingales (3rd Edition). Springer, New York.
TOPCHII, V.A. and VATUTIN, V.A. (1997). Maximum of the critical
Galton-Watson processes and left continuous random walks. Theory Probab.
Appl. 42, 17-27.
G. Alsmeyer, U. Rösler: The Best Constant in the Topchii-Vatutin-Inequality
for Martingales
7.1
Abschneidetechnik
Durch Abschneidetechniken werden punktweise Minoranten eines GVP erzeugt.
Die Vorteile sind bessere analytische Eigenschaften der Minoranten.
Der unten gestutzte GVP
Für c > 0 definiere den unten gestutzten GVP, Notation mit hochgestelltem
Index c, durch die Kantengewichte
W c (v, vi) = W (v, vi)11W (v,vi)≥c .
Der unten gestutzte GVP ist eine punktweise Minorante
Lc (v) ≤ L(v)
für alle Knoten v. Diese Ordnung überträgt sich auf Zählfunktionale
νnc ≤ νn
Eνnc ≤ Eνn
85
Die gesamte Familie GVPc , c ≥ 0, wobei wir c = 0 für den Originalprozess
benutzen, ist eine monotone Familie. Die Funktionale W c (v), Lc (v), νnc , Eνnc , mc , (mc )00
sind antiton in c. Ebenfalls isoton ist die Funktion
c 7→
(mc )0
.
mc (α)
Verwende dazu die Proposition 46 mit µc = I11[c,∞) eν mit deer Identitäet I.
R
(mc )0
Dann ist c → ln xµc (dx) = m
c (α) monoton steigend.
Der unten randomisiert gestutzte GVP
Randomisierung wird eingesetzt um Stetigkeit (oder Konvexität) im Parameterraum
zu erreichen.
Für (c, p) ∈ (IR≥ , [0, 1]) definiere GVPc,p durch die Kantengewichte
W c,p (v, vi) = W (v, vi)(11W (v,vi)>c + 11W (v,vi)=c 11U (v,vi)≥p .
Hierbei sind die U (v, vi), v ∈ Vi ∈ IN weitere unabhängige Zgn mit einer
Rechteckverteilung auf dem Einheitsintervall. Der Parameterraum (IR≥ , [0, 1])
bekommt die partielle Ordnung
(c1 , p1 ) ≤ (c2 , p2 ) ⇔ c1 < c2 oder (c1 = c2 und p1 ≤ p2 .
Mit dieser Ordnung ist die Familie GVP( c, p) antiton (isoton) geordnet
wie vorher auch. Der Vorteil der randomisierten Version ist die punktweise
Stetigkeit von (c, p) 7→ W c,p (., .) und deren Abkömmlingen wie mc , (mc )0 , (mc )00 .
Der oben gestutzte GVP
Für c > 0 definiere den oben gestutzten GVP, Notation mit hochgestelltem
Index c, durch die Kantengewichte
W c (v, vi) = W (v, vi)11W (v,vi)≤c .
Der unten gestutzte GVP ist eine punktweise Minorante
Lc (v) ≤ L(v)
für alle Knoten v. Diese Ordnung überträgt sich auf Zählfunktionale
νnc ≤ νn
Eνnc ≤ Eνn
86
Analoge Aussagen gelten für die gesamte Familie GVPc , c ≥ 0, wobei wir
c = 0 für den Originalprozess benutzen, als monotone Familie. Die Funktion
c 7→
(mc )0
mc (α)
wird jetzt antiton.
Der oben randomisiert gestutzte GVP Die Vorteile der Randomisierung
und die Konstruktion ist wie vorher. Wir überschlagen die angepasste Konstruktion.
Weitere Abschneidetechniken Je nach Problemstellung können weitere
Zgn vorteilhaft abgeschnitten werden, wie z.B. die Summe der Kantengewichte
ausgehend von einem Knoten.
7.2
Stochastische Monotonie
Proposition 46 Sei µ ein Maß auf den reellen Zahlen mit µ[a, ∞) < ∞ für
alle reellen Zahlen a. Seien µa die W-mas̈e definiert durch
Z
f dµa =
R
f dµ
µ[a, ∞)
[a,∞)
für positive, mes̈bare Funktionen f und µ[a, ∞) > 0. Dann ist die Familie
(µa )a von W-maßen stochastisch monoton in a.
Beweis: Sei a1 < a2 und 0 < µ[a2 , ∞). Es gilt
l.S. =
µ[x, ∞)
µ[x, ∞)
≤
= r.S.
µ[a1 , ∞]
µ[a2 , ∞]
q.e.d.
87
Literatur
[1] ........
[2] ..............
[3] .............
[4] ........
[5] ...............
[6] ................
[7]
[8] ........
[9] .........
[10] ...........
[11] ......
[12] ...........
[13] .............
[14] ................
[15] ..........
[16] .............
[17] ...........
[18]
[19]
[20]
[21] ,,,,,,,,,,,
88
[22] .........
[23] .................
[24] .....
[25] ...............
89

Gewichteter Verzweigungsprozess

Transcription

Similar documents

Patch

B−nderharfe f. PDF (Page 1) - Hans Lingl Anlagenbau und

- Angewandte

Tieroekologie 01 Populationen

Vorläufiges komplettes Skript (Stand 22.01.2015)