Nr. 173

Transcription

Nr. 173
Mannheimer Manuskripte zu Risikotheorie,
Portfolio Management und Versicherungswirtschaft
Nr. 173
Anwendung des Kalman-Filters
zur Identifikation und Projektion von Zinsstrukturmodellen :
Modelltheoretische Grundlagen
von
PETER ALBRECHT
UND
CHRISTOPH MAYER
Mannheim 05/2008
Anwendung des Kalman-Filters zur Identifikation und Projektion von
Zinsstrukturmodellen : Modelltheoretische Grundlagen
Peter Albrecht / Christoph Mayer
1.
Einführung
Die empirische Identifikation von arbitragefreien Modellen der Zinsstruktur1 beinhaltet eine
spezifische Problematik. Die zentrale die Zinsstruktur treibende Größe ist die Zinsintensität {R t } . Die Zinsintensität als Grenzwert kurzfristiger Zinssätze ist nun aber keine am Markt
beobachtbare Größe, sondern eine latente Variable. Bei den Standardansätzen zur Identifikation von Zinsstrukturmodellen wird daher die Zinsintensität durch einen kurzfristigen Zinssatz, etwa Zinssätzen auf Monatsbasis2, approximiert. Diese Vorgehensweise führt notwendigerweise zu Verzerrungen bei der statistischen Identifikation der Prozessparameter.
Eine Alternative hierzu bildet der State Space-Ansatz bzw. Kalman-Filter3, da dieser explizit
die Erfassung latenter Variablen mit stochastischer (linearer) Entwicklungsdynamik erlaubt.
Die Verwendung des Kalman-Filters auf die Identifikation von Zinsstrukturmodellen wurde
erstmals von PENNACCHI (1991) durchgeführt und hat in jüngerer Zeit4 verstärkt Beachtung
gefunden. Der Kalman-Filter weist dabei eine Reihe von weiteren Vorzügen auf, die ihn –
gerade bei höherdimensionalen Modellen – zu einem interessanten und wertvollen generellen
Ansatz zur Identifikation von Zinsstrukturmodellen machen:
•
Durch seine rekursive Struktur ist ein ständiges Update der Prognosen (Projektionen) der
Zinsstrukturkurve möglich, sowohl einstufig als auch mehrstufig.
•
Die rekursive Struktur des Kalman-Filters erlaubt auch in einfacher und direkter Weise
die Bestimmung der Likelihood-Funktion als Basis einer Maximum LikelihoodSchätzung.
Im ersten Teil der vorliegenden Ausarbeitung soll daher sowohl die allgemeine Systematik
des Kalman-Filters als auch dessen Anwendung auf Multifaktormodelle der Zinsstruktur dar1
2
3
4
Zu einem ersten Überblick hierzu vgl. etwa ALBRECHT/MAURER (2005, Abschnitt 9.3 und Anhang 9E).
So verwenden etwa Fischer/May/Walther (2003) in ihrer aktuellen Arbeit zur Anpassung eines eindimensionalen Cox/Ingersoll/Ross-Modells die Monatsdurchschnitte des Geldmarktsatzes für Tagesgeld am Frankfurter Bankenplatz.
Vgl. hierzu generell HAMILTON (1994, Kapitel 13) sowie HARVEY (1989, Kapitel 3).
Vgl. etwa DUAN/SIMONATO (1999), GEYER/PICHLER (1999), DE JONG (2000), BELETSKI (2003), CHEN/SCOTT
(2003) sowie FISCHER/MAY/WALTHER (2004).
2
gestellt werden, wobei die Intention nicht die größte mathematische Allgemeinheit und Kürze
ist, sondern der Focus auf einer nachvollziehbaren und verständlichen Ausarbeitung liegt.5 In
einem zweiten Teil soll dann die empirische Anwendung der hier entwickelten modelltheoretischen Grundlagen im Vordergrund stehen.
2.
Allgemeine Systematik des Kalman-Filters
2.1
Ausgangspunkt
Ausgangspunkt der Analyse ist ein zeitdiskretes (lineares) stochastisches dynamisches System, dessen Entwicklung durch den ( r,1) -Zufallsvektor X t ( t = 1,K , T ), den Zustandvektor,
beschrieben wird. Der Zustandsvektor bestimmt den Zustand, den das System zum Zeitpunkt t
einnimmt. Das Besondere hierbei ist der Umstand, dass der Zustandsvektor eine latente Variable ist (in unserer Anwendung wird dies im einfachsten Fall die Zinsintensität sein), d.h.
nicht beobachtet werden kann. Damit ist auch nicht beobachtbar, in welchem Zustand sich das
System zum jetzigen (oder früheren) Zeitpunkt(en) befindet. Allerdings existiert ein beobachtbares stochastisches dynamisches System, dessen Entwicklung durch den ( n,1) -Zufallsvektor
Yt ( t = 1,K , T ) beschrieben wird, der wiederum in einer bestimmten Weise von X t abhängig
ist und damit (beobachtbare) Informationen über X t enthält.
Generell interessiert man sich für den Zustand, den das System im nächsten Zeitpunkt (allgemeiner: in einem künftigen Zeitpunkt) annehmen wird und möchte hierfür eine Vorhersage
(Forecast) bzw. Projektion durchführen. In unserer Anwendung geht es darüber hinausgehend
darum, die Zufallsgesetzmäßigkeit der latenten Variablen {X t } zu identifizieren, da von dieser wiederum die Zufallsgesetzmäßigkeit unserer Beobachtungen (in unserer Anwendung: die
Zinsstruktur) abhängt. Unser Hauptinteresse in der Anwendung gilt der Identifikation der Zufallsgesetzmäßigkeit von {Yt } und der Gewinnung einer Projektion von Yt +s , jeweils gegeben eine Menge
{y1,K , y t }
von empirischen Beobachtungen. In der weiteren Darstellung
lehnen wir uns weitgehend an HAMILTON (1994, Kapitel 13) an.
5
In den Abschnitten 3 bzw. 4 konzentrieren wir uns dabei auf Modelle mit 1 bzw. 2 bzw. 3 Faktoren des Vasicek-Typus bzw. des Cox/Ingersoll/Ross-Typus. In Anhang A wird der allgemeine Fall dargestellt.
3
2.2
Systemgleichungen
Die Entwicklung der Zustandsvariablen wird für t ≥ 1 beschrieben durch die folgende Zustandsgleichung (state equation), das lineare System
X t +1 = f + FX t + Vt +1 .
(2.1a)
Der Zustandsprozess ist damit ein autoregressiver Prozess 1. Ordnung (AR(1)-Prozess) und
insbesondere ein Markovprozess.
Teilweise wird die Zustandsgleichung in der Literatur auch in der alternativen (äquivalenten)
Version
(2.1b)
X t +1 = f + FX t + WVt +1
notiert, vgl. etwa BELETSKI (2003, S. 22) oder FISCHER/MAY/WALTHER (2004, S. 373). Die
Varianz-/Kovarianzmatrix des Residuums hat dann die Gestalt Q* = WQW T und im Weiteren wäre jeweils Q durch Q* zu ersetzen.
Die Entwicklung der Beobachtungsgröße Yt wird für t ≥ 1 beschrieben durch die folgende
Beobachtungsgleichung (observation equation, measurement equation), das lineare System
Yt = h + HX t + ε t .
(2.2)
Die Abhängigkeit zwischen der beobachtbaren Variable und der Zustandsvariable ist damit zu
jedem Zeitpunkt linear, allerdings überlagert durch einen zufälligen Messfehler (Störterm).
Die Störterme {ε t } und {Vt } sind vom White Noise-Typus, d.h. es gilt
(2.3a)
(
)
t=τ
sonst
(
)
t=τ
.
sonst
E ( εt ) = 0 ,
⎧R
E ε t εTτ = ⎨
⎩0
E ( Vt ) = 0 ,
⎧Q
E Vt VτT = ⎨
⎩0
bzw.
(2.3b)
Die Messfehler treten somit im Zeitablauf unabhängig auf und besitzen einen Erwartungswertvektor null sowie eine Varianz-/Kovarianzmatrix R bzw. Q. Auch untereinander sind die
Störterme unkorreliert, d.h.
(2.3c)
(
)
E ε t VτT = 0
für alle t, τ .
4
Der (nicht-beobachtbare) Startwert des Systems ist X1 . Wir nehmen diesbezüglich des Weiteren an, dass die Störterme unkorreliert mit X1 sind, d.h.
( )
E (V X ) = 0
E ε t X1T = 0
(2.4a)
(2.4b)
t
T
1
für alle t
für alle t .
Ziel des Kalman-Filters ist, gegeben die Informationsmenge I t = {Yt , Yt −1 ,K , Y1} zum Zeitpunkt t, die Vorhersage von X t +1 im Sinne der besten linearen Projektion (d.h., der Minimierung des mittleren quadratischen Fehlers unter allen linearen Projektionsfunktionen a 0 + a1Y1 + K + a t Yt ). Generell notieren wir im Weiteren die beste lineare Projektion einer
Zufallsvariablen Z gegeben I t durch das Symbol Zˆ t = Eˆ ( Z | I t ) . Ẑ t ist die orthogonale Projektion von Z auf den durch {1, Y1 ,K , Yt } aufgespannten Unterraum und erfüllt die Normalen-Gleichungen ( Y0 ≡ 1 )
(
)
E ⎡ Z − Zˆ t YjT ⎤ = 0
⎣
⎦
für alle j = 0,1,K , t .
Unter Benutzung dieser Notation ist somit das Ziel des Kalman-Filters die Gewinnung der
ˆ
ˆ
Projektion X
t +1|t = E ( X t +1 | I t ) . Da die X t nicht beobachtbar sind, muss hierzu "indirekt"
unter Ausnutzung der Systemgleichungen (2.1) und (2.2) vorgegangen werden. Die besondere
Eigenschaft des Kalman-Filters ist dabei seine rekursive Struktur, d.h. die sukzessive Generieˆ ,X
ˆ ,K , die eine einfache Aktualisierung (Update) der Projektion zulässt, wenn
rung von X
1|0
2|1
neue Informationen eingegangen sind.
Mit diesen Projektionen ist jeweils eine ( r, r ) -Mean Square Error-Matrix assoziiert:
(2.5)
(
⎡
ˆ
Pt +1 = E ⎢ X t +1 − X
t +1|t
⎣
)( X t+1 − Xˆ t +1|t )
T⎤
⎥⎦ .
Wir beschreiben im Weiteren zunächst die einzelnen im Rahmen des Kalman-Filters zur Gewinnung der Projektion X̂ t +1|t durchzuführenden Schritte.
2.3
Start der Rekursion
5
Die Rekursion startet mit X̂1|0 , intuitiv der Prognose von X1 auf der Grundlage noch keiner
vorhandenen Beobachtung. X̂1|0 entspricht damit der unbedingten Erwartung
X̂1|0 = E ( X1 )
(2.6a)
mit assoziierter MSE-Matrix
(2.6b)
T
P1 = E ⎡( X1 − E ( X1 ) ) ( X1 − E ( X1 ) ) ⎤ = Σ ,
⎢⎣
⎥⎦
die mithin der Varianz-/Kovarianzmatrix Σ = Cov ( X1 ) von X1 entspricht.
Geht man von der Standardannahme aus, dass {X t } eine stationäre Folge von Zufallsvektoren ist, so sind die folgenden Gleichungen gültig, vgl. etwa HAMILTON (1994, S. 378), deren
Lösung auf E ( X1 ) bzw. Σ führt:
(2.7a)
( E − F ) E ( X1 ) = f
(2.7b)
Σ = FΣFT + Q .
Dabei ist E die ( r, r ) -Einheitsmatrix.
In Abschnitt 3.1 werden wir jedoch noch einen alternativen Ansatzpunkt darstellen, um
E ( X1 ) bzw. Σ zu gewinnen.
Nachdem der Startwert der Rekursion somit feststeht, dokumentieren wir im Weiteren die für
den Schritt von t − 1 nach t durchzuführenden Einzelprojektionen.
2.4
Projektion von Yt
ˆ
Gegeben ist X̂ t|t −1 und es gilt in diesem Kontext Eˆ ( X t | I t −1 ) = X
t|t −1 . Gesucht wird nun die
beste lineare Projektion von Yt auf der Basis der Informationsmenge I t −1. Aufgrund von (2.2)
gilt nun
(2.8a)
ˆ
ˆ
ˆ
Y
t|t −1 = E ( Yt | I t −1 ) = h + HX t|t −1 .
Die zugehörige MSE-Matrix M t ist dann gegeben durch
6
(
2.5
)(
⎡
ˆ
ˆ
M t := E ⎢ Yt − Y
t|t −1 Yt − Yt|t −1
⎣
(2.8b)
)
T⎤
T
⎥⎦ = HPt H + R .
Aktualisierung von Xt
Kommt nun noch die Beobachtung Yt hinzu, d.h. ist die Informationsmenge geben durch I t ,
so können wir den Prognosewert für X t aktualisieren und notieren diesen aktualisierten Wert
durch X̂ t|t . Es gilt dann:
T −1 ⎡
ˆ := Eˆ ( X | I ) = X
ˆ
ˆ
⎤
X
t|t
t t
t|t −1 + Pt H M t ⎣ Yt − h − HX t|t −1 ⎦ .
(2.9a)
X̂ t|t wird auch als (auf Basis der Beobachtungen) gefilterter Schätzer für X t bezeichnet. Für
die zugehörige ( r, r ) -MSE-Matrix N t gilt entsprechend
(
⎡
ˆ
N t := E ⎢ X t − X
t|t
⎣
(2.9b)
2.6
)( X t − Xˆ t|t )
T⎤
T −1
⎥⎦ = Pt − Pt H M t HPt .
Projektion von Xt+1
Damit sind wir nun in der Lage, das Ziel der Prozedur, die Gewinnung der Projektion
von X t +1 , gegeben die Beobachtungen {Y1 ,K , Yt } , d.h. der Informationsmenge I t , zu erreichen. Generell gilt
ˆ
ˆ
X
t +1|t = f + FX t|t .
(2.10a)
Hieraus folgt nun aus (2.9a)
(2.10b)
(
)
ˆ
ˆ
ˆ
X
t +1|t = f + FX t|t −1 + K t Yt − h − HX t|t −1 .
Dabei bezeichnet die ( r, n ) -Matrix K t die sogenannte Kalman Gain-Matrix und es gilt
(2.10c)
K t = FPt H T M −t 1 .
Die Kalman Gain-Matrix spezifiziert, welches Gewicht dem aktuellen Vorhersagefehler gegeben werden soll. Für die MSE-Matrix Pt +1 gilt dann die Rekursionsgleichung
(2.10d)
Pt +1 = FN t FT + Q = F ⎡ Pt − Pt H T M −t 1HPt ⎤ FT + Q .
⎣
⎦
7
Die Projektion von Yt +1 gegeben die Beobachtungsmenge {Y1 ,K , Yt } lautet entsprechend zu
(2.8a)
ˆ
ˆ
Y
t +1|t = h + HX t +1|t .
(2.11)
2.7
Zusammenfassung der Rekursion
Die Rekursion startet mit den unbedingten ersten beiden Momenten X1|0 = E ( X1 ) und
P1 = Cov ( X1 ) von X1 . Die Rekursion für die Projektion der Zustandsvariablen ist dann insge-
samt gegeben durch (2.10), d.h.
(2.12a)
(
T −1
ˆ
ˆ
ˆ
X
t +1|t = f + FX t|t −1 + FPt H M t Yt − h − HX t|t −1
)
sowie
Pt +1 = F ⎡ Pt − Pt H T M −t 1HPt ⎤ FT + Q .
⎣
⎦
(2.12b)
2.8
Maximum Likelihood-Schätzung
Die Projektionen X̂ t|t −1 bzw. Ŷt|t −1 sind per Konstruktion die besten linearen Projektionen für
X t bzw. Yt gegeben die Beobachtungsmenge I t −1 = {Y1 ,K , Yt −1} .
Nimmt man darüber hinaus für X1 sowie die Störterme {ε t , Vt ; t = 1,K , T} eine multivariate
Normalverteilung an, so liegt sogar die beste Projektion unter allen messbaren Funktionen
von Y1,K , Yt −1 vor. Im betrachteten Fall ist auch Yt bedingt auf die Informationsmenge I t −1
multivariat normalverteilt und es gilt
(2.13a)
Yt | I t −1 ~ N n ( μ t , Σ t )
wobei gemäß (2.8) gilt
(2.13b)
ˆ
μ t = E ( Yt | I t −1 ) = h + HX
t|t −1
(2.13c)
Σ t = Cov ( Yt | I t −1 ) = M t = HPt H T + R .
Für den Logarithmus der bedingten Dichte gilt damit ( t = 1,K , T )
8
ln f Yt |I t −1 ( y t ) = −
(2.14a)
{
}
1
T
n ln ( 2π ) + ln ⎡⎣det ( Σ t ) ⎤⎦ + ( y t − μ t ) Σ −t 1 ( y t − μ t ) .
2
Da n ln ( 2π ) nur ein additiver Niveauterm bzw. 1 2 ein multiplikativer Niveauterm ist, und
beide keinen Einfluss auf die Lage des Optimums besitzen, reduziert sich (2.14a) auf
{
}
ln f Yt |I t −1 ( y t ) = − ln ⎡⎣det ( Σ t ) ⎤⎦ + ( y t − μ t ) Σ −t 1 ( y t − μ t ) .
(2.14b)
T
Numerisch aufwendig bei der Auswertung von (2.14) ist dabei insbesondere die Invertierung
der ( n, n ) -Matrix Σ t = M t und die Berechnung ihrer Determinante. Da n in der Regel deutlich größer als r ist, empfiehlt es sich, die folgenden Berechnungsformeln – vgl. LUND (1997,
S. 6), HARVEY (1989, S. 108) – zu verwenden, um die Auswertungseffizienz zu erhöhen:
Σ −t 1 = R −1 − R −1H ⎡ Pt−1 + H T R −1H ⎤
⎣
⎦
(2.15a)
−1
H T R −1
(
)
det ( Σ t ) = det ( R ) ⋅ det ( Pt ) ⋅ det Pt−1 + H T R −1H .
(2.15b)
Bei Vorliegen einer Menge { y1 ,K , yT } von Beobachtungen ergibt sich aufgrund der generellen Faktorisierung f Y1 ,K,YT = f Y1 ⋅ f Y2 |Y1 ⋅K ⋅ f YT |YT −1 ,K,Y1 die Log-Likelihood-Funktion zu
T
Lθ ( y1 ,K , yT ) = ∑ ln f Yt |I t −1 ( y t )
t =1
(2.16)
T
{
}
= − ∑ ln ⎡⎣det ( Σ t ) ⎤⎦ + ( y t − μ t ) Σ −t 1 ( y t − μ t ) ,
t =1
T
wobei θ den Vektor der offenen Parameter (in den Systemmatrizen) bezeichne. Zur Schätzung von θ ist Lθ ( y1 ,K , yT ) numerisch zu optimieren. Damit werden Algorithmen zur numerischen Optimierung relevant für die Maximum Likelihood-Schätzung. In der Literatur
wird ferner ausgeführt, dass hierfür insbesondere der EM-Algorithmus geeignet ist.
2.9
Mehrstufige Projektion
Neben der Gewinnung einer Projektion Ŷt +1|t von Yt +1 gegeben die Informationsmenge
{Y1,K , Yt }
sind wir darüber hinausgehend interessiert an der Gewinnung einer Projekti-
on Yt +s|t . Dies gelingt wie folgt, zur Vorgehensweise vgl. HAMILTON (1994, S. 384 f.).
Aufgrund von (2.1a) erhalten wir durch Auflösung der Rekursion den Zusammenhang
9
(
)
X t +s = E + F + F2 + K + Fs−1 f + Fs X t + Fs−1Vt +1 + Fs− 2 Vt + 2 + K + FVt +s−1 + Vt +s .
Hieraus ergibt sich
ˆ
ˆ
X
t +s|t = E ( X t +s | I t )
(2.17)
(
)
ˆ .
= E + F + K + Fs−1 f + Fs X
t|t
Dies ist die Verallgemeinerung der Beziehung (2.10a).
Die entsprechende Projektion für Yt +s lautet dann
ˆ
ˆ
Y
t +s|t = h + HX t +s|t .
(2.18)
Der Kalman-Filter ermöglicht damit eine Alternative zur üblichen Vorgehensweise, zunächst
die aktuelle Zinsstruktur (möglichst perfekt6) zu identifizieren und dann die weitere Prozessentwicklung auf der Basis einer Monte Carlo-Simulation zu generieren7.
3.
Zinsstrukturmodelle des Vasicek-Typus
3.1
Vorüberlegungen zur Gewinnung der Zustandsgleichung
Unter Ausnutzung der Eigenschaften der bedingten Erwartung lässt sich die folgende generelle Darstellung von X t +1 nachweisen, man vgl. etwa DUAN/SIMONATO (1999),
X t +1 = E ( X t +1 | X t ) + Vt*+1 ,
(3.1a)
wobei
( )
( )
E Vt*+1 = 0 , Cov Vt*+1 = Cov ( X t +1 | X t ) .
(3.1b)
Diese generelle Darstellung gilt zunächst für eine beliebige Folge {X t } von Zufallsgrößen. In
äquivalenter Form lautet sie
X t +1 = E ( X t +1 | X t ) + Cov ( X t +1 | X t )
12
(3.2)
wobei
Zt +1 ~ N ( 0, E )
Cov ( X t +1 | X t )
12
6
7
Z t +1 ,
ein multivariat standardnomalverteilter Zufallsvektor ist und
die Cholesky-Zerlegung der positiv definiten Matrix Cov ( X t +1 | X t ) .
Vgl. hierzu etwa ALBRECHT/MAURER (2005, S. 473 f.).
Die im Wege der Simulation ermittelte weitere Prozessentwicklung besitzt zudem nicht die Optimalitätseigenschaften einer (linearen) Prozessprojektion.
10
Unter
Zugrundelegung
der
Zustandsgleichung
(2.1a)
gilt
ferner
E ( X t +1 | X t ) = E ( f + X t + Vt +1 | X t ) = E ( f + X t | X t ) + E ( Vt +1 | X t ) = f + FX t . Dabei nutzen
wir die generelle Eigenschaft E ⎡⎣ h ( X ) | X ⎤⎦ = h ( X ) der bedingten Erwartung, und, dass Vt +1
unkorreliert ist mit X t , vgl. zu Letzterem etwa HAMILTON (1994, S. 373).
Wir halten somit fest, dass bei Gültigkeit von (2.1a)
(3.3)
E ( X t +1 | X t ) = f + FX t
( )
gilt. Für die Residualvariable Vt*+1 gilt bereits E Vt*+1 = 0 , damit liegt gemäß (3.1b) insgesamt der White Noise-Fall vor, wenn Cov ( X t +1 | X t ) eine deterministische Matrix ist. In diesem Falle sind Vt*+1 gemäß (3.1a) und Vt +1 gemäß (2.1a) offenbar identisch, d.h. (3.1a) ist
eine äquivalente Darstellung der Zustandsgleichung (2.1a).
Allerdings ist Cov ( X t +1 | X t ) nicht generell eine deterministische Matrix, dies gilt nur in
Spezialfällen. Ein zentraler Spezialfall ist der Gauß-Fall, d.h. X1 und die Residuen Vt* (und
damit alle X t ) sind jeweils multivariat normalverteilt. Im Gauß-Fall ist somit (3.1a) eine äquivalente Darstellung von (2.1a) und (3.1a) kann als Ansatzpunkt genommen werden, um die
Zustandsgleichung zu spezifizieren.
Die in diesem Abschnitt betrachteten Zinsstrukturmodelle vom Vasicek-Typus sind jeweils
unter den Gauß-Fall subsumierbar, so dass auf dieser Grundlage die Zustandsgleichung in
einfacher Form abgeleitet werden kann. Die im nächsten Abschnitt betrachteten Zinsstrukturmodelle vom Cox/Ingersoll/Ross-Typus sind hingegen nicht mehr unter den Gauß-Fall
subsumierbar und in der Tat ist dann Cov ( X t +1 | X t ) stochastisch, so dass eine alternative
Vorgehensweise gefunden werden muss, auf die wir zurückkommen werden.
Im Gauß-Fall eröffnet sich darüber hinaus ein einfacher Weg zur Identifikation der Startwerte
E ( X1 ) bzw. Cov ( X1 ) . Aus (3.1a) folgt mit (3.3) zunächst E ( X t +1 ) = E ⎡⎣ E ( X t +1 | X t ) ⎤⎦
= E ( f + FX t ) = f + FE ( X t ) . Unter der Annahme der Stationarität folgt hieraus insgesamt
(3.4a)
( E − F) E ( X t ) = f .
11
Dies entspricht der Gleichung (2.7a). Weiter gilt
Cov ( X t +1 ) = E ⎡⎣Cov ( X t +1 | X t ) ⎤⎦
+ Cov ⎡⎣ E ( X t +1 | X t ) ⎤⎦ = E ⎡⎣Cov ( X t +1 | X t ) ⎤⎦ + FCov ( X t ) . Aus der Annahme der Stationarität
folgt hieraus die Gleichung
( E − F ) Cov ( X t ) = E ⎡⎣Cov ( X t +1 | X t )⎤⎦ .
(3.4b)
Die Gleichungen (3.4a) und (3.4b) werden in Anhang B benutzt, um die Startwerte der Kalman-Rekursion zu bestimmen.
3.2
Einfaktormodell von Vasicek
Das Einfaktormodell von Vasicek beruht8 auf der Annahme eines Ornstein/UhlenbeckProzesses für die Entwicklung der Zinsintensität {R t } , üblicherweise geschrieben als stochastische Differentialgleichung der Form
(3.5)
dR t = α ( μ − R t ) dt + σdWt .
Dabei gilt μ = μ P , d.h. der Prozess (3.5) wird im Weiteren unter dem physischen (beobachtbaren) Wahrscheinlichkeitsmaß P spezifiziert, nicht unter der risikoneutralen Wahrscheinlichkeitsbelegung. Zur Gewinnung der Zustandsgleichung knüpfen wir an deren äquivalenter allgemeiner Form (3.1) an und benutzen die Ergebnisse in ALBRECHT/MAURER (2005, S. 168)
für E ( R t | R s ) bzw. Var ( R t | R s ) . Wir erhalten hieraus9
(3.6a)
(
)
E ( R t +1 | R t ) = μ 1 − e −α + e −α R t
sowie
(3.6b)
Var ( R t +1 | R t ) =
(
)
σ2
1 − e−2α .
2α
Die standardisierte Form (2.1a) der Zustandsgleichung ergibt sich damit im vorliegenden
Spezialfall zu
(3.7a)
R t +1 = f + FR t + Vt +1 ,
wobei
(3.7b)
(3.7c)
8
9
(
f = μ 1 − e−α
F = e−α .
Vgl. etwa ALBRECHT/MAURER (2005, S. 167 ff.).
Vgl. auch Anhang B.1.
)
12
Die Varianz-/Kovarianzmatrix Q aus (2.3b) reduziert sich im eindimensionalen Fall
auf Var ( Vt +1 ) = Var ( R t +1 | R t ) , d.h.
Q=
(3.7d)
(
σ2 1 − e −2α
2α
).
Die beobachteten Zufallsvektoren Yt entsprechen im Anwendungsfall von Zinsstrukturmodellen den Spot Rates
R ( t, t + τi )
zum Zeitpunkt t für ausgewählte Restlaufzei-
ten 0 < τ1 < K < τn , d.h. den internen Zinsfüßen der entsprechenden Einheitszerobonds. Nach
dem Vasicek-Zinsstrukturmodell gilt zunächst allgemein:10, 11
(3.8a)
1
1
R ( t, t + τ ) = − A ( τ ) − B ( τ ) R t ,
τ
τ
wobei
(3.8b)
e −ατ − 1
,
B ( τ) =
α
(3.8c)
σ2
2
A ( τi ) = −q ⎡⎣ B ( τ ) + τ ⎤⎦ −
B ( τ) ,
4α
(3.8d)
Der Term μ +
q =μ+
λσ σ2
.
−
α 2α 2
λσ
, wobei λ den "Marktpreis des Risikos" bezeichne, entspricht dabei der
α
Drift des Prozesses (3.2) unter der risikoneutralen Wahrscheinlichkeitsbelegung12, 13.
In Vektorform gilt somit Yt = ( R t1 ,K , R tn ) , wobei R ti = R ( t, t + τi ) . Da bei einer empiriT
schen Identifikation üblicherweise die Anzahl der Beobachtungen (deutlich) größer als die
Anzahl der Parameter ist, wird eine exakte empirische Erfüllung von (3.8a) nicht möglich
sein, d.h. die theoretische Zinsstrukturkurve kann die Datenlage nicht vollständig erklären.
10
11
Vgl. etwa ALBRECHT/MAURER (2005, S. 490).
Die Darstellung der Spot Rates gemäß (3.8d) beruht auf der Spezifikation B ( t, t + τ ) = exp ⎡⎣ A ( τ ) + B ( τ ) R t ⎤⎦
der Zerobondpreise einer affinen Zinsstruktur. Daneben sind in der Literatur auch die Spezifikationen
B ( t, t + τ ) = exp ⎡⎣ A ( τ ) − B ( τ ) R t ⎤⎦ sowie B ( t, t + τ ) = exp ⎡⎣ − A ( τ ) − B ( τ ) R t ⎤⎦ zu finden.
12
13
Vgl. allgemein in Anhang A.2.
Dabei wurde, im Unterschied etwa zu KWOK (1998, S. 323) der überwiegenden Vorgehensweise in der Literatur gefolgt, vgl. etwa BELETSKI (2003, S. 87), und λ durch −λ ersetzt. Dies sichert eine positive Risikoprämie bei positivem λ .
13
Für die empirische Identifizierung ist es daher vorteilhaft, von einer gestörten (mit Messfehlern beobachteten) Version von (3.8a) auszugehen, nämlich
R ( t, t + τi ) = −
(3.8d)
1
1
A ( τi ) − B ( τi ) R t + ε ti .
τi
τi
Dies ist die "statistische" Modellversion der Zinsstrukturkurve (3.8a). In Vektor-/Matrixform
ergibt sich daher
⎛ R ( t, t + τ1 ) ⎞ ⎛ − A ( τ1 ) τ1 ⎞ ⎛ − B ( τ1 ) τ1 ⎞
⎛ ε t1 ⎞
⎜
⎟ ⎜
⎟ ⎜
⎟
⎜ ⎟
M
M
M
⎜
⎟=⎜
⎟+⎜
⎟ Rt + ⎜ M ⎟
⎜ε ⎟
⎜ R ( t, t + τ ) ⎟ ⎜ − A ( τ ) τ ⎟ ⎜ − B ( τ ) τ ⎟
n ⎠ ⎝
n
n⎠ ⎝
n
n⎠
⎝ tn ⎠
⎝
(3.9a)
bzw. in kompakter Form
Yt = h + HR t + ε t ,
(3.9b)
d.h.
es
gilt h = ( −A ( τ1 ) τ1 ,K , − A ( τn ) τn ) ,
T
H = ( − B ( τ1 ) τ1 ,K , − B ( τn ) τn )
T
so-
wie ε t = ( ε t1 ,K , ε tn ) . Damit ist auch die Beobachtungsgleichung gemäß Abschnitt 2 in ihrer
T
standardisierten Form festgelegt. Offen ist nur noch die Spezifikation der Varianz/Kovarianzmatrix der Störterme, d.h. R = Cov ( ε ) . In der Literatur zur Anwendung des Kalman-Filters auf die Identifikation von Zinsstrukturmodellen werden hierzu unterschiedliche
Spezifikationen vorgeschlagen. Die einfachste Variante ist14
(3.10a)
R = σε2 E n ,
wobei E n die ( n, n ) -Einheitsmatrix bezeichne. Die Messfehler haben hier eine identische
Varianz für alle Laufzeiten und sind untereinander unkorreliert (cross-sectionally uncorrelated). Eine Alternative wäre15
(3.10b)
R = DE n ,
wobei D = diag ( d1 ,K , d n ) eine Diagonalmatrix mit d i = Var ( εi ) ist. Die Messfehler wären
dann nach wie vor untereinander unkorreliert.
Ein solcher Ansatz ist allerdings nicht invariant gegenüber linearen Datentransformationen.
DE JONG (2000) empfiehlt daher die Spezifikation
(3.10c)
14
15
R = LDLT .
Vgl. zu einer entsprechenden Spezifikation etwa JEGADEESH/PENNACCHI (1996, S. 432), LUND (1997, S. 18)
sowie (in einem Cox/Ingersoll/Ross-Kontext) FISCHER/MAY/WALTHER (2004, S. 378).
Zu einer entsprechenden Vorgehensweise vgl. BABBS/NOWMAN (1999, S. 124), BELETSKI (2003, S. 69) und
DUAN/SIMONATO (1999).
14
Dabei ist D = diag ( d1 ,K , d n ) eine Diagonalmatrix (die d i entsprechen den Eigenwerten von
R) und L ist eine untere Dreiecksmatrix der Form
⎛ 1
⎜
⎜ l21
L = ⎜ l31
⎜
⎜ M
⎜l
⎝ n1
(3.10d)
1
l32
M
0
1
O
ln2
lnn −1
⎞
⎟
⎟
⎟.
⎟
⎟
1 ⎟⎠
Durch diese Parametrisierung wird insbesondere gewährleistet, dass R positiv definit ist.
In den folgenden Auswertungen beschränken wir uns allerdings zur Reduktion der traktablen
Parameteranzahl auf die Variante (3.10a), um die Probleme bei der praktischen Implementierung des Modells zu verringern. Zur Durchführung der Rekursionen des Kalman-Filters geˆ und P festzulegen. Gemäß den
mäß Abschnitt 2 sind nun nur noch die Startwerte Rˆ 1|0 = X
1|0
1
Ausführungen in Abschnitt 2.3 gilt R1|0 = E ( R1 ) und P1 = Var ( R1 ) . Auf der Basis der Überlegungen in Abschnitt 3.1 ergeben sich die Startwerte – man vgl. hierzu Anhang B.1 – zu
R̂1|0 = μ
(3.11a)
und
P1 =
(3.11b)
σ2
.
2α
ˆ
Auf dieser Grundlage können die linearen Projektionen Rˆ t +1|t = X
t +1|t des Kalman-Filters
gemäß (2.12a) sowie die damit assoziierten MSE-Matrizen Pt +1 gemäß (2.12b) berechnet
werden. Der Parametervektor, bezüglich dessen die Likelihood-Funktion (2.16) gemäß Abschnitt 2.8 zu maximieren ist, lautet θ = ( μ, α, σ, λ, σε ) , es sind damit fünf Parameter zu
bestimmen.
Darüber hinaus können, gegeben eine Zinsstrukturgeschichte {Y1 ,K , Yt } eine einstufige Projektion Ŷt +1|t gemäß (2.11) sowie mehrstufige Projektionen Ŷt +s|t gemäß (2.18) der Zinsstrukturkurve vorgenommen werden.
3.3
Zweifaktormodell des Vasicek-Typus
15
Wir gehen aus von dem folgenden Modellansatz für die Zinsintensität ( r0 ∈ IR ):
R t = r0 + X1 ( t ) + X 2 ( t ) .
(3.12a)
Die Zinsintensität ergibt sich damit als lineare Funktion der Faktoren X1 ( t ) und X 2 ( t ) , wobei X t = ( X1 ( t ) , X 2 ( t ) )
T
ein zweidimensionaler Ornstein/Uhlenbeck-Prozess mit der fol-
genden P-Dynamik ist:
dX t = −αX t dt + CdWt .
(3.12b)
Wt = ( W1 ( t ) , W2 ( t ) ) ist dabei ein zweidimensionaler Standard-Wienerprozess, insbesondere
T
sind W1 ( t ) und W2 ( t ) unabhängige Prozesse. Weiter gilt
(3.12c)
⎛α
α=⎜ 1
⎝0
0 ⎞
⎟
α2 ⎠
und
(3.12d)
⎛ σ1
C=⎜
⎜ ρσ
⎝ 2
⎞
⎟.
1 − ρ2 σ2 ⎟⎠
0
Dabei ist C die Cholesky-Zerlegung der Varianz-/Kovarianzmatrix
⎛ σ2
Σ=⎜ 1
⎜ ρσ σ
⎝ 1 2
ρσ1σ2 ⎞
⎟,
σ22 ⎟⎠
d.h. Σ = CCT . Diese Spezifikation16 führt zu einer Korrelation der beiden Faktoren X1 ( t ) und
X 2 ( t ) . Im Fall ρ = 0 führt dies zu unabhängigen Faktoren und damit zu einer direkten Ver-
allgemeinerung der Ergebnisse des Abschnitts 3.1. BELETSKI (2003) kommt aufgrund seiner
empirischen Analyse allerdings zum Schluss, dass im Kontext von Zweifaktormodellen des
Vasicek-Typus Modelle mit unabhängigen Faktoren den empirischen Daten (Varianz- und
Korrelationsstruktur) nicht hinreichend entsprechen. Auch DE JONG (2000, S. 308) konstatiert
eine signifikante Korrelation zwischen den Faktoren. Daher ist die allgemeine Faktorstruktur
(3.12) vorzuziehen. Die Einzelgleichungen der Faktoren lauten dann:
(3.13a)
dX1 ( t ) = −α1X1 ( t ) dt + σ1dW1 ( t )
(3.13b)
dX 2 ( t ) = −α 2 X 2 ( t ) dt + ρσ 2dW1 ( t ) + 1 − ρ2 σ 2dW2 ( t )
bzw.
16
Zur grundsätzlichen Konstruktion (allerdings im Kontext der geometrischen Brownschen Bewegung) vgl.
etwa ALBRECHT/MAURER (2005, S. 184 f.).
16
dX 2 ( t ) = −α 2 X 2 ( t ) dt + σ2dW1* ( t ) ,
(3.13c)
wobei W1* ( t ) = ρW1 ( t ) + 1 − ρ2 W2 ( t ) wiederum ein Standard-Wienerprozess ist, allerdings
nun korreliert mit W1 ( t ) .
Im Unterschied zur Spezifikation (3.2) fällt dabei auf, dass in (3.13) die beiden Prozesse jeweils ein Mean Reversion-Niveau von null besitzen. Dies liegt an der linearen Struktur von
(3.12a). Solange r0 nicht restringiert wird, kann die Summe der Langfristmittel von X1 ( t )
und X 2 ( t ) auf den Parameter r0 reduziert werden17. Der Parameter r0 entspricht dann dem
Langfristmittel bzw. dem Mean Reversion-Niveau der Zinsintensität R t .
Die Zustandsgleichung für die Entwicklung des Vektors X t lässt sich nun auf der Basis von
(3.1) ableiten. Es gilt zunächst18:
(3.14a)
⎛ e −α1
E ( X t +1 | X t ) = ⎜
⎜ 0
⎝
0 ⎞
⎟ Xt
e −α 2 ⎟⎠
⎛ e −α1 X1 ( t ) ⎞
⎟
=⎜
⎜ e −α 2 X ( t ) ⎟
2
⎝
⎠
Q := Cov ( X t +1 | X t )
(3.14b)
⎛
σ12
1 − e −2α1
⎜
2α1
= ⎜⎜
⎜ ρσ1σ2 1 − e−( α1 +α 2 )
⎜α +α
2
⎝ 1
(
(
)
(
)
)
⎞
ρσ1σ2
− α +α
1− e ( 1 2 ) ⎟
α1 + α 2
⎟
⎟.
2
σ2
−2α 2
⎟
1− e
⎟
2α 2
⎠
(
)
Die Zustandsgleichung lautet somit
(3.15a)
⎛ X1 ( t + 1) ⎞ ⎛ e −α1 X1 ( t ) ⎞
⎟ + Vt +1
⎜
⎟ = ⎜ −α
⎜
⎟
2
+
X
t
1
(
)
e
X
t
2
(
)
⎝
⎠ ⎝
2
⎠
mit
(3.15b)
Cov ( Vt +1 ) = Q .
Für den Start der Rekursion werden die unbedingten Momente E ( X1 ) und Cov ( X1 ) benötigt. Aus Anhang B.2 ergibt sich19,
17
18
19
Vgl. hierzu BELETSKI (2003, S. 58).
Man vgl. hierzu BELETSKI (2003, S. 66), DE JONG (2000, S. 312) und beachte die Normierung μ = 0 .
Vgl. auch DE JONG (2000, S. 312).
17
⎛ 0⎞
X1|0 = E ( X1 ) = ⎜ ⎟
⎝ 0⎠
(3.16a)
⎛ σ12
⎜
2α1
⎜
P1 = Cov ( X1 ) = ⎜
⎜ ρσ1σ2
⎜α +α
2
⎝ 1
(3.16b)
ρσ1σ2 ⎞
⎟
α1 + α 2 ⎟
⎟.
σ22 ⎟
2α 2 ⎟⎠
Kommen wir damit zur Beobachtungsgleichung. Generell gilt hier
⎛ R ( t, t + τ1 ) ⎞ ⎛ −A ( τ1 ) τ1 ⎞ ⎛ − B1 ( τ1 ) τ1
⎜
⎟ ⎜
⎟ ⎜
(3.17a) ⎜
M
M
M
⎟=⎜
⎟+⎜
⎜ R ( t, t + τ ) ⎟ ⎜ − A ( τ ) τ ⎟ ⎜ − B ( τ ) τ
n ⎠ ⎝
n
n⎠ ⎝
1 n
n
⎝
− B2 ( τ1 ) τ1 ⎞
⎛ ε t1 ⎞
⎟ ⎛ X1 ( t ) ⎞ ⎜ ⎟
M
⎟ ⎜ X (t)⎟ + ⎜ M ⎟
− B2 ( τ n ) τ n ⎠⎟ ⎝ 2 ⎠ ⎝⎜ ε tn ⎠⎟
bzw. in kompakter Form
Yt = h + HX t + ε t .
(3.17b)
Weiter gilt20:
B ( τ ) = ( B1 ( τ ) , B2 ( τ ) )
(3.18)
(ρλ +
=−
1
q2
(3.19b)
(3.19d)
⎛ e −α1τ − 1 e−α 2τ − 1 ⎞
=⎜
,
⎟⎟
⎜ α
α
1
2
⎝
⎠
T
λ1σ1 σ12
−
q1 = −
α1 2α12
(3.19a)
(3.19c)
T
Aρ ( τ ) =
ρσ1σ2
α1 + α 2
)
1 − ρ2 λ 2 σ 2
α2
−
σ22
2α 22
⎡1
⎤
1
B2 ( τ ) + τ ) − B1 ( τ ) B2 ( τ ) ⎥
(
⎢ ( B1 ( τ ) + τ ) +
α2
⎣ α1
⎦
2 ⎧
σ2
⎪
⎪
2⎫
A ( τ ) = ∑ ⎨−qi ⎣⎡ Bi ( τ ) + τ ⎦⎤ − i Bi ( τ ) ⎬ − r0 τ + Aρ ( τ ) .
4αi
i =1 ⎩
⎪
⎭⎪
Bei der Spezifikation von R = Cov ( ε ) gehen wir unverändert von (3.10a) aus. Damit sind die
Ausgangsdaten zur Anwendung der Kalman-Filter-Prozedur sämtlich festgelegt. Der Parametervektor bezüglich dessen die Likelihood-Funktion (2.16) gemäß Abschnitt 2.8 zu maximieren ist, lautet hierbei θ = ( r0 , α1 , α 2 , σ1 , σ 2 , ρ, λ1 , λ 2 , σε ) , es sind damit neun Parameter zu
bestimmen.
20
Vgl. BELETSKI 2003, S. 57.
18
3.4
Dreifaktormodell des Vasicek-Typus
Die Zinsintensität sei gegeben durch
R t = r0 + X1 ( t ) + X 2 ( t ) + X3 ( t ) .
(3.20a)
Dabei ist X ( t ) = ( X1 ( t ) , X 2 ( t ) , X3 ( t ) )
T
ein dreidimensionaler Ornstein/Uhlenbeck-Prozess
mit der P-Dynamik
dX t = −αX t dt + CdWt .
(3.20b)
Dabei ist W ( t ) = ( W1 ( t ) , W2 ( t ) , W3 ( t ) )
T
ein dreidimensionaler Standard-Wienerprozess.
Weiter gilt:
⎛ α1
⎜
α=⎜ 0
⎜
⎝0
(3.20c)
0
α2
0
0⎞
⎟
0⎟
α3 ⎠⎟
sowie
(3.20d)
⎛ σ1
⎜
C = ⎜ σ2ρ12
⎜
⎜
⎜ σ3ρ13
⎜
⎝
0
0
2
σ2 1 − ρ12
0
σ3
ρ23 − ρ12ρ13
2
1 − ρ12
σ3
2
2
1 − ρ12
− ρ13
− ρ223 + 2ρ12ρ13ρ23
2
1 − ρ12
⎞
⎟
⎟.
⎟
⎟
⎟
⎟
⎠
Dabei ist wiederum C eine Cholesky-Zerlegung, hier der Varianz-/Kovarianz-Matrix Σ mit
⎛ σ12
⎜
Σ = ⎜ ρ12σ1σ2
⎜
⎜ ρ13σ1σ3
⎝
ρ12σ1σ2
σ22
ρ23σ2σ3
ρ13σ1σ3 ⎞
⎟
ρ23σ 2σ3 ⎟ .
⎟
σ32 ⎟
⎠
Wie im Falle n = 2 wurde ferner die Normierung μ = 0 gewählt.
Die Zustandsgleichung lässt sich nun wiederum auf der Basis von (3.1) ableiten. In Verallgemeinerung von (3.14a) gilt zunächst:
(3.21a)
⎛ e −α1 X1 ( t ) ⎞
⎜
⎟
E ( X t +1 | X t ) = ⎜ e −α 2 X 2 ( t ) ⎟
⎜ −α
⎟
⎜ e 3 X3 ( t ) ⎟
⎝
⎠
In Verallgemeinerung von (3.14b) gilt des Weiteren
19
Q := Cov ( X t +1 | X t ) = q ij
(3.21b)
mit ( ρii = 1 für i = 1, 2,3 )
q ij =
(3.21c)
ρijσi σ j ⎡
−( α +α )
1 − e i j ⎤⎥ .
⎢
αi + α j ⎣
⎦
Die Zustandsgleichung lautet somit
−α1
⎛ X1 ( t + 1) ⎞ ⎜⎛ e X1 ( t ) ⎟⎞
⎜
⎟
−α 2
⎜ X 2 ( t + 1) ⎟ = ⎜ e X 2 ( t ) ⎟ + Vt +1
⎟
⎜ X ( t + 1) ⎟ ⎜⎜ −α3
⎝ 3
⎠ ⎝ e X3 ( t ) ⎟⎠
(3.22a)
mit
Cov ( Vt +1 ) = Q .
(3.22b)
Für den Start der Rekursion ergibt sich in Verallgemeinerung von (3.16):
(3.23a)
X1|0
⎛ 0⎞
⎜ ⎟
= E ( X1 ) = ⎜ 0 ⎟
⎜ 0⎟
⎝ ⎠
P1 = Cov ( X1 ) = Cov ( X1 )ij
(3.23b)
mit ( ρii = 1 für i = 1, 2,3 )
Cov ( X1 )ij =
(3.23c)
ρijσi σ j
αi + α j
.
Kommen wir damit zur Beobachtungsgleichung. Generell gilt hier
(3.24a)
⎛ R ( t, t + τ1 ) ⎞ ⎛ −A ( τ1 ) τ1 ⎞
⎜
⎟ ⎜
⎟
M
M
⎜
⎟=⎜
⎟
⎜ R ( t, t + τ ) ⎟ ⎜ − A ( τ ) τ ⎟
n ⎠ ⎝
n
n⎠
⎝
⎛ −B1 ( τ1 ) τ1
⎜
+⎜
M
⎜ −B ( τ ) τ
⎝ 1 n n
− B2 ( τ1 ) τ1
M
− B2 ( τ n ) τ n
− B3 ( τ1 ) τ1 ⎞ ⎛ X1 ( t ) ⎞ ⎛ ε t1 ⎞
⎟⎜
⎟ ⎜ ⎟
M
⎟ ⎜ X2 ( t ) ⎟ + ⎜ M ⎟
− B3 ( τn ) τn ⎠⎟ ⎝⎜ X3 ( t ) ⎠⎟ ⎝⎜ ε tn ⎠⎟
bzw. in kompakter Form
(3.24b)
Yt = h + HX t + ε t .
Für die beteiligten Funktionen gilt nun21 ( i = 1, 2,3, ρii = 1 für i = 1, 2,3 ),
21
Vgl. hierzu BELETSKI (2003, S. 59; Appendix 1) sowie Anhang A.2.
20
e−αi τ − 1
Bi ( τ ) =
αi
(3.25a)
(3.25b)
Aij ( τ ) =
⎫
ρijσi σ j ⎪⎧ 1
1
⎡ B j ( τ ) + τ ⎤ − Bi ( τ ) B j ( τ ) ⎪⎬ ,
⎨ ⎡⎣ Bi ( τ ) + τ ⎤⎦ +
⎣
⎦
αi + α j ⎪⎩ αi
αj
⎪⎭
für 1 ≤ i, j ≤ 3
(3.25c)
A ( τ ) = −λ T CT α −1 ⎣⎡ B ( τ ) + τE r ⎦⎤ − r0 τ +
1
∑ Aij ( τ ) ,
2 1 ≤ i, j ≤ 3
wobei E r die ( r, r ) -Einheitsmatrix bezeichne.
Bei der Spezifikation von R = Cov ( ε ) gehen wir unverändert von (3.10a) aus. Damit sind die
Ausgangsdaten zur Anwendung der Kalman-Filter-Prozedur sämtlich festgelegt. Der Parametervektor, bezüglich dessen die Likelihood-Funktion (2.16) gemäß Abschnitt 2.8 zu maximieren ist, lautet hierbei θ = ( r0 , α1 , α 2 , α3 , σ1 , σ 2 , σ3 , ρ12 , ρ13 , ρ23 , λ1 , λ 2 , λ 3 , σε ) , es sind damit
vierzehn Parameter zu bestimmen.
4.
Zinsstrukturmodelle des Cox/Ingersoll/Ross (CIR)-Typus
4.1
Vorüberlegungen zur Gewinnung der Zustandsgleichung
Ausgangspunkt der weiteren Überlegungen ist wiederum die generelle Faktorisierung (3.1).
Im Unterschied zum Gauß-Fall ist in den folgenden Fällen Cov ( X t +1 | X t ) aber nicht mehr
deterministisch, sondern eine Funktion von X t , d.h. Cov ( X t +1 | X t ) = h ( X t ) . Aus dieser Tatsache ergeben sich mehrere Probleme. Zunächst ist (3.1) nun keine äquivalente Darstellung
von (2.1a) mehr. Es liegt nicht mehr der Fall des Standard-Kalman-Filters, sondern eines verallgemeinerten Kalman-Filters vor, vgl. hierzu etwa HARVEY (1990, S. 156 f.). Zum anderen
ist X t nach wie vor nicht beobachtbar. Ein auf DUAN/SIMONATO (1999) zurückgehender Vorschlag besteht nun darin, X t durch X̂ t|t zu ersetzen, die lineare Projektion von X t auf
{1, Yt ,K , Yt } , diese wird ja durch den Kalman-Filter generiert.
Die Problematik pflanzt sich des Weiteren fort in die Thematik der Maximum LikelihoodSchätzung. Das Residuum Vt*+1 aus (3.1a) ist nun nicht mehr normalverteilt, die Likelihood-
21
Funktionen aus (2.14b) bzw. (2.16) sind nicht mehr korrekt. Die Beibehaltung dieser Likelihood-Funktionen (d.h., der Approximation der wahren Dichte durch eine normalverteilte
Dichte) führt auf die sogenannte Quasi-Likelihood-Methode. Da im Weiteren aber X t durch
X̂ t|t ersetzt wird, resultiert aus dieser Vorgehensweise insgesamt nur eine approximative Variante der Quasi-Likelihood-Methode. Dieser Problemkreis wird in der Literatur ausführlich
diskutiert, insbesondere in DE JONG (2002), DUAN/SIMONATO (1999) und LUND (1997). Die in
diesem Zusammenhang durchgeführten empirischen Simulationen deuten darauf hin, dass der
aus der dargestellten Vorgehensweise resultierende Bias gering ist. Im Weiteren schließen wir
uns daher der Vorgehensweise von DUAN/SIMONATO (1999) an, wie zuvor schon BELETSKI
(2003), DE JONG (2000) und FISCHER/MAY/WALTHER (2004).
4.2
Einfaktormodell von CIR
Das Einfaktormodell von Cox/Ingersoll/Ross (CIR) beruht22 auf der Annahme eines Quadratwurzelprozesses für die Entwicklung der Zinsintensität {R t } , üblicherweise geschrieben als
stochastische Diffferentialgleichung der Form
(4.1)
dR t = α ( μ − R t ) dt + σ R t dWt .
Dabei gilt α = α P und μ = μ P , d.h. der Prozess wird unter dem physischen Wahrscheinlichkeitsmaß P spezifiziert. Dabei ist 2αμ > σ2 voraus zu setzen, damit der Prozess im positiven
Bereich bleibt.
Zur Gewinnung der Zustandsgleichung knüpfen wir unter Berücksichtigung der Diskussion in
Abschnitt 4.1 an (3.1) an und benutzen die Ergebnisse in ALBRECHT/MAURER (2005, S. 170)
für E ( R t | R s ) bzw. Var ( R t | R s ) . Wir erhalten hieraus
(4.2a)
(4.2b)
(
)
E ( R t +1 | R t ) = μ 1 − e −α + e −α R t
(
σ2
Var ( R t +1 | R t ) = μ
1 − e −α
2α
)
2
(
)
σ2 −α −2α
e −e
Rt .
+
α
Aufgrund der Abhängigkeit von R t ist Var ( R t +1 | R t ) damit insbesondere nicht mehr – im
Gegensatz zum Vasicek-Fall – deterministisch.
22
Vgl. etwa ALBRECHT/MAURER (2005, S. 169 f.).
22
Die entsprechende Version der Zustandsgleichung (2.1a) lautet somit:
R t +1 = f + FR t + Vt +1 ,
(4.3a)
wobei
(
f = μ 1 − e−α
(4.3b)
)
F = e −α .
(4.3c)
Die Parameter f und F sind somit identisch im Vergleich zum Vasicek-Fall. Die Varianz/Kovarianz-Matrix von Vt +1 lautet hingegen
(4.3d)
Q = Q(Rt ) = μ
(
σ2
1 − e −α
2α
)
2
+
(
)
σ2 −α −2α
e −e
Rt .
α
Bei der Implementierung des Kalman-Filters ist dabei für t = 1, 2,K die Zinsintensität R t
durch R̂ t|t gemäß (2.9a) zu ersetzen. R̂1|1 greift dabei insbesondere auf den Startwert R̂1|0 der
Kalman-Rekursion zurück.
Die Abhängigkeit der Varianz-/Kovarianzmatrix Q von R t zieht ein weiteres Problem nach
sich, das – beim Einsatz des Kalman-Filters – bei allen Zinsstrukturmodellen vom CIR-Typus
auftritt. Ein negativer Projektionswert von R̂ t|t (bzw. allgemein X̂ t|t ) ist nicht zulässig und
kann des Weiteren zu einer Matrix Q führen, die nicht mehr positiv definit ist. CHEN/SCOTT
(2003, S. 149) schlagen in diesem Zusammenhang vor, einen negativen Projektionswert R̂ t|t
(bzw. negative Komponenten von X̂ t|t ) durch null zu ersetzen, um die Restriktion R t ≥ 0
(bzw. Xi ( t ) ≥ 0 für alle i) zu wahren.23
Der Startwert R̂1|0 = E ( R1 ) und die assoziierte Größe P1 = Var ( R1 ) ergeben sich24 zu
(4.4a)
R̂1|0 = μ
und
(4.4b)
23
24
σ2
P1 = μ
.
2α
Dieses Censoring der Projektionswerte der Zustandsvariablen ist zwar notwendig, führt aber möglicherweise
zu zusätzlichen Verzerrungen beim Schätzprozess, vgl. etwa LUND (1997, S. 10).
Vgl. Anhang C.1 oder DE JONG (2000, S. 312).
23
Die Spot Rates R ( t, t + τi ) sind wie im Vasicek-Fall strukturell gegeben durch (3.9a), allerdings mit unterschiedlichen Werten für die Funktionen B ( τ ) sowie A ( τ ) . Es gilt25
( α + λ )2 + 2σ2 :
mit γ :=
A ( τ) =
(4.5a)
2αμ
σ2
B ( τ) =
(4.5b)
⎡
⎤
α+λ+γ )τ 2
2γe(
⎥
ln ⎢
⎢ ( α + λ + γ ) e γτ − 1 + 2γ ⎥
⎣⎢
⎦⎥
(
(
)
)
2 e γτ − 1
(α + λ + γ ) (e
γτ
)
− 1 + 2γ
.
Bei der Spezifikation von R = Cov ( ε ) gehen wir unverändert von (3.10a) aus. Damit sind die
Ausgangsdaten zur Anwendung der Kalman-Filter-Prozedur sämtlich festgelegt. Der Parametervektor, bezüglich dessen die (Quasi-)Likelihood-Funktion (2.16) gemäß Abschnitt 2.8 zu
maximieren ist, lautet hierbei θ = ( μ, α, σ, λ, σε ) , es sind damit fünf Parameter zu bestimmen.
4.3
Zweifaktormodell des CIR-Typus: Unabhängige Faktoren
Das Zweifaktormodell des CIR-Typus, wobei die beiden Faktoren als unabhängig vorausgesetzt werden, wird wie im Weiteren dargestellt spezifiziert. Wir gehen zunächst aus von dem
folgenden Modell für die Zinsintensität:
R t = X1 ( t ) + X 2 ( t ) .
(4.6)
Dabei ist X t = ( X1 ( t ) , X 2 ( t ) )
T
ein zweidimensionaler Quadratwurzelprozess mit der P-
Dynamik
(4.7a)
dX t = α ( μ − X t ) dt + C X t dWt .
Dabei ist die symbolisch mit
X t bezeichnete Matrix gegeben durch
(4.7b)
⎛ X1 ( t )
Xt = ⎜
⎜ 0
⎝
⎞
⎟.
X 2 ( t ) ⎟⎠
0
Aufgrund der Unabhängigkeit der Faktoren X1 ( t ) und X 2 ( t ) reduziert sich die CholeskyMatrix C gemäß (3.12d) zu
25
Dabei wurde der überwiegenden Vorgehensweise in der Literatur gefolgt und die Risikoprämie pro Einheit
Risiko ausgedrückt, d.h. λ durch λ σ ersetzt. Im Unterschied hierzu vgl. etwa KWOK (1998, S. 325).
24
(4.7c)
⎛σ
C=⎜ 1
⎝0
0⎞
⎟
σ2 ⎠
⎛α
α=⎜ 1
⎝0
0 ⎞
⎟
α2 ⎠
und mit
(4.7d)
sowie
⎛μ ⎞
μ=⎜ 1⎟
⎝ μ2 ⎠
(4.7e)
lässt sich (4.7a) wie folgt in die äquivalente Dynamik der eindimensionalen Prozesse X1 ( t )
und X 2 ( t ) zerlegen:
(4.8a)
dX1 ( t ) = α1 ( μ1 − X1 ( t ) ) dt + σ1 X1 ( t )dW1 ( t )
(4.8b)
dX 2 ( t ) = α 2 ( μ 2 − X 2 ( t ) ) dt + σ 2 X 2 ( t )dW2 ( t )
Um die Positivität von {R t } zu garantieren, muss dabei 2αiμi > σi2 für i = 1, 2 gelten.
Anzumerken ist schließlich, dass es – im Unterschied zum Vasicek-Fall des Kapitels 3 – im
Fall eines mehrdimensionalen Quadratwurzelprozesses nicht zulässig ist, unter der PDynamik μ = 0 zu setzen und in einem einzigen Parameter r0 zu kondensieren26.
Aufgrund der angenommenen Unabhängigkeit der Faktoren können die Resultate des Abschnitts 4.2 direkt auf den zweidimensionalen Fall übertragen werden.
Die Zustandsgleichung lautet
(4.9a)
(
(
−α1
⎛
⎛ X1 ( t + 1) ⎞ ⎜ μ1 1 − e
⎜
⎟=⎜
⎝ X 2 ( t + 1) ⎠ ⎜ μ 2 1 − e −α 2
⎝
) ⎟⎞ + ⎜⎛ e
) ⎟⎟⎠ ⎜⎝ 0
−α1
0 ⎞ ⎛ X1 ( t ) ⎞
⎟⎜
⎟ + Vt +1 .
e−α 2 ⎟⎠ ⎝ X 2 ( t ) ⎠
Dabei ist Q = Cov ( X t +1 | X t ) eine Diagonalmatrix mit ( i = 1, 2 )
(4.9b)
26
[Q]ii = μi
(
σi2
1 − e −αi
2αi
)
2
+
(
)
σi2 −αi
e − e −2 α i X i ( t ) .
αi
Vgl. hierzu BELETSKI (2003, S. 61) sowie DAI/SINGLETON (2000, S. 1949 und S. 1973). Abweichend hiervon
arbeitet DE JONG (2000) generell mit der Annahme μ P = 0 .
25
Im Rahmen der Kalman-Rekursion ist gemäß der Vorbemerkungen in Abschnitt 4.1 dabei
X t = ( X1 ( t ) , X 2 ( t ) ) zu ersetzen durch X̂ t|t .
T
Die Startwerte der Rekursion ergeben sich durch
⎛μ ⎞
X̂1|0 = ⎜ 1 ⎟
⎝ μ2 ⎠
(4.10a)
und
⎛ σ12
⎜ μ1
2α1
P1 = ⎜⎜
⎜ 0
⎜
⎝
(4.10b)
⎞
⎟
⎟.
2 ⎟
σ
μ 2 2 ⎟⎟
2α 2 ⎠
0
Kommen wir damit zur Spezifikation der Beobachtungsgleichung. Grundsätzlich gilt hier
unverändert die Darstellung (3.17a) des zweidimensionalen Vasicek-Falles. Die Funktionen A
und B ergeben sich gemäß
(4.11a)
A ( τ ) = A1 ( τ ) + A 2 ( τ )
(4.11b)
B ( τ ) = ( B1 ( τ ) , B2 ( τ ) ) ,
T
wobei ( i = 1, 2 )
(4.11c)
γi =
(4.11d)
2αiμi
(4.11e)
Ai ( τ ) =
σi2
Bi ( τ ) =
( αi + λi )2 + 2σi2
⎡
α +λ +γ τ 2
2 γ i e( i i i )
ln ⎢
⎢ ( α + λ + γ ) eγiτ − 1
i
i
⎢⎣ i
(
)
(
)
)
.
⎤
⎥
⎥
⎥⎦
2 eγi τ − 1
(
( αi + λ i + γ i ) e γ i τ − 1 + 2γ i
Bei der Spezifikation von R = Cov ( ε ) gehen wir unverändert von (3.10a) aus. Damit sind die
Ausgangsdaten zur Anwendung der Kalman-Filter-Prozedur sämtlich festgelegt. Der Parametervektor, bezüglich dessen die (Quasi-)Likelihood-Funktion zu maximieren ist, lautet
θ = ( μ1 , μ 2 , α1 , α 2 , σ1, σ 2 , λ1, λ 2 , σε ) , es sind damit neun Parameter zu bestimmen.
4.4
Dreifaktormodell des CIR-Typus: Unabhängige Faktoren
26
Die Ergebnisse des Abschnitts 4.3 können aufgrund der Unabhängigkeit der Faktoren direkt
auf den dreidimensionalen Fall verallgemeinert werden. Es gilt:
R t = X1 ( t ) + X 2 ( t ) + X3 ( t ) .
(4.12)
Die P-Dynamik von X t = ( X1 ( t ) , X 2 ( t ) ,, X3 ( t ) ) ist gegeben durch
T
dX t = α ( μ − X t ) dt + C X t dWt .
(4.13)
Dabei sind α , C und
und
X t Diagonalmatrizen mit α = diag ( α1, α 2 , α 3 ) , C = diag ( σ1 , σ 2 , σ3 )
X t = diag ( X1 ( t ) , X 2 ( t ) , X3 ( t ) ) und es gilt μ = ( μ1 , μ 2 , μ3 ) . Dabei ist 2αiμi > σi2
T
( i = 1, 2,3 ) zu fordern, damit die Positivität von {R t } gewährleistet ist.
Die Zustandsgleichung lautet
(4.14a)
(
(
(
⎛ μ 1 − e −α1
⎛ X1 ( t + 1) ⎞ ⎜ 1
⎜
⎟ ⎜
−α 2
⎜ X 2 ( t + 1) ⎟ = ⎜ μ 2 1 − e
⎜
⎟ ⎜
⎝ X3 ( t + 1) ⎠ ⎜ μ 1 − e −α3
⎝ 3
) ⎞⎟ ⎛ e
⎟ ⎜
) ⎟ + ⎜⎜ 0
⎟
) ⎟⎠ ⎜⎝ 0
−α1
0
e−α 2
0
0 ⎞⎛ X (t) ⎞
⎟⎜ 1 ⎟
0 ⎟ ⎜ X 2 ( t ) ⎟ + Vt +1 .
⎟⎜
⎟
e −α3 ⎟ ⎝ X3 ( t ) ⎠
⎠
Dabei ist Q = Cov ( X t +1 | X t ) eine Diagonalmatrix mit ( i = 1, 2,3 )
(4.14b)
[Q]ii = μi
(
σi2
1 − e −αi
2αi
)
2
+
(
)
σi2 −αi
e − e −2 α i X i ( t ) .
αi
Im Rahmen der Kalman-Rekursion ist dabei gemäß den Vorüberlegungen in Abschnitt 4.1
X t = ( X1 ( t ) , X 2 ( t ) , X3 ( t ) ) zu ersetzen durch X̂ t|t .
T
Die Startwerte der Rekursion ergeben sich durch
(4.15a)
X̂1|0
⎛ μ1 ⎞
⎜ ⎟
= ⎜ μ2 ⎟
⎜ ⎟
⎝ μ3 ⎠
und
(4.15b)
[ P1 ]ii = μi
σi2
.
2αi
Für die Beobachtungsgleichung gilt wie im Vasicek-Fall grundsätzlich die Darstellung (3.24
a). Die Funktionen A und B ergeben sich gemäß
27
(4.16a)
A ( τ ) = A1 ( τ ) + A 2 ( τ ) + A3 ( τ )
(4.16b)
B ( τ ) = ( B1 ( τ ) , B2 ( τ ) , B3 ( τ ) ) ,
T
wobei ( i = 1, 2,3 )
( αi + λi )2 + 2σi2
γi =
(4.16c)
Ai ( τ ) =
(4.16d)
2αiμi
σi2
Bi ( τ ) =
(4.16e)
⎡
α +λ +γ τ 2
2 γ i e( i i i )
ln ⎢
⎢ ( α + λ + γ ) eγiτ − 1
i
i
⎣⎢ i
(
)
(
)
)
.
⎤
⎥
⎥
⎦⎥
2 eγi τ − 1
( αi + λ i + γ i ) ( e
γiτ
− 1 + 2γ i
Bei der Spezifikation von R = Cov ( ε ) gehen wir unverändert von (3.10a) aus. Damit sind die
Ausgangsdaten zur Anwendung der Kalman-Filter-Prozedur sämtlich festgelegt. Der Parametervektor, bezüglich dessen die (Quasi-)Likelihood-Funktion zu maximieren ist, lautet
θ = ( μ1 , μ 2 , μ3 , α1 , α 2 , α3 , σ1 , σ 2 , σ3 , λ1 , λ 2 , λ 3 , σε ) , es sind damit dreizehn Parameter zu
bestimmen.
4.5
Mehrfaktormodell des CIR-Typus: Korrelierte Faktoren
Im Falle abhängiger Faktoren lautet, ausgehend von einer Zinsintensität der Form
r
R t = ∑ Xi ( t ) ,
(4.17)
i =1
die P-Dynamik der Faktoren X t = ( X1 ( t ) ,K , X r ( t ) )
dX t = α ( μ − X t ) dt + C X t dWt .
(4.18)
Dabei
T
sind
X t = diag
(
α
und
Xt
Diagonalmatrizen27
)
α = diag ( α1,K , α r )
mit
X1 ( t ) ,K , X r ( t ) . Für μ gilt μ = ( μ1 ,K , μ r )
T
und
und C ist die Cholesky-
Zerlegung einer Varianz-/Kovarianzmatrix.
27
Wie in Anhang A.1 angemerkt, beinhaltet die Wahl von α als Diagonalmatrix im Grunde eine Überidentifizierung der Parameter und eine untere Dreiecksmatrix wäre vorzuziehen. Anhang A.1 enthält ebenfalls eine
allgemeinere Version von X t .
28
Mehrfaktormodelle des CIR-Typus sind im Falle korrelierter Faktoren mit einer Reihe von
Problemen verbunden. Zunächst ergeben sich, wie in Anhang A.1 ausgeführt, eine Reihe von
Restriktionen, um die Positivität von {R t } zu gewährleisten sowie eine Reihe von Normierungen, um die eindeutige Identifizierbarkeit der Parameter sicherzustellen. Eine weitere
Problematik besteht darin, dass das Differentialgleichungssystem (A.9) bzw. (A.10) zur Gewinnung der Funktionen A ( τ ) und B ( τ ) im Gegensatz zu den bisher betrachteten Fällen nur
noch numerisch zu lösen ist.
Eine Anwendung des Kalman-Filters auf Mehrfaktormodelle des CIR-Typus mit korrelierten
Faktoren erfolgt unseres Wissens bisher nur in DE JONG (2000). DE JONG arbeitet allerdings
einheitlich mit der Restriktion μ P = 0 , die – wie bereits in Abschnitt 4.3 angesprochen - problematisch ist.
DAI/SINGLETON (2000, S. 1970) kommen darüber hinaus zum Schluss, dass auf der einen Seite nur nicht-negative Korrelationen zwischen den Faktoren zu einem zulässigen Modell führen und auf der anderen Seite die empirischen Daten eher für eine negative Korrelation der
Faktoren sprechen. Durch eine Zulassung (notwendigerweise positiver) Korrelation wäre damit im Vergleich zum unkorrelierten Fall nichts gewonnen. Wie schon BELETSKI (2003) verzichten wir daher auf die empirische Identifizierung von multifaktoriellen CIR-Modellen mit
korrelierten Faktoren.
29
LITERATUR
Albrecht, P., R. Maurer (2005): Investment- und Risikomanagement, 2. Aufl., Stuttgart.
Babbs, S.H., K.B. Nowman (1999): Kalman Filtering of Generalized Vasicek Term Structure
Models, Journal of Financial and Quantitative Analysis 34, S. 115-130.
Beletski, T. (2003): Forecasting the Term Structure of Interest Rates with Stochastic Models,
Helsinki, University of Technology.
Cairns, A.J.G. (2004): Interest Rate Models, Princeton, Oxford.
Chen, R.-R., L. Scott (2003): Multi-Factor CIR Models of the Term Structure: Estimates and
Tests from a State-Space Model Using a Kalman Filter, Journal of Real Estate Finance and Economics 27, S. 143-172.
Dai, Q., K.J. Singleton (2000): Specification Analysis of Affine Term Structure Models,
Journal of Finance 55, S. 1943-1978.
De Jong, F. (2000): Time Series and Cross-section Information in Affine Term-Structure
Models, Journal of Business & Economic Statistics 18, S. 300-314.
Duan, J.C., J.G. Simonato (1999): Estimating Exponential-Affine Term Structure Models by
Kalman Filter, Review of Quantitative Finance and Accounting 13, S. 111-135.
Duffie, D., R. Kan (1996): A Yield Factor Model of Interest Rates, Mathematical Finance 16,
S. 379-406.
Fischer, T., A. May, B. Walther (2003): Anpassung eines CIR-1-Modells zur Simulation der
Zinsstrukturkurve, Blätter der Deutschen Gesellschaft für Versicherungs- und Finanzmathematik, Band XXVI, Heft 2, November 2003, S. 193-206.
Fischer, T., A. May, B. Walther (2004): Anpassung eines CIR-k-Modells zur Simulation der
Zinsstrukturkurve, Blätter der Deutschen Gesellschaft für Versicherungs- und Finanzmathematik, Band XXVI, Heft 3, Mai 2004, S. 309-387.
Geyer, A., S. Pichler (1999): A state-space approach to estimate and test multifactor CoxIngersoll-Ross models of the term structure, Journal of Financial Research 22,
S. 167-130.
Hamilton, J.D. (1994): Time Series Analysis, Princeton, N.J.
Harvey, A.C. (1989): Forecasting, Structural Time Series Models and the Kalman Filter,
Cambridge.
Jegadeesh, N., G.G. Pennacchi (1996): The Behaviour of Interest Rates Implied by the Term
Structure of Eurodollar Futures, Journal of Money, Credit and Banking 28, S. 426446.
Kwok, Y.K. (1998): Mathematical Models of Financial Derivatives, Singapur.
30
Lund, J. (1997): Econometric Analysis of Continuous-Time Arbitrage-Free Models of the
Term Structure of Interest Rates, Aarhus School of Business.
Pennacchi, G. (1991): Identifying the Dynamics of Real Interest Rates and Inflation: Evidence
Using Survey Data, Review of Financial Studies 4, S. 53-86.
31
Anhang A: Allgemeine Zinsstrukturmodelle
A.1
Das allgemeine affine Modell
Im Weiteren gehen wir auf zentrale strukturelle Resultate für den Fall eines allgemeinen
mehrdimensionalen Zinsstrukturmodells der affinen Form ein, man vgl. hierzu DUFFIE/KAN
(1996) sowie CAIRNS (2004, S. 102 ff.).
Die Zinsintensität R t ist gegeben durch die Spezifikation
r
R t = r0 + ∑ Xi ( t ) = r0 + eT X t .
(A.1)
i =1
Dabei ist r0 ∈ IR , e = (1,K ,1)
T
und X t = ( X1 ( t ) ,K , X r ( t ) )
T
ein r-dimensionaler Diffusi-
onsprozess.
Ziel ist die Ableitung eines Ausdrucks für die Zerobondpreise der Form
(A.2)
⎡
⎛ t +τ
⎞⎤
B ( t, t + τ ) = E Q
exp
⎜ − ∫ R ( s ) ds ⎟ ⎥
t ⎢
⎢⎣
⎝ t
⎠ ⎥⎦
r
⎡
⎤
T
= exp ⎢ A ( τ ) + ∑ B j ( τ ) X j ( t ) ⎥ = exp ⎡⎢ A ( τ ) + B ( τ ) X t ⎤⎥ ,
⎣
⎦
j=1
⎢⎣
⎥⎦
einer sogenannten zeithomogenen affinen Zinsstruktur.
Die Spot Rates sind in diesem Falle gegeben durch ( τ > 0 )
(A.3)
1
T
R ( t, t + τ ) = − ⎡⎢ A ( τ ) + B ( τ ) X t ⎤⎥ .
⎣
⎦
τ
Der folgende allgemeine r-dimensionale Diffusionsprozess führt auf eine zeithomogene affine
Zinsstruktur und umfasst zahlreiche in der Literatur vertretene Spezialfälle:
(A.4a)
dX t = μ P ( X t ) dt + σ ( X t ) dWP ( t ) ,
wobei
(A.4b)
μP ( X t ) = αP (μP − X t )
und
(A.4c)
σ ( X t ) = C St .
Dabei ist anzumerken, dass der Diffusionsprozess unter dem physischen (beobachtbaren)
Wahrscheinlichkeitsmaß P spezifiziert wurde. Auf die Repräsentation unter dem risikoneutralen Wahrscheinlichkeitsmaß wird im Weiteren noch eingegangen.
32
Die Matrix α P ist eine reellwertige
Vektor μ P = ( μ P (1) ,K , μ P ( r ) )
T
( r, r ) -Diagonalmatrix28,
(
)
α P = diag α1P ,K , α rP . Der
ein reellwertiger ( r,1) -Vektor. Die Matrix C = Σ1 2 ist die
( )
Cholesky-Zerlegung einer Varianz-/Kovarianzmatrix Σ = σij . Insbesondere ist C eine untere Dreiecksmatrix. Die symbolisch mit
St
bezeichnete Matrix ist eine
( r, r ) -
Diagonalmatrix, deren i-tes Diagonalelement gegeben ist durch
⎡ St ⎤ = a i + biT X t ,
⎣
⎦ ii
(A4.d)
die Skalare a i und die ( r,1) -Vektoren bi sind dabei jeweils reellwertig.
Für weitergehende Zwecke fassen wir noch die Skalare a i in einem
( r,1) -Vektor
a = ( a1 ,K , a r ) zusammen und die Vektoren bi in eine ( r, r ) -Matrix B = ( b1 ,K , b r ) .
T
Ist B = 0 , so führt die Spezifikation (A.4) auf einen r-dimensionalen Gauß-Prozess und es
treten keine Zulässigkeitsprobleme auf. Im Allgemeinen ist der Modellansatz (A.4) nur zulässig (admissible), wenn ⎡⎣ St ⎤⎦ > 0 für i = 1,K , r . Im Allgemeinen sind daher Restriktionen
ii
an die Parameter notwendig, um die Zulässigkeit zu sichern. Im Allgemeinen existiert darüber
hinaus ein Identifizierungsproblem, da nicht alle Parameter isoliert zu identifizieren sind, beispielsweise ist nur die Produktmatrix C−1αC identifizierbar. Dies macht eine Reihe von Normierungen der in das Modell (A.4) eingehenden Matrizen bzw. Vektoren notwendig. Zur ausführlichen Diskussion der Problemkreise "Zulässigkeit" und "Identifizierung" bzw. "Normierung" verweisen wir auf DUFFIE/KAN (1996), DAI/SINGLETON (2000) und DE JONG (2000).
Kommen wir nun auf die Zusammenhänge zwischen der Spezifikation des Prozesses {X t }
unter Q auf der einen Seite und unter dem physischen (beobachtbaren) Wahrscheinlichkeitsmaß P auf der anderen. Hierzu betrachten wir einen Vektor λ ( t ) = ( λ1 ( t ) ,K , λ r ( t ) )
28
T
von
Wie DAI/SINGLETON (2000, S. 1995) anmerken, führt die Annahme einer Diagonalmatrix zu einer Überidentifizierung der Parameter. Im allgemeinen ist α P als untere Dreiecksmatrix zu wählen, deren Werte außerhalb
der Diagonale nur kleiner oder gleich null sind. Wir folgen trotzdem der üblichen Vorgehensweise, α P als
Diagonalmatrix zu postulieren, um die Anzahl der offenen – und damit empirisch zu identifizierenden Parameter – unter Kontrolle zu halten.
33
Marktpreisen des Risikos. Unter Q gelten dann für Drift und Diffusion des Prozesses die allgemeinen Beziehungen
(A.5a)
μQ ( X t ) = μ P ( X t ) − σ ( X t ) λ ( t )
(A.5b)
σQ ( X t ) = σ ( X t ) ,
d.h. nur die Drift ändert sich bei Betrachtung des Prozesses unter Q.
Im Kontext der für diese Ausarbeitung relevanten Modelle wird nun die folgende Annahme
für die Struktur der Marktpreise des Risikos getroffen, wobei λ := ( λ1 ,K , λ r ) :
T
λ ( t ) = St λ .
(A.6)
In diesem Falle geht (A.5a) zunächst über in
(A.7a)
μQ ( X t ) = μ P ( X t ) − CSt λ ,
wobei St eine Diagonalmatrix mit ⎡⎣ St ⎤⎦ = a i + biT X t ist. Die Beziehung (A.7a) lässt sich
ii
daher in disaggregierter Form schreiben als
(A.7b)
μ Q ( X t ) = μ P ( X t ) − Cψ − CΦ X t
wobei ψ ein ( r,1) -Vektor ψ = ( ψ1 ,K , ψ r ) mit ψi = λi a i ist und Φ eine ( r, r ) -Matrix, deT
ren i-te Zeile gegen ist durch λi biT , d.h.
⎛ λ1b1T ⎞
⎜
⎟
Φ =⎜ M ⎟.
⎜
T⎟
⎝ λ r br ⎠
Notieren wir nun noch μQ ( X t ) in der Form
(A.7c)
(
)
μQ ( X t ) = α Q μQ − X t ,
so gelten die Zusammenhänge
(A.8a)
α P = α Q − CΦ
und
(A.8b)
α P μ P = α Q μ Q + Cψ
bzw.
(A.8c)
μ P = α P−1 ⎡⎣α QμQ + Cψ ⎤⎦ .
34
Die eindimensionale reelle Funktion A ( τ )
B ( τ ) = ( B1 ( τ ) ,K , Br ( τ ) )
T
und die vektorwertige reelle Funktion
genügen nun dem folgenden System von (gewöhnlichen) Diffe-
rentialgleichungen, vgl. etwa DAI/SINGLETON (2000, S. 1947) oder BELETSKI (2003, S. 55):
(A.9a)
(A.9b)
(
dA ( τ ) dτ = α Qμ Q
T
) B ( τ ) + 12 ∑ ⎡⎣CT B ( τ )⎤⎦ i a i − r0
dB ( τ ) dτ = −α Q B ( τ ) +
r
2
i =1
2
1 r ⎡ T
∑ ⎣C B ( τ ) ⎤⎦ i bi − e .
2 i =1
Dabei bedeute generell [ A ]i die i-te Zeile der Matrix A.
Die folgende alternative Darstellung bietet DE JONG (2000, S. 301):
(A.10a)
(A.10b)
(
dA ( τ ) dτ = α Qμ Q
T
) B ( τ ) + 12 ∑ ∑ Bi ( τ ) B j ( τ ) a ij − r0
i
j
1
dB ( τ ) dτ = −α Q B ( τ ) + ∑ ∑ Bi ( τ ) B j ( τ ) bij − e ,
2 i j
wobei die Skalare a ij und die Vektoren bij der Gleichung
(A.10c)
(
)
a ij + bijT x = ⎡C diag a + BT x CT ⎤
⎣
⎦ ij
genügen.
Das Differentialgleichungssystem (A.9) bzw. (A.10) ist in einigen zentralen Fällen explizit
lösbar, im Allgemeinen – vgl. etwa DAI/SINGLETON (2000, S. 1947) – jedoch durch numerische Integration unter Zugrundelegung der Startbedingungen A ( 0 ) = 0 und B ( 0 ) = 0 .
35
A.2
Das verallgemeinerte Vasicek-Modell
Das verallgemeinerte Vasicek-Modell gewinnt man, indem man im Rahmen von (A.4) jeweils
bi = 0 (bzw. B = 0 bzw. Φ = 0 ) und a i = 1 (bzw. a = e ) setzt.
Die allgemeine stochastische Differentialgleichung (A.4) besitzt dann die Form
dX t = α P ( μ P − X t ) dt + CdWP ( t ) .
(A.11)
Die Zusammenhänge (A.8) hinsichtlich des Zusammenhangs der Parameter α und μ lauten
dann (man beachte Cψ = Cλ )
(A.12a)
αP = αQ = α
(A.12b)
μ P = μQ + α −1Cλ .
In dem im Haupttext relevanten Fall μ P = 0 folgt hieraus
μQ = α −1Cλ ,
(A.12c)
wobei – der Majorität der Literatur über Gaußsche affine Zinsstrukturmodelle folgend29, λ
durch −λ ersetzt wird.
Das Differentialgleichungssystem (A.9) lautet hiermit (man beachte CCT = Σ )
(A.13a)
dA ( τ )
dτ
1
T
= λ T CT B ( τ ) + B ( τ ) ΣB ( τ ) − r0
2
dB ( τ )
(A.13b)
τ
= −αB ( τ ) − e .
Da α eine Diagonalmatrix ist, kann (A.13b) relativ einfach gelöst werden und man erhält
insbesondere
(A.14)
−α τ
T ⎛ e 1 −1
e−α r τ − 1 ⎞
B ( τ ) = ( B1 ( τ ) ,K , Br ( τ ) ) = ⎜
,K ,
⎟.
⎜ α
α r ⎟⎠
1
⎝
Zur Bestimmung von (A.13a) vgl. im Detail BELETSKI (2003, S. 87).
29
Vgl. etwa BELETSKI (2003, S. 87).
36
A.3
Das verallgemeinerte CIR-Modell
Das verallgemeinerte CIR-Modell gewinnt man, indem man generell a i = 0 (bzw. a = 0 ) sowie bij = 1 für j = i und bij = 0 für j ≠ i setzt. Die allgemeine stochastische Differentialgleichung (A.4) besitzt dann die Form
(A.15)
⎛ X1 ( t )
⎜
dX t = α P ( μ P − X t ) dt + C ⎜
⎜
⎜ 0
⎝
⎞
⎟
⎟ dWP ( t ) .
⎟
X r ( t ) ⎟⎠
0
O
Die Zusammenhänge (A.8) hinsichtlich der Parameter α und μ lauten dann (man beachte
ψ = 0 und Φ = diag ( λ1 ,K , λ r ) )
(A.16a)
α P = α Q − Cλ
(A.16b)
μ P = α P−1α QμQ .
37
Anhang B: Ermittlung der Startwerte bei Modellen des Vasicek-Typus
B.1
Einfaktormodell
Gemäß ALBRECHT/MAURER (2005, S. 168) gilt zunächst
E ( R t + h | R t ) = μ + e−αh ( R t − μ )
(B.1)
sowie
Var ( R t + h | R t ) =
(B.2)
(
)
σ2
1 − e−2αh .
2α
Hieraus folgt zunächst
(B.3)
E ( R t + h ) = E ⎡⎣ E ( R t + h | R t ) ⎤⎦ = μ + e −αh ⎡⎣ E ( R t ) − μ ⎤⎦
und damit unter Annahme der Stationarität, d.h. E ( R t + h ) = E ( R t )
E ( R t ) − μ = e −αh ⎡⎣ E ( R t ) − μ ⎤⎦ .
(B.4)
Da exp ( −αh ) > 0 folgt hieraus
E (Rt ) = μ .
(B.5)
Des Weiteren folgt
Var ( R t + h ) = E ⎡⎣ Var ( R t + h | R t ) ⎤⎦ + Var ⎡⎣ E ( R t + h | R t ) ⎤⎦
(B.6)
(
)
σ2
=
1 − e−2αh + e −2αh Var ( R t )
2α
und damit unter Annahme der Stationarität
(B.7)
(
)
Var ( R t ) 1 − e−2αh =
(
)
σ2
1 − e−2αh .
2α
Insgesamt folgt damit
(B.8)
Var ( R t ) =
σ2
.
2α
Ein entsprechendes Ergebnis erhält man aus der AR(1)-Eigenschaft von R t , wenn man von
einem "eingeschwungenen" Prozess ausgeht. Ansonsten sind (B.5) und (B.8) als approximative Beziehungen anzusehen.
38
B.2
Zweifaktormodell
Aus (3.14a) folgt aus E ( X t +1 ) = E ⎡⎣ E ( X t +1 | X t ) ⎤⎦ und der Beachtung der Stationarität zunächst komponentenweise ( i = 1, 2 ) E ⎡⎣ Xi ( t ) ⎤⎦ = e−αi E ⎡⎣ Xi ( t ) ⎤⎦ und damit E ⎡⎣ Xi ( t ) ⎤⎦ = 0 .
Hinsichtlich der Kovarianzmatrix gilt Cov ( X t +1 ) = E ⎡⎣Cov ( X t +1 | X t ) ⎤⎦ + Cov ⎡⎣ E ( X t +1 | X t ) ⎤⎦ .
Es gilt dann unter Annahme der Stationarität komponentenweise ( ρ11 = ρ22 = 1 )
(B.9)
Covij =
ρijσi σ j
αi + α j
e
(
− αi +α j
) + e−( αi +α j )Cov
und damit
(B.10)
Covij =
ρijσi σ j
αi + α j
.
ij
39
Anhang C: Ermittlung der Startwerte bei Modellen des Cox/Ingersoll/Ross-Typus
Gemäß ALBRECHT/MAURER (2005, S. 170) gilt zunächst
(
)
)
(
)
(
)
E ( R t + h | R t ) = R t e −αh + μ 1 − e −αh
(C.1)
sowie
(
σ2 −αh −2αh
σ2
−e
+μ
Var ( R t + h | R t ) = R t
e
1 − e−αh
2α
2α
(C.2)
2
.
Hieraus folgt zunächst
E ( R t + h ) = E ⎡⎣ E ( R t + h | R t )⎤⎦ = e −αh E ( R t ) + μ 1 − e−αh
(C.3)
und damit unter Annahme der Stationarität
(
) (
)
E ( R t ) 1 − e −αh = μ 1 − e −αh ,
(C.4)
d.h., insgesamt
E (Rt ) = μ .
(C.5)
Des Weiteren folgt
Var ( R t + h ) = E ⎡⎣ Var ( R t + h | R t ) ⎤⎦ + Var ⎡⎣ E ( R t + h | R t ) ⎤⎦
(C.6)
= E (Rt )
(
)
(
σ2 −αh −2αh
σ2
−e
+μ
e
1 − e−αh
2α
2α
)
2
+ Var ( R t ) e−2αh .
Unter der Annahme der Stationariät folgt hieraus
(C.7)
(
)
Var ( R t ) 1 − e−2αh = μ
(
Insgesamt ergibt sich hieraus:
(C.8)
)
(
σ2 −αh −2αh
σ2
−e
+μ
e
1 − e−αh
α
2α
σ2
Var ( R t ) = μ
.
2α
)
2
.