next up previous contents index
Nächste Seite: Kenngrößen für Zeitreihen Aufwärts: Seminar Zeitreihen Vorherige Seite: Inhalt   Inhalt   Index

Unterabschnitte

Zeitreihen und ihre Approximierung

Einführende Definitionen und Überlegungen


Definition: Zeitreihe

Eine Zeitreihe ist eine zeitlich geordnete Abfolge von Meßwerten der Form $\{y_t:~ t=1,\ldots, n\}$ oder $\{y(t_i):~ i=1,\ldots,n\}$. Meistens wird dabei eine regelmäßsige Frequenz benutzt, z.B. tägliche, monatliche, quartalsweise oder jährliche Datenerfassung. Es gibt aber auch Zeitreihen, bei denen die Zeitpunkte nicht äquidistant sind. Um dies anzudeuten, wird dann die schreibweise $y(t_i)$ statt $y_i$ verwendet.

Es kann auch sein, daß jeder Meßwert die Anzahl von Ereignissen in einem bestimmten Zeitraum darstellt.

$y_t$ kann auch ein Vektor aus mehreren jeweils zeitgleich gemessenen Werten sein, wie zum Beispiel Körpertemperatur, Blutdruck und Puls.

Vorteil von Zeitreihen:

Man kann eine Zeitreihe $\{y_t:~ t=1,\ldots, n\}$ auch als einen $n$-dimensionalen Zufallsvektor auffassen. In diesem Fall müßten aber sehr viele einzelne Werte zur Beschreibung berechnet werden (Varianzen, Covarianzen usw.). Werden die $y_t$ jedoch als Zeitreihe aufgefaßt, so können sie mit wesentlich weniger Kennzahlen beschrieben werden.

Besonderheit von Zeitreihen:

Die einzelnen Messungen sind meistens nicht stochastisch unabhängig voneinander. Diese Abhängigkeit der einzelnen Messungen ist eine der wichtigen Eigenschaften bei der Untersuchung von Zeitreihen.

Beispiel:

 
=7cm \epsffile{Bilder01/Wuerfel.eps} =7cm \epsffile{Bilder01/Nasdaq.eps} 100x würfeln

Jeder Würfelwurf ist vollkommen unabhängig von dem vorherigen und dem nächsten Wurf. Der Punktestand des Nasdaq zum Zeitpunkt $t$ hängt jedoch stark vom Punktestand zum Zeitpunkt $t-1$ ab und der Punktestand zum Zeitpunkt $t+1$ wird sich auch in einer gewissen Umgebung zum aktuellen Punktestand befinden.

Aufstellung von Zeitreihen:

Notation:

Eine Zeitreihe $\{y_t:~ t=1,\ldots, n\}$ ist zu verstehen als die Realisierung der Zufallsvariablen $\{Y_t:~ t=1,\ldots,n\}$.

Ziele der Analyse

Mit der Analyse von Zeitreihen werden meistens folgende Ziele verfolgt:


Definition: seasonal / zyklisch

Viele Zeitreihen weisen ein periodisches Verhalten auf. Bei der Analyse unterscheidet man dabei folgende beide Formen von periodischem Verhalten:

seasonales Verhalten zyklisches Verhalten  


Bemerkung (Diskretisierung)

Zeitreihen können theoretisch einen kontinuierlichen Wertebereich wie auch einen diskreten Wertebereich umfassen. Die $y_t$ sind jedoch eine Folge, d.h. es kann nur abzählbar viele Meßwerte geben.

Besitzt der zugrunde liegende Versuch nur an diskreten Punkten Werte (z.B. die Messung einer Temperatur in gewissen Abständen), so sind keine weiteren Überlegungen notwendig. In vielen Fällen ergibt sich dies von selbst, da nur zu diskreten Zeitpunkten gemessen werden kann.

Mit Versuchen, bei denen kontinuierlich Werte entstehen (z.B. Regenmenge an einem Tag), kann auf mehrere Arten verfahren werden:

Beispiele:

 
Im Volcanic Explosivity Index (VEI) wird durch die Symbole 1 bis 7 die Stärke von explosiven Vulkanausbrüchen dargestellt.

In China werden seit etwa 1400 die Wasserstände des gelben Flussen erfaßt und auf dieser Grundlage werden die Jahre in Dürrejahr, normal oder Überflutungsjahr eingeteilt.

Als dritte Möglichkeit können die $y_t$ als die Anzahl, wie oft ein bestimmtes Ereignis in einem gewissen Zeitintervall eingetreten ist, aufgefaßt werden (z.B. Zellteilung).


Sinnvolle Darstellung von Zeitreihen

Um bei der Analyse einer Zeitreihe alle interessanten Merkmale erkennen zu können, kann es sinnvoll sein, die Achsen geschickt so skalieren.

Beispiel:

In der Zeitreihe treten mehrere sehr starke Spitzen auf, bei denen der Anstieg jedoch flacher verläuft, als der Abfall. Skaliert man beide Achsen gleich, so kann es sein, daß die Spitzen so steil wirken, daß kein Unterschied mehr in der Steilheit von Anstieg und Abfall festgestellt werden kann. Erst durch ein starkes Stauchen der $y$-Achse wird dieses Merkmal sichtbar.

=8cm =8cm \epsffile{Bilder01/Skalierung.eps}

=16cm =3cm \epsffile{Bilder01/Skalierung.eps}


Definition: Geschätzer Erwartungswert und Varianz

Eine Zeitreihe kann als Realisierungen einer endlichen Folge von Zufallsvariablen betrachtet werden. Wären die Verteilungsfunktionen der Zufallsvariable bekannt, so könnten daraus Erwartungswert und Varianz berechnet werden. Die Verteilungsfunktionen sind jedoch normalerweise nicht bekannt, so daß die Erwartungswerte und die Varianzen aus den Meßwerten geschätzt werden müssen. Aus der Stochastik sind für den geschätzten Erwartungswert $\overline y$ und die geschätzte Varianz $\hat\sigma_y^2$ folgende Formeln bekannt:

\begin{displaymath}
\displaylines {
\overline y={1\over n}\sum_{t=1}^n y_t
\hfil...
...t\sigma_y^2={1\over n}\sum_{t=1}^n(y_t-\overline y)^2
\hfill
}
\end{displaymath}

Zerlegung von Zeitreihen


Definitionen: Trend, Autocovarianz, stationär

  1. Die nicht zufällige Funktion $\mu(t)={\rm E}[Y(t)]$ heißt der Trend von $\{Y_t\}$, d.h. dies ist er Erwartungswert für den Zeitpunkt $t$.

  2. Die Autocovarianz-Funktion

    \begin{displaymath}
\displaylines {
\gamma(t,s)={\rm E}[(Y(t)-\mu(t))\cdot(Y(s)-\mu(s))]
\hfill
}
\end{displaymath}

    beschreibt die Abhängigkeit der Meßwerte an den Stellen $s$ und $t$.

Bemerkung:

Die Covarianz beschreibt die Abhängigkeit zwischen zwei verschiedenen Zufallsvariablen, die Autocorvarianz beschreibt die Abhängigkeit zwischen zwei Zeitpunkten innerhalb einer Zeitreihe.

Eine Zeitreihe heißt stationär (im strengen Sinne), wenn für alle $m\in\mathbb{N}$ und alle Zeitpunkte $t_i$, $i=1,\ldots,m$, die Zufallsverteilung für $\{Y(t_i+s):~ s=1,\ldots,m\}$ dieselbe ist, wie für $\{Y(t_i)\}$.
Dies bedeutet praktisch, daß die Zeitreihe beliebig verschoben werden kann und daß der Zeitpunkt des Beginnes der Beobachtung keine Rolle spielt.

Es läßt sich nur sehr schwer überprüfen, ob eine Zeitreihe stationär im strengen Sinne ist, daher beschränkt man sich auf schwächere Anforderungen:
Eine Zeitreihe heißt schwach stationär von der Ordnung $f$, wenn die Momente bis zur Ordnung $f$ nur von der Zeitdifferenz abhängen.

Speziell:

Stationärität von zweiter Ordnung
Es muß gelten $\mu(t)=\mu ~\forall~ t$ und $\gamma(s,t)$ darf nur vom Abstand $\vert t-s\vert$ der beiden Zeitpunkte $s$ und $t$ abhängen.
Im folgenden ist mit ``stationär'' immer ``stationär von zweiter Ordnung'' gemeint.


Komponenten einer Zeitreihe

Eine Zeitreihe besteht aus höchstens 3 Komponenten:

Zunächst werden wir uns mit dem Fall befassen, daß $Y(t)$ in einen Trend und eine stationäre Zufallsfunktion zerfällt:

\begin{displaymath}
\displaylines {
Y(t)=
\underbrace{\mu(t)}_{\scriptscriptstyl...
...\scriptscriptstyle{\rm station\ddot are~Zufallsfkt.}}
\hfill
}
\end{displaymath}


Glättung

Ein wichtiges Ziel bei der Untersuchung von Zeitreihen ist es, eine vom ``Rauschen'' befreite Fassung der Zeitreihe zu gewinnen. Eine Idee, dieses Rauschen zu entfernen ist es, die Zeitreihe zu glätten.

Es gibt verschiedene Verfahren zur Glättung von Zeitreihen, die verschiedene Merkmale betonen oder unterdrücken, daher ist es je nach dem, welches Merkmal untersucht oder dargestellt werden soll, sinnvoll, verschiedene Verfahren anzuwenden.


Gleitender Durchschnitt

Bei der Bildung des gleitenden Durchschnitts (moving average), wird jeweils der Durchschnitt über mehrere Werte gebildet.

Beispiel:


\begin{displaymath}
\displaylines {
s_t={y_{t-1}+y_t+y_{t+1}\over3}
\hfill
}
\end{displaymath}

ist der 3-Punkte gleitende Durchschnitt von $y_t$.

Allgemein:

Der gleitende Durchschnitt kann als gewichtete Summe über eine bestimmte Anzahl von Werten aufgefaßt werden:

\begin{displaymath}
\displaylines {
s_t=\sum_{j=-p}^p w_j y_{t+j},~~~ t=p+1,\ldots,n-p
\hfill
}
\end{displaymath}

$s_t$ ist dann der gleitende Durchschnitt $2p+1$-ter Ordnung.
(Im Falle des 3-Punkte Durchschnitts waren $p=1$ und $w_i={1\over3}$ .)

Beachte:

Der gleitende Durchschnitt ist in der Nähe der Ränder des Definitionsbereiches von $y_t$ nicht definiert. Dies läßt sich beheben, in dem man den Bereich, über den die Summe läuft, anpaßt: $\sum_{\max\{-p,1-t\}}^{\min\{p,n-t\}}$ (und bei den Gewichten ebenfalls sinnvolle Anpassungen in den Randbereichen vornimmt). Meist ist dies aber nicht notwendig, da $p$ relativ klein ist und $n$ sehr groß ist, so daß es keine Rolle spielt, daß $s_t$ auf einigen wenigen Werten nicht erklärt ist.

Wahl von $p$ und $w_j$:

In der Praxis können durch die Wahl von $p$ und $w_j$ bestimmte Eigenschaften einer Zeitreihe bewußt entfernt oder betont werden. Ist z.B. bei einer periodischen Zeitreihe nur die langfristige Entwicklung von Interesse und die Periodizität soll ausgeblendet werden, so wählt man $p$ größer als die Länge der Periode und die $w_j={1\over p}$, damit wird die Zeitreihe so stark geglättet, daß der periodische Effekt nicht mehr sichtbar ist.

=7cm \epsffile{Bilder03/MA-1.eps}   Zeitreihe

Beispiel Matlab-Programm:

 
Das folgende Programm berechnet einen gleitenden Durchschnitt $z$ über eine Zeitreihe $y$. Der Durchschnitt ist von der Ordnung $p$ und die Gewichte sind $w_j={1\over p} ~\forall~ j$.

frame=single,numbers=left,label=MovingAverage.m Prgs03/MovingAverage.m


Definition: Residuum

Mit Hilfe einer solchen Glättung läßt sich die Zeitreihe jetzt in eine geglättete Funktion und ein rauhes Residuum zerlegen:

\begin{displaymath}
\displaylines {
y_t=s_t+r_t
\hfill
}
\end{displaymath}

wobei $s_t$ z.B. ein gleitender Durchschnitt ist und $r_t=y_t-s_t$ ist.

Beispiel:

 
=15cm \epsffile{Bilder03/Demo02.eps}


Polynomiale Näherung

Eine weitere Möglichkeit, eine Zeitreihe zu glätten ist es, eine Polynom zu finden, welches die Werte der Zeitreihe möglichst gut annähert (polynomial regression).

``Möglichst gut annähert'' bedeutet dabei, daß die Summe der Fehlerquadrate möglichst klein sein soll, d.h. es soll

\begin{displaymath}
\displaylines {
\sum_{i=1}^n(y_i-s(t_i))^2
\hfill
}
\end{displaymath}

minimiert werden.

Das Polynom soll formal von folgender Bauart sein:

\begin{displaymath}
\displaylines {
s(t)=\sum_{j=0}^p b_j t^j
\hfill
}
\end{displaymath}

Der Grad $p$ des Polynoms kann dabei vorgegeben werden.

Beispiel:

 
=15cm \epsffile{Bilder03/PolyApprox1.eps} Zeitreihe und polynomiale Näherung mit einem Polynom vom Grad 5

Bestimmung eines solchen Polynoms:

Mit Verfahren der Numerik läßt sich zeigen, daß sich die Koeffizienten $b_j$ ( $b=(b_0,\ldots,b_p)^T$) bestimmen lassen durch:

\begin{displaymath}
\displaylines {
b=(X^TX)^{-1}X^Ty
\hfill
}
\end{displaymath}

wobei $y=(y_1,\ldots,y_n)^T$ ist und $X$ eine $n\times(p+1)$ Matrix mit $x_{ij}=t_i^{j-1}$ ist.

Beispiel Matlab-Programm zur Berechnung der Koeffizienten:

 
Das folgende Programm berechnet die Koeffizienten $b=(b_p,\ldots,b_0)$ eines Näherungspolynoms $p$-ter Ordnung der Zeitreihe aus den Meßwerten $y$, die zu den Zeitpunkten $t$ gemessen wurden. frame=single,numbers=left,label=PolynomApproxKoef.m Prgs03/PolynomApproxKoef.m

Verbesserung des numerischen Ergebnisses:

Das numerische Ergebnis kann durch iterative Nachbesserung verbessert werden (vgl. Numerik).

Vorteile der polynomialen Näherung:

Nachteile der polynomialen Näherung:

Beispiel für zu hohen Polynomgrad:

 
=15cm \epsffile{Bilder03/PolyApprox2.eps} Zeitreihe und polynomiale Näherung mit einem Polynom vom Grad 15


Spline-Interpolation

Polynome sind sehr schöne glatte Funktionen, bringen aber auch verschiedene Nachteile mit sich, wenn Zeitreihen durch sie angenähert werden sollen.

Daher ist es evtl. sinnvoller weniger glatte Funktionen zu verwenden, die dafür aber die eigentlichen Meßwerte besser interpolieren. Allgemein läßt sich dies so formulieren: Es ist eine Funktion $\mu(u)$ gesucht, die

\begin{displaymath}
\displaylines {
Q(\alpha)=
\underbrace{\sum_{i=1}^n(y_i-\mu(...
...ace{\int_{-\infty}^\infty(\mu''(t))^2{\rm d}t}_{(**)}
\hfill
}
\end{displaymath}

für ein vorgegebenes $\alpha$ minimiert. $\alpha$ gibt an, wie zwischen Güte der Näherung (*) und Glattheit (**) abgewogen werden soll.

Diese Minimierung erfüllem am besten die kubischen Splines. Sie haben folgenden Eigenschaften:

Es gibt ein numerisches Verfahren zur Bestimmung von $\mu$.
Glättung mit Spline-Funktionen kann als eine Art lokaler, gewichteter gleitender Durchschnitt aufgefaßt werden. Das Verfahren glättet die Meßwerte in Regionen, in denen weniger Werte zur Verfügung stehen stärker, als in Bereichen, in denen mehr Werte vorhanden sind.

Bestimmung von $\mu(t)$ für Meßpunkte imselben Abstand:

 
$\mu(t)$ läßt sich als gewichtete Summe darstellen:

\begin{displaymath}
\displaylines {
\mu(t_i)=\sum_{j=1}^n y_j w_{ij}
\hfill
}
\end{displaymath}

mit Gewichten der Form

\begin{displaymath}
\displaylines {
w_{ij}\simeq h^{-1} K\left(i-j\over h\right)
\hfill
}
\end{displaymath}

mit $h=\alpha^{1\over4}$ und $K$ der Kernelfunktion:

\begin{displaymath}
\displaylines {
K(u)=
{1\over2}\cdot
e^{-\vert u\vert\sqrt{2...
...n\left({\pi\over4}+{\vert u\vert\over\sqrt{2}}\right)
\hfill
}
\end{displaymath}

(Beweise siehe Numerik)
Für Meßpunkte an ungleichmäßig verteilten Zeitpunkten läßt sich ebenfalls eine vergleichbare Formel für die Berechnung der Spline-Funktion finden.

Seit 1979 sind außerdem Verfahren bekannt, mit denen $\alpha$ automatisch optimal gewählt werden kann. Diese Verfahren basieren auf der Annahme, daß die Zeitreihe einem glatten Trend folgt, welcher von Rauschen überlagert wird. Allerdings wurde mittlererweile auch gezeigt, daß diese automatische Wahl von $\alpha$ zu sehr ungünstigen Ergebnissen führen kann, wenn die Überlagerung des Trends nicht nur aus (unkorreliertem) Rauschen besteht, sondern Abhängigkeiten zwischen den Werten bestehen.


Differenzenbildung

Das Ziel der Glättung war es, den Trend hervorzuheben (z.B. polynomiale Näherung mit $p=1$). Das Ziel der Differenzenbildung ist es, solche Trends aus den Meßwerten zu entfernen.


Definition: Differenzenoperator

Die erste Differenz der Zeitreihe $\{y_t\}$ (geschrieben: $\{Dy_t\}$), ist definiert als:

\begin{displaymath}
\displaylines {
Dy_t=y_t-y_{t-1}
\hfill
}
\end{displaymath}

Bemerkung:

Differenzen höherer Ordnung sind durch wiederholte Anwendung definiert:

\begin{displaymath}
\displaylines {
D^2y_t=D(Dy_t)=Dy_t-Dy_{t-1}=y_t-2y_{t-1}+y_{t-2}
\hfill
}
\end{displaymath}

Beispiel:

Sei $y_t=\alpha+\beta t$ eine lineare, nicht zufällige Funktion. Dann ist $Dy_t=(\alpha+\beta t)-(\alpha+\beta(t-1))=\beta$.

Allgemein:

Besteht $\{y_t\}$ aus einer polynomialen Funktion der Ordnung $k$ und einer stationären zufälligen Komponente, so ist $\{D^ky_t\}$ stationär, d.h. Differenzenbildung entfernt polynomiale Trends.

Weitere Beziehungen:

 
Es ist

\begin{displaymath}
\displaylines {
y_t-{1\over2}(y_t+y_{t-1})={1\over2}(y_t-y_{t-1})={1\over2}Dy_t
\hfill
}
\end{displaymath}

und

\begin{displaymath}
\displaylines {
y_t-{1\over3}(y_{t-1}+y_t+y_{t+1})=-{1\over3}(y_{t-1}-2y_t+y_{t+1})=-{1\over3}D^2y_{t-1}
\hfill
}
\end{displaymath}

D.h. die Differenzenbildung stellt praktisch das Gegenstück zu den gleitenden Durchschnitten dar.


next up previous contents index
Nächste Seite: Kenngrößen für Zeitreihen Aufwärts: Seminar Zeitreihen Vorherige Seite: Inhalt   Inhalt   Index
Alexander Herzog 2002-02-20