Friday 17 March 2017

Umzug Durchschnitt Immer Stationär

Verschieben von durchschnittlichen und exponentiellen Glättungsmodellen. Ein erster Schritt, um über mittlere Modelle hinauszugehen, zufällige Wandermodelle und lineare Trendmodelle, Nicht-Sektionsmuster und Trends können mit einem gleitenden Durchschnitt oder Glättungsmodul extrapoliert werden. Die grundlegende Annahme hinter Mittelwertbildung und Glättung von Modellen ist Dass die Zeitreihe lokal stationär mit einem langsam variierenden Mittel ist. Daher nehmen wir einen bewegten lokalen Durchschnitt, um den aktuellen Wert des Mittelwertes zu schätzen und dann das als Prognose für die nahe Zukunft zu verwenden. Dies kann als Kompromiss zwischen dem mittleren Modell betrachtet werden Und das zufällige Spaziergang ohne Drift-Modell Die gleiche Strategie kann verwendet werden, um einen lokalen Trend zu schätzen und zu extrapolieren. Ein gleitender Durchschnitt wird oft als geglättete Version der ursprünglichen Serie bezeichnet, weil die kurzfristige Mittelung die Wirkung hat, die Beulen zu glätten In der ursprünglichen Serie Durch die Anpassung der Grad der Glättung der Breite des gleitenden Durchschnitts, können wir hoffen, eine Art von optimalen Gleichgewicht zwischen der Leistung des Mittelwerts zu schlagen Und zufällige Walk-Modelle Die einfachste Art von Mittelwert-Modell ist die. Einfache gleichgewichtete Moving Average. Die Prognose für den Wert von Y zum Zeitpunkt t 1, die zum Zeitpunkt t gemacht wird, entspricht dem einfachen Durchschnitt der neuesten m Beobachtungen. Hier und anderswo verwende ich das Symbol Y-Hut, um für eine Prognose der Zeitreihe Y zu stehen, die am frühestmöglichen früheren Datum durch ein gegebenes Modell gemacht wurde. Dieser Durchschnitt ist in der Periode & lgr; m 1 2 zentriert, was bedeutet, dass die Schätzung von Das lokale Mittel neigt dazu, hinter dem wahren Wert des lokalen Mittels um etwa m 1 2 Perioden zu liegen. So sagen wir, dass das Durchschnittsalter der Daten im einfachen gleitenden Durchschnitt m 1 2 relativ zu dem Zeitraum ist, für den die Prognose berechnet wird Dies ist die Zeitspanne, mit der die Prognosen dazu neigen, hinter den Wendepunkten in den Daten zu liegen. Zum Beispiel, wenn Sie die letzten 5 Werte mittelschätzen, werden die Prognosen etwa 3 Perioden spät in Reaktion auf Wendepunkte sein. Beachten Sie, dass wenn m 1, Das einfache gleitende durchschnittliche SMA-Modell entspricht dem zufälligen Walk-Modell ohne Wachstum Wenn m sehr groß ist, vergleichbar mit der Länge der Schätzperiode ist das SMA-Modell gleichbedeutend mit dem mittleren Modell Wie bei jedem Parameter eines Prognosemodells ist es üblich Um den Wert von ki anzupassen Um die bestmögliche Anpassung an die Daten zu erhalten, dh die kleinsten Prognosefehler im Durchschnitt. Hierbei handelt es sich um ein Beispiel für eine Serie, die zufällige Schwankungen um ein langsam variierendes Mittel zeigt. Zuerst wollen wir versuchen, es mit einem zufälligen Spaziergang zu platzieren Modell, das entspricht einem einfachen gleitenden Durchschnitt von 1 Term. Die zufällige Spaziergang Modell reagiert sehr schnell auf Änderungen in der Serie, aber in diesem Fall nimmt es viel von dem Rauschen in den Daten die zufälligen Schwankungen sowie das Signal der lokalen Bedeutet, wenn wir stattdessen einen einfachen gleitenden Durchschnitt von 5 Terminen ausprobieren, bekommen wir einen glatteren Prognosen. Der 5-fach einfache gleitende Durchschnitt liefert deutlich kleinere Fehler als das zufällige Spaziergang Modell in diesem Fall Das Durchschnittsalter der Daten in diesem Prognose ist 3 5 1 2, so dass es dazu neigt, hinter Wendepunkte um etwa drei Perioden zurückzukehren. Zum Beispiel scheint ein Abschwung in der Periode 21 aufgetreten zu sein, aber die Prognosen drehen sich nicht um einige Perioden später. Nicht, Term Prognosen aus dem SMA Mod El sind eine horizontale gerade Linie, genauso wie im zufälligen Spaziergangmodell So geht das SMA-Modell davon aus, dass es keinen Trend in den Daten gibt. Allerdings sind die Prognosen aus dem zufälligen Walk-Modell einfach gleich dem letzten beobachteten Wert, die Prognosen von Das SMA-Modell ist gleich einem gewichteten Durchschnitt der jüngsten Werte. Die von Statgraphics für die Langzeitprognosen des einfachen gleitenden Durchschnittes berechneten Konfidenzgrenzen werden nicht größer, wenn der Prognosehorizont zunimmt. Dies ist offensichtlich nicht korrekt. Leider gibt es keinen zugrunde liegenden Statistische Theorie, die uns sagt, wie sich die Konfidenzintervalle für dieses Modell erweitern sollten. Allerdings ist es nicht zu schwer, empirische Schätzungen der Vertrauensgrenzen für die längerfristigen Prognosen zu berechnen. Zum Beispiel könnten Sie eine Tabellenkalkulation erstellen, in der das SMA-Modell steht Würde zur Vorhersage von 2 Schritten voraus, 3 Stufen voraus, etc. innerhalb der historischen Daten Probe Sie konnten dann die Probe Standardabweichungen der Fehler bei jeder Prognose h Orizon, und konstruieren dann Konfidenzintervalle für längerfristige Prognosen durch Hinzufügen und Subtrahieren von Vielfachen der entsprechenden Standardabweichung. Wenn wir einen 9-fach einfach gleitenden Durchschnitt versuchen, bekommen wir noch glattere Prognosen und mehr von einem nacheilenden Effekt. Das Durchschnittsalter ist Jetzt 5 Perioden 9 1 2 Wenn wir einen 19-fachen gleitenden Durchschnitt nehmen, steigt das Durchschnittsalter auf 10.Notice, dass die Prognosen in der Tat hinter den Wendepunkten um etwa 10 Perioden zurückbleiben. Welche Glättung ist am besten für diese Serie Hier ist eine Tabelle, die ihre Fehlerstatistiken vergleicht, auch einen 3-Term-Durchschnitt. Model C, der 5-fache gleitende Durchschnitt, ergibt den niedrigsten Wert von RMSE um eine kleine Marge über die 3-Term - und 9-Term-Mittelwerte und Ihre anderen stats sind fast identisch Also, bei Modellen mit sehr ähnlichen Fehlerstatistiken können wir wählen, ob wir ein wenig mehr Reaktionsfähigkeit oder ein wenig mehr Glätte in den Prognosen bevorzugen. Zurück zum Seitenanfang. Brown s Simple Exponential Glättung exponentiell gewichtet Gleitender Durchschnitt. Das oben beschriebene einfache gleitende Durchschnittsmodell hat die unerwünschte Eigenschaft, dass es die letzten k Beobachtungen gleichermaßen behandelt und alle vorherigen Beobachtungen vollständig ignoriert. Intuitiv sollten die vergangenen Daten in einer allmählicheren Weise diskontiert werden - zum Beispiel die jüngste Beobachtung sollte Bekomme ein bisschen mehr Gewicht als die 2. jüngsten, und die 2. jüngsten sollte ein bisschen mehr Gewicht als die 3. letzte, und so weiter Die einfache exponentielle Glättung SES Modell erreicht dies. Let bezeichnen eine Glättung Konstante eine Zahl zwischen 0 und 1 Eine Möglichkeit, das Modell zu schreiben, besteht darin, eine Reihe L zu definieren, die die aktuelle Ebene repräsentiert, dh der mittlere Mittelwert der Reihe, wie sie von den Daten bis zur Gegenwart geschätzt wird. Der Wert von L zum Zeitpunkt t wird rekursiv aus seinem eigenen vorherigen Wert wie dieser berechnet. Somit ist der aktuelle geglättete Wert eine Interpolation zwischen dem vorherigen geglätteten Wert und der aktuellen Beobachtung, wo die Nähe des interpolierten Wertes auf die meisten re Cent Beobachtung Die Prognose für die nächste Periode ist einfach der aktuelle geglättete Wert. Egalentlich können wir die nächste Prognose direkt in Bezug auf vorherige Prognosen und vorherige Beobachtungen in einer der folgenden gleichwertigen Versionen ausdrücken. In der ersten Version ist die Prognose eine Interpolation Zwischen vorheriger Prognose und vorheriger Beobachtung. In der zweiten Version wird die nächste Prognose durch Anpassung der vorherigen Prognose in Richtung des vorherigen Fehlers um einen Bruchteil erreicht. Ist der Fehler zum Zeitpunkt t In der dritten Version ist die Prognose ein Exponentiell gewichtet, dh ermäßigt gleitender Durchschnitt mit Rabattfaktor 1.Die Interpolationsversion der Prognoseformel ist die einfachste zu verwenden, wenn Sie das Modell auf einer Tabellenkalkulation implementieren, die es in eine einzelne Zelle passt und enthält Zellreferenzen, die auf die vorherige Prognose hinweisen, die vorherige Beobachtung und die Zelle, wo der Wert von gespeichert ist. Hinweis, dass, wenn 1, ist das SES-Modell gleichbedeutend mit einem zufälligen Spaziergang Modell Witz Hout-Wachstum Wenn 0, ist das SES-Modell äquivalent zum mittleren Modell, vorausgesetzt, dass der erste geglättete Wert gleich dem mittleren Return to top of page gesetzt ist. Das Durchschnittsalter der Daten in der einfach-exponentiellen Glättungsprognose ist 1 relativ Zu dem Zeitraum, für den die Prognose berechnet wird. Dies soll nicht offensichtlich sein, aber es kann leicht durch die Auswertung einer unendlichen Reihe gezeigt werden. Daher ist die einfache gleitende Durchschnittsprognose dazu neigt, hinter den Wendepunkten um etwa 1 Perioden zurückzukehren 5 die Verzögerung ist 2 Perioden, wenn 0 2 die Verzögerung 5 Perioden beträgt, wenn 0 1 die Verzögerung 10 Perioden ist, und so weiter. Für ein gegebenes Durchschnittsalter dh Betrag der Verzögerung, ist die einfache exponentielle Glättung SES Prognose etwas überlegen, die einfache Bewegung Durchschnittliche SMA-Prognose, weil sie relativ viel Gewicht auf die jüngste Beobachtung - es ist etwas mehr reagiert auf Veränderungen in der jüngsten Vergangenheit Zum Beispiel ein SMA-Modell mit 9 Begriffe und ein SES-Modell mit 0 2 haben beide ein Durchschnittsalter Von 5 für die da Ta in ihren Prognosen, aber das SES-Modell setzt mehr Gewicht auf die letzten 3 Werte als das SMA-Modell und zugleich vergisst es nicht ganz über Werte, die mehr als 9 Perioden alt sind, wie in dieser Tabelle gezeigt. Ein anderer wichtiger Vorteil von Das SES-Modell über das SMA-Modell ist, dass das SES-Modell einen Glättungsparameter verwendet, der stufenlos variabel ist, so dass er leicht mit einem Solver-Algorithmus optimiert werden kann, um den mittleren quadratischen Fehler zu minimieren. Der optimale Wert des SES-Modells für diese Serie erweist sich Um 0 2961 zu sein, wie hier gezeigt. Das Durchschnittsalter der Daten in dieser Prognose beträgt 1 0 2961 3 4 Perioden, was ähnlich ist wie bei einem 6-fach einfach gleitenden Durchschnitt. Die langfristigen Prognosen aus dem SES-Modell sind Eine horizontale Gerade wie im SMA-Modell und das zufällige Spaziergang Modell ohne Wachstum Allerdings ist zu beachten, dass die von Statgraphics berechneten Konfidenzintervalle nun in einer vernünftig aussehenden Weise abweichen und dass sie wesentlich schmaler sind als die Konfidenzintervalle für den Rand Om walk model Das SES-Modell geht davon aus, dass die Serie etwas vorhersehbarer ist als das zufällige Walk-Modell. Ein SES-Modell ist eigentlich ein Spezialfall eines ARIMA-Modells, so dass die statistische Theorie der ARIMA-Modelle eine fundierte Grundlage für die Berechnung von Konfidenzintervallen für die SES-Modell Insbesondere ist ein SES-Modell ein ARIMA-Modell mit einer nicht-seasonalen Differenz, einem MA 1-Term und keinem konstanten Term, der sonst als ARIMA-0,1,1-Modell ohne Konstante bekannt ist. Der MA 1 - Koeffizient im ARIMA-Modell entspricht dem Menge 1 im SES-Modell Wenn Sie beispielsweise ein ARIMA-0,1,1-Modell ohne Konstante an die hier analysierte Baureihe anpassen, erweist sich der geschätzte MA 1 - Koeffizient auf 0 7029, was fast genau ein minus 0 2961 ist. Es ist möglich, die Annahme eines nicht-null konstanten linearen Trends zu einem SES-Modell hinzuzufügen. Dazu geben Sie einfach ein ARIMA-Modell mit einer nicht-seasonalen Differenz und einem MA 1-Term mit einer Konstante, dh einem ARIMA 0,1,1-Modell an Mit konstanten Die langfristigen prognosen werden Dann haben Sie einen Trend, der gleich der durchschnittlichen Tendenz ist, die über die gesamte Schätzperiode beobachtet wird. Sie können dies nicht in Verbindung mit saisonaler Anpassung tun, da die saisonalen Anpassungsoptionen deaktiviert sind, wenn der Modelltyp auf ARIMA eingestellt ist. Allerdings können Sie eine konstante Länge hinzufügen - Exponentieller Trend zu einem einfachen exponentiellen Glättungsmodell mit oder ohne saisonale Anpassung durch Verwendung der Inflationsanpassungsoption im Prognoseverfahren Die entsprechende Inflationsrate pro Wachstumsrate pro Periode kann als der Steigungskoeffizient in einem linearen Trendmodell, das an die Daten angepasst ist, geschätzt werden Konjunktion mit einer natürlichen Logarithmus-Transformation, oder sie kann auf anderen, unabhängigen Informationen über langfristige Wachstumsaussichten basieren. Zurück zum Seitenanfang. Brown s Linear ie doppelte exponentielle Glättung. Die SMA-Modelle und SES-Modelle gehen davon aus, dass es keinen Trend gibt Jede Art in den Daten, die in der Regel ok oder zumindest nicht zu schlecht für 1-Schritt-voraus Prognosen, wenn die Daten relativ noi ist Sy, und sie können modifiziert werden, um einen konstanten linearen Trend wie oben gezeigt zu integrieren. Was ist mit kurzfristigen Trends Wenn eine Serie eine unterschiedliche Wachstumsrate oder ein zyklisches Muster zeigt, das sich deutlich gegen den Lärm auszeichnet und wenn es nötig ist Prognose mehr als 1 Periode voraus, dann könnte die Schätzung eines lokalen Trends auch ein Problem sein Das einfache exponentielle Glättungsmodell kann verallgemeinert werden, um ein lineares exponentielles Glättungs-LES-Modell zu erhalten, das lokale Schätzungen von Level und Trend berechnet. Der einfachste zeitveränderliche Trend Modell ist Brown s lineares exponentielles Glättungsmodell, das zwei verschiedene geglättete Serien verwendet, die zu verschiedenen Zeitpunkten zentriert sind Die Prognoseformel basiert auf einer Extrapolation einer Linie durch die beiden Zentren Eine ausgefeiltere Version dieses Modells, Holt s, ist Unten diskutiert. Die algebraische Form von Brown s linearen exponentiellen Glättungsmodell, wie das des einfachen exponentiellen Glättungsmodells, kann in einer Anzahl von verschiedenen, aber e ausgedrückt werden Quivalentformen Die Standardform dieses Modells wird gewöhnlich wie folgt ausgedrückt: S bezeichnet die einfach geglättete Reihe, die durch Anwendung einer einfachen exponentiellen Glättung auf die Reihe Y erhalten wird. Das heißt, der Wert von S in der Periode t ist gegeben durch. Erinnern Sie sich, dass unter einfacher exponentieller Glättung dies die Prognose für Y in der Periode t 1 sein würde. Dann sei S die doppelt geglättete Reihe, die durch Anwendung einer einfachen exponentiellen Glättung unter Verwendung derselben zu der Reihe S erhalten wird. Zunächst ist die Prognose für Y tk für irgendwelche K & sub1 ;, ist gegeben durch. Dies ergibt e 1 0, dh ein wenig zu betrügen, und die erste Prognose gleich der tatsächlichen ersten Beobachtung und e 2 Y 2 Y 1, wonach Prognosen unter Verwendung der obigen Gleichung erzeugt werden, ergibt die gleichen angepassten Werte Als die auf S und S basierende Formel, wenn diese mit S 1 S 1 Y 1 gestartet wurden Diese Version des Modells wird auf der nächsten Seite verwendet, die eine Kombination von exponentieller Glättung mit saisonaler Anpassung veranschaulicht. Holt s Linear Exponential Smoothing. Brown S LES-Modell berechnet lokale Schätzungen von Level und Trend durch Glättung der jüngsten Daten, aber die Tatsache, dass es tut dies mit einem einzigen Glättungsparameter stellt eine Einschränkung auf die Datenmuster, dass es in der Lage ist, die Ebene und Trend sind nicht erlaubt, variieren beim Unabhängige Raten Holt s LES Modell adressiert dieses Problem durch die Einbeziehung von zwei Glättungskonstanten, eine für die Ebene und eine für den Trend Zu jeder Zeit t, wie in Browns Modell, gibt es eine Schätzung L t der lokalen Ebene und eine Schätzung T T des lokalen Tendenzes Hier werden sie rekursiv aus dem Wert von Y, der zum Zeitpunkt t beobachtet wurde, und den vorherigen Schätzungen des Niveaus und des Tendenzes durch zwei Gleichungen berechnet, die eine exponentielle Glättung für sie separat anwenden. Wenn das geschätzte Niveau und der Trend zum Zeitpunkt t-1 Sind L t 1 bzw. T t-1, so ist die Prognose für Y t, die zum Zeitpunkt t-1 gemacht worden wäre, gleich L t-1 T t-1. Wenn der Istwert beobachtet wird, wird die aktualisierte Schätzung der Level wird rekursiv durch Interpolation zwischen Y t und seiner Prognose L t-1 T t-1 berechnet, wobei Gewichte von und 1 verwendet werden. Die Änderung des geschätzten Pegels, nämlich L t L t 1, kann als eine verrauschte Messung der Trend zur Zeit t Die aktualisierte Schätzung des Trends wird dann rekursiv durch Interpolation zwischen L berechnet T L t 1 und die vorherige Schätzung des Trends T t-1 unter Verwendung von Gewichten von und 1.Die Interpretation der Trend-Glättungskonstante ist analog zu der der Pegel-Glättungs-Konstante. Modelle mit kleinen Werten gehen davon aus, dass sich der Trend ändert Nur sehr langsam im Laufe der Zeit, während Modelle mit größeren davon ausgehen, dass es sich schneller ändert Ein Modell mit einem großen glaubt, dass die ferne Zukunft sehr unsicher ist, denn Fehler in der Trendschätzung werden bei der Prognose von mehr als einer Periode voraus Der Seite. Die Glättungskonstanten und können in der üblichen Weise durch Minimierung des mittleren quadratischen Fehlers der 1-Schritt-voraus-Prognosen geschätzt werden. Wenn dies in Statgraphics geschieht, ergeben sich die Schätzungen als 0 3048 und 0 008 Der sehr kleine Wert von Bedeutet, dass das Modell eine sehr geringe Veränderung im Trend von einer Periode zur nächsten einnimmt, so dass dieses Modell grundsätzlich versucht, einen langfristigen Trend abzuschätzen. Analog zu dem Begriff des Durchschnittsalters der Daten, die bei der Schätzung von t verwendet werden Die lokale Ebene der Serie, das Durchschnittsalter der Daten, die bei der Schätzung des lokalen Trends verwendet wird, ist proportional zu 1, wenn auch nicht genau gleich. In diesem Fall ergibt sich das 1 0 006 125 Dies ist eine sehr genaue Nummer Insofern als die Genauigkeit der Schätzung von isn t wirklich 3 Dezimalstellen, aber es ist von der gleichen allgemeinen Größenordnung wie die Stichprobengröße von 100, so dass dieses Modell durchschnittlich über ziemlich viel Geschichte bei der Schätzung der Trend Die Prognose Handlung ist Unten zeigt, dass das LES-Modell einen eher größeren lokalen Trend am Ende der Serie schätzt als der im SES-Trendmodell geschätzte konstante Trend. Auch der Schätzwert ist nahezu identisch mit dem, der durch die Anpassung des SES-Modells mit oder ohne Trend erhalten wird , So ist dies fast das gleiche model. Now, sehen diese aussehen wie vernünftige Prognosen für ein Modell, das soll einen lokalen Trend schätzen Wenn Sie Augapfel dieser Handlung, sieht es aus, als ob die lokale Tendenz hat sich nach unten am Ende der Serie Wh At ist passiert Die Parameter dieses Modells wurden durch die Minimierung der quadratischen Fehler von 1-Schritt-voraus Prognosen, nicht längerfristige Prognosen geschätzt, in welchem ​​Fall der Trend macht nicht viel Unterschied Wenn alles, was Sie suchen, sind 1 - step-ahead-Fehler, sehen Sie nicht das größere Bild der Trends über 10 oder 20 Perioden Um dieses Modell mehr im Einklang mit unserer Augapfel-Extrapolation der Daten zu bekommen, können wir manuell die Trend-Glättung konstant so einstellen, dass es Verwendet eine kürzere Grundlinie für Trendschätzung Wenn wir z. B. wählen, um 0 1 zu setzen, dann ist das Durchschnittsalter der Daten, die bei der Schätzung des lokalen Trends verwendet werden, 10 Perioden, was bedeutet, dass wir den Trend über die letzten 20 Perioden oder so vermitteln Hier ist das, was die Prognose-Plot aussieht, wenn wir 0 1 setzen, während wir 0 3 halten. Das sieht intuitiv vernünftig für diese Serie aus, obwohl es wahrscheinlich gefährlich ist, diesen Trend mehr als 10 Perioden in der Zukunft zu extrapolieren. Was geht es um die Fehlerstatistik Hier ist Ein Modellvergleich f Oder die beiden oben gezeigten Modelle sowie drei SES-Modelle Der optimale Wert des SES-Modells beträgt etwa 0 3, aber mit 0 oder 0 2 ergeben sich ähnliche Ergebnisse mit etwas mehr oder weniger Ansprechverhalten. Eine Holt s lineare Exp-Glättung Mit alpha 0 3048 und beta 0 008. B Holt s lineare exp Glättung mit alpha 0 3 und beta 0 1. C Einfache exponentielle Glättung mit alpha 0 5. D Einfache exponentielle Glättung mit alpha 0 3. E Einfache exponentielle Glättung mit alpha 0 2.Die Statistiken sind fast identisch, so dass wir wirklich die Wahl auf der Basis von 1-Schritt-voraus Prognose Fehler innerhalb der Daten Probe Wir müssen auf andere Überlegungen zurückfallen Wenn wir stark glauben, dass es sinnvoll ist, die aktuelle Basis zu stützen Trend-Schätzung, was in den letzten 20 Perioden passiert ist, so können wir einen Fall für das LES-Modell mit 0 3 und 0 1 machen. Wenn wir agnostisch sein wollen, ob es einen lokalen Trend gibt, dann könnte eines der SES-Modelle Sei leichter zu erklären und würde auch mehr middl geben E-of-the-road Prognosen für die nächsten 5 oder 10 Perioden Zurück zum Seitenanfang. Welche Art der Trend-Extrapolation ist am besten horizontal oder linear Empirische Hinweise deuten darauf hin, dass, wenn die Daten bereits angepasst wurden, wenn nötig für die Inflation, dann Es kann unklug sein, kurzfristige lineare Trends sehr weit in die Zukunft zu extrapolieren Trends, die heute deutlich sichtbar sind, können aufgrund unterschiedlicher Ursachen wie Produktveralterung, verstärkte Konkurrenz und zyklische Abschwünge oder Aufschwünge in einer Branche aus diesem Grund einfacher exponentieller Fall sein Glättung führt oft zu einem besseren Out-of-Sample, als es sonst zu erwarten wäre, trotz seiner naiven horizontalen Trend-Extrapolation Dämpfte Trendmodifikationen des linearen exponentiellen Glättungsmodells werden auch in der Praxis häufig verwendet, um eine Note des Konservatismus in seine Trendprojektionen einzuführen. Der gedämpfte Trend LES-Modell kann als Spezialfall eines ARIMA-Modells implementiert werden, insbesondere ein ARIMA 1,1,2-Modell. Es ist möglich, Konfidenzintervalle zu berechnen Langfristige Prognosen, die durch exponentielle Glättungsmodelle erzeugt werden, indem sie sie als Sonderfälle von ARIMA-Modellen betrachten. Vorsicht nicht, dass alle Software die Konfidenzintervalle für diese Modelle korrekt berechnet. Die Breite der Konfidenzintervalle hängt von dem RMS-Fehler des Modells ab Von Glättung einfach oder linear iii der Wert s der Glättungskonstante s und iv die Anzahl der vorangegangenen Perioden, die Sie prognostizieren Im Allgemeinen breiten sich die Intervalle schneller aus, wenn sie im SES-Modell größer werden und sie breiten sich viel schneller aus, wenn linear und nicht einfach Glättung wird verwendet Dieses Thema wird weiter im ARIMA-Modell-Abschnitt der Notizen diskutiert Zurück zum Seitenanfang. Eine kurze Einführung in die moderne Zeitreihe. Definition Eine Zeitreihe ist eine zufällige Funktion xt eines Arguments t in einem Satz T Mit anderen Worten , Eine Zeitreihe ist eine Familie von zufälligen Variablen x t-1 xtxt 1, die allen Elementen in der Menge T entspricht, wobei T eine abzählbare, unendliche Menge sein soll Serie tt T o T gilt als Teil einer Realisierung einer zufälligen Funktion xt Ein unendlicher Satz möglicher Realisierungen, die man beobachten könnte, heißt Ensemble. Um die Dinge rigoroser zu machen, ist die Zeitreihe oder die zufällige Funktion eine echte Funktion Xw, t der beiden Variablen w und t, wobei wW und t T Wenn wir den Wert von w festlegen, haben wir eine reelle Funktion xtw der Zeit t, die eine Realisierung der Zeitreihe ist Wenn wir den Wert von t festlegen, Dann haben wir eine zufällige Variable xwt Für einen gegebenen Zeitpunkt gibt es eine Wahrscheinlichkeitsverteilung über x So kann eine zufällige Funktion xw, t entweder als eine Familie von zufälligen Variablen oder als eine Familie von Realisierungen betrachtet werden. Drosselung Wir definieren die Verteilungsfunktion Der zufälligen Variablen w mit t 0 als P oxx Ähnlich können wir die gemeinsame Verteilung für n zufällige Variablen definieren. Punkte, die die Zeitreihenanalyse von gewöhnlichen statistischen Analysen unterscheiden, sind die folgenden 1 Die Abhängigkeit zwischen Beobachtungen bei verschiedenen chro Nologische Punkte in der Zeit spielt eine wesentliche Rolle Mit anderen Worten, die Reihenfolge der Beobachtungen ist wichtig In der gewöhnlichen statistischen Analyse wird davon ausgegangen, dass die Beobachtungen voneinander unabhängig sind 2 Die Domäne von t ist unendlich 3 Wir müssen aus einer Realisierung die Verwirklichung machen Der zufälligen Variablen kann nur einmal zu jedem Zeitpunkt beobachtet werden In der multivariaten Analyse haben wir viele Beobachtungen auf einer endlichen Anzahl von Variablen Dieser kritische Unterschied erfordert die Annahme der Stationarität. Definition Die zufällige Funktion xt heißt streng streng stationär, wenn alle Endliche dimensionale Verteilungsfunktionen, die xt definieren, bleiben gleich, auch wenn die ganze Gruppe von Punkten t 1 t 2 tn entlang der Zeitachse verschoben wird. Wenn also für irgendwelche ganzzahligen t 1 t 2 tn und k grafisch man die Realisierung darstellen könnte Eine streng stationäre Serie, die nicht nur das gleiche Niveau in zwei verschiedenen Intervallen hat, sondern auch die gleiche Verteilungsfunktion bis hin zum Parame Die es definieren Die Annahme der Stationarität macht unser Leben einfacher und weniger kostspielig Ohne Stationarität müssten wir den Prozeß zu jedem Zeitpunkt häufig abtasten, um eine Charakterisierung der Verteilungsfunktionen in der früheren Definition aufzubauen. Stationarität bedeutet, dass wir uns beschränken können Unsere Aufmerksamkeit auf einige der einfachsten numerischen Funktionen, dh die Momente der Verteilungen Die zentralen Momente sind gegeben durch Definition i Der Mittelwert der Zeitreihe t ist dh das Moment der ersten Ordnung ii Die Autokovarianzfunktion von t ist die zweite Moment über den Mittelwert Wenn ts dann haben Sie die Varianz von xt Wir verwenden, um die Autokovarianz einer stationären Serie zu bezeichnen, wobei k die Differenz zwischen t und s iii bezeichnet. Die Autokorrelationsfunktion ACF von t ist. Wir verwenden, um die Autokorrelation zu bezeichnen Einer stationären Reihe, wobei k die Differenz zwischen t und s iv bezeichnet. Die partielle Autokorrelation PACF f kk ist die Korrelation zwischen zt und ztk nach re Bewegen ihrer gegenseitigen linearen Abhängigkeit von den dazwischenliegenden Variablen zt 1 zt 2 zt k-1 Ein einfacher Weg, um die partielle Autokorrelation zwischen zt und ztk zu berechnen, besteht darin, die beiden Regressionen auszuführen. Sie berechnen die Korrelation zwischen den beiden Restvektoren oder nach der Messung der Variablen als Abweichungen von ihren Mitteln, kann die partielle Autokorrelation als der LS-Regressionskoeffizient auf zt im Modell gefunden werden. Dort, wo der Punkt über die Variable anzeigt, dass er als Abweichung von seinem Mittelwert v gemessen wird, geben die Yule-Walker-Gleichungen eine wichtige Rolle Beziehung zwischen den partiellen Autokorrelationen und den Autokorrelationen Multiplizieren Sie beide Seiten von Gleichung 10 mit zt kj und nehmen Sie Erwartungen Diese Operation gibt uns die folgende Differenzgleichung in den Autokovarianzen. or, in Bezug auf die Autokorrelationen. Diese scheinbar einfache Darstellung ist wirklich ein mächtiges Ergebnis , Für j 1,2 k können wir das volle Gleichungssystem schreiben, das als die Yule-Walker-Gleichungen bekannt ist. Von der linearen Algebra y Ou wissen, dass die Matrix von rs von voller Rang ist Daher ist es möglich, Cramer s Regel sukzessive für k 1,2 anzuwenden, um das System für die partiellen Autokorrelationen zu lösen Die ersten drei sind Wir haben drei wichtige Ergebnisse auf streng stationäre Serie. Die Implikation Ist, dass wir jede endliche Realisierung der Sequenz verwenden können, um die mittlere Sekunde zu schätzen, wenn t streng stationär ist und E t 2 dann ist. Implizit ist, dass die Autokovarianz nur von der Differenz zwischen t und s abhängt, nicht von ihrem chronologischen Zeitpunkt in der Zeit Wir Könnte jedes Paar von Intervallen bei der Berechnung der Autokovarianz verwenden, solange die Zeit zwischen ihnen konstant war. Und wir können jede endliche Verwirklichung der Daten verwenden, um die Autokovarianzen zu schätzen Drittens ist die Autokorrelationsfunktion bei einer strengen Stationarität gegeben durch. Die Implikation ist, dass die Autokorrelation nur von der Differenz zwischen t und s abhängt, und wieder können sie durch eine endliche Verwirklichung der Daten geschätzt werden. Wenn unser Ziel i S, um Parameter zu beschätzen, die die möglichen Realisierungen der Zeitreihen beschreiben, dann ist vielleicht eine strenge Stationarität zu restriktiv. Wenn zum Beispiel die Mittelwerte und Kovarianzen von xt konstant und unabhängig vom chronologischen Zeitpunkt sind, dann ist es vielleicht nicht wichtig Zu uns, dass die Verteilungsfunktion für verschiedene Zeitintervalle gleich ist. Definition Eine zufällige Funktion ist im weiten Sinne stationär oder schwach stationär oder stationär in Khinchins Sinn oder Kovarianz stationär, wenn m 1 tm und m 11 t, s. Strict Stationarität bedeutet nicht an sich schwache Stationarität Schwache Stationarität bedeutet nicht strenge Stationarität Strenge Stationarität mit E t 2 impliziert eine schwache Stationarität. Ergodische Theoreme beschäftigen sich mit der Frage nach den notwendigen und hinreichenden Bedingungen, um aus einer einzigen Realisierung einer Zeitreihe grundsätzlich zu schließen Es kocht ab, um eine schwache Stationarität zu übernehmen. Theorem Wenn t schwach stationär ist mit mittlerem m und Kovarianzfunktion, dann. Das heißt, für irgendwelche e 0 und h 0 gibt es eine gewisse Anzahl T o, so dass für alle TT o genau dann, wenn. Diese notwendige und hinreichende Bedingung ist, dass die Autokovarianzen aussterben, wobei in diesem Fall die Stichprobe ein konsistenter Schätzer ist Für die Bevölkerung bedeutet. Kollegium Wenn t schwach stationär mit E tkxt 2 für jedes t ist und E tkxtxtskxts unabhängig von t für irgendeine ganze Zahl s ist, dann. if und nur wenn wo. A eine Folge der Korollar ist die Annahme, dass xtxtk ist Schwach stationär Das Ergodische Theorem ist nicht mehr als ein Gesetz von großer Zahl, wenn die Beobachtungen korreliert sind. Man könnte an dieser Stelle über die praktischen Implikationen der Stationarität fragen. Die häufigste Anwendung der Verwendung von Zeitreihentechniken ist die Modellierung makroökonomischer Daten, sowohl theoretisch Und atheoretisch Als Beispiel für das erstere könnte man ein Multiplikator-Beschleuniger-Modell haben Für das Modell, das stationär sein soll, müssen die Parameter bestimmte Werte haben. Ein Test des Modells ist dann, um die releva zu sammeln Nt-Daten und schätzen die Parameter Wenn die Schätzungen nicht mit der Stationarität übereinstimmen, dann muss man entweder das theoretische Modell oder das statisticla-Modell oder beides überdenken. Wir haben jetzt genügend Maschinen, um über die Modellierung von univaraten Zeitreihendaten zu sprechen Vier Schritte im Prozess 1 Bauprogramme aus theoretischen und oder erfahrungswissenden 2 identifizieren Modelle auf der Grundlage der Daten beobachteten Serie 3 Anpassung der Modelle Schätzung der Parameter des Modells s 4 Überprüfung des Modells Wenn im vierten Schritt sind wir nicht zufrieden sind wir zurück zu Schritt 1 Der Prozeß ist iterativ, bis eine weitere Überprüfung und Respecifikation keine weitere Verbesserung der Ergebnisse liefert. Schematisch. Definition Einige einfache Operationen beinhalten folgendes Der Backshift-Operator Bx tx t-1 Der Vorwärtsoperator Fx txt 1 Der Differenzoperator 1 - B xtxt - x t -1 Der Differenzoperator verhält sich in einer Weise, die mit der Konstanten in einer unendlichen Reihe übereinstimmt. Das ist, seine umgekehrte ist die limi T einer unendlichen Summe, nämlich -1 1-B -1 1 1-B 1 BB 2 Der Integrationsoperator S -1 Da es sich um den Inversen des Differenzoperators handelt, dient der Integrationsoperator dazu, die Summe zu bilden. MODELBAU In diesem Abschnitt Wir bieten eine kurze Übersicht über die gebräuchlichste Art von Zeitreihenmodellen Auf der Grundlage eines Wissens über den Datenerzeugungsprozess entnimmt man eine Klasse von Modellen zur Identifikation und Schätzung aus den folgenden Möglichkeiten. Definition Angenommen, Ex tm ist unabhängig Von t Ein Modell wie bei den Merkmalen heißt das autoregressive Modell der Ordnung p, AR p. Definition Wenn ein zeitabhängiger variabler stochastischer Prozeß t erfüllt, dann gilt t die Markov-Eigenschaft. Auf der LHS ist die Erwartung auf die Unendliche Geschichte von xt Auf der RHS ist es nur auf einen Teil der Geschichte konditioniert Von den Definitionen wird ein AR p-Modell gesehen, um die Markov-Eigenschaft zu befriedigen Mit dem Backshift-Operator können wir unser AR-Modell als Theorem A schreiben und suff Dass der AR p-Modell stationär ist, dass alle Wurzeln des Polynoms außerhalb des Einheitskreises liegen. Beispiel 1 Betrachten Sie die AR 1 Die einzige Wurzel von 1 - f 1 B 0 ist B 1 f 1 Die Bedingung für Die Stationarität verlangt dies. Wenn dann die beobachtete Reihe sehr frenetisch erscheinen wird, wenn der weiße Rauschbegriff eine normale Verteilung mit einer Null-Mittelzahl und eine Varianz von Eins hat. Die Beobachtungen wechseln mit fast jeder Beobachtung ein. Wenn auf der anderen Seite Hand, dann wird die beobachtete Reihe viel glatter sein. In dieser Reihe neigt eine Beobachtung dazu, über 0 zu sein, wenn ihr Vorgänger über Null war. Die Varianz von et ist se 2 für alle t Die Varianz von xt, wenn es null hat, ist gegeben durch Da die Serie stationär ist, können wir also schreiben. Die Autokovarianzfunktion einer AR-1-Serie ist, ohne Verlust der Allgemeinheit m 0 zu sehen. Um zu sehen, was das in den AR-Parametern aussieht, werden wir von der Tatsache Gebrauch machen, dass wir können Schreiben Sie xt wie folgt. Multiping durch x tk und nehmen e Xpectations. Hinweis, dass die Autokovarianzen aussterben als k wächst Die Autokorrelationsfunktion ist die Autokovarianz geteilt durch die Varianz des weißen Rauschbegriffs Oder unter Verwendung der früheren Yule-Walker-Formeln für die partiellen Autokorrelationen, die wir haben. Für eine AR 1 sterben die Autokorrelationen aus Exponentiell und die partiellen Autokorrelationen zeigen eine Spike bei einer Verzögerung und sind danach Null. Beispiel 2 Betrachten Sie die AR 2 Das zugehörige Polynom im Lagoperator ist. Die Wurzeln konnten mit der quadratischen Formel gefunden werden. Die Wurzeln sind. Wenn die Wurzeln real sind und Infolgedessen wird die Reihe exponentiell in Reaktion auf einen Schock abnehmen Wenn die Wurzeln komplex sind und die Reihe als gedämpfte Zeichenwelle erscheinen wird. Das Stationaritätssatz setzt die folgenden Bedingungen auf die AR-Koeffizienten auf. Die Autokovarianz für einen AR 2 - Prozeß mit Null gemein ist. Die Durchdringung durch die Varianz von xt gibt die Autokorrelationsfunktion Da können wir schreiben Ähnlich für die zweite und dritte Autokorrelationen Es werden Autokorrelationen für rekursiv gelöst. Ihr Muster wird durch die Wurzeln der linearen Differenzengleichung zweiter Ordnung bestimmt. Wenn die Wurzeln real sind, werden die Autokorrelationen exponentiell abnehmen. Wenn die Wurzeln komplex sind, erscheinen die Autokorrelationen als gedämpfte Sinuswelle. Mit dem Yule - Walker-Gleichungen, die partiellen Autokorrelationen sind. Again, die Autokorrelationen sterben langsam Die partielle Autokorrelation auf der anderen Seite ist ganz unverwechselbar Es hat Spikes an ein und zwei Lags und ist null danach. orem Wenn xt ist ein stationärer AR-Prozess, dann kann es Gleichwertig als lineares Filtermodell geschrieben Das heißt, das Polynom im Backshift-Operator kann invertiert werden und das AR p als gleitender Durchschnitt der unendlichen Ordnung stattdessen geschrieben werden. Beispiel Angenommen, zt ist ein AR 1 - Verfahren mit Null-Mittel Was gilt für die Gegenwärtige Periode muss auch für vorherige Perioden wahr sein. Durch rekursive Substitution können wir schreiben. Square beide Seiten und nehmen Erwartungen. die rechte Seite vanishe S als k seit f 1 Darum konvergiert die Summe in zt im quadratischen Mittel. Wir können das AR p-Modell als linearen Filter umschreiben, das wir als stationär kennen. Die Autokorrelationsfunktion und die partielle Autokorrelation nehmen voraus, dass eine stationäre Serie zt mit mittlerem Nullpunkt ist Bekannt als autoregressiv Die Autokorrelationsfunktion eines AR p wird gefunden, indem man Erwartungen anlegt und sich durch die Varianz von z t teilt. Dies sagt uns, dass rk eine lineare Kombination der vorherigen Autokorrelationen ist. Wir können dies bei der Anwendung der Cramer-Regel verwenden Zu i bei der Lösung für f kk Insbesondere können wir sehen, dass diese lineare Abhängigkeit f kk 0 für kp verursachen wird. Diese Besonderheit der autoregressiven Serien wird sehr nützlich sein, wenn es um die Identifizierung einer unbekannten Serie geht. Wenn du entweder MathCAD oder MathCAD hast Explorer dann können Sie interactivley mit einigen der AR p Ideen präsentieren hier vorstellen. Moving Average Models Betrachten Sie ein dynamisches Modell, in dem die Serie von Interesse hängt nur von einigen Teil Der Geschichte des weißen Rauschbegriffs Schematisch könnte dies als Definition dargestellt werden. Angenommen, at ist eine unkorrelierte Folge von iid zufälligen Variablen mit null mittlerer und endlicher Varianz Dann ist ein gleitender Mittelwert der Ordnung q, MA q, gegeben durch Theorem A Gleitender Mittelprozess ist immer stationär Beweis Vielmehr mit einem allgemeinen Beweis zu beginnen, werden wir es für einen bestimmten Fall tun Angenommen, dass zt ist MA 1 Dann Natürlich hat bei null mittlere und endliche Varianz Der Mittelwert von zt ist immer null Die Autokovarianzen werden sein Gegeben durch. Sie können sehen, dass der Mittelwert der zufälligen Variablen nicht von der Zeit in irgendeiner Weise abhängt Sie können auch sehen, dass die Autokovarianz nur von dem Offset s abhängt, nicht auf wo in der Serie, die wir starten Wir können das gleiche Ergebnis mehr beweisen In der Regel, beginnend mit, die die abwechselnd gleitende durchschnittliche Darstellung hat Betrachten wir zuerst die Varianz von z t. By rekursive Substitution können Sie zeigen, dass dies gleich ist. Die Summe, die wir kennen, um eine konvergente Serie so die Varianz zu sein Ist endlich und ist unabhängig von der Zeit Die Kovarianzen sind zum Beispiel. Sie können auch sehen, dass die Auto-Kovarianzen nur von den relativen Zeitpunkten abhängen, nicht vom chronologischen Punkt in der Zeit. Unsere Schlussfolgerung aus all dem ist, dass ein MA-Prozess stationär ist Die allgemeine MA q verarbeiten die Autokorrelationsfunktion ist gegeben durch. Die partielle Autokorrelationsfunktion wird glatt auslaufen Sie können dies sehen, indem Sie den Prozess invertieren, um einen AR-Prozess zu erhalten. Wenn Sie entweder MathCAD oder MathCAD Explorer haben, können Sie interaktiv mit einigen von ihnen experimentieren Die MA q Ideen präsentiert hier. Mixed Autoregressive - Moving Average Models. Definition Angenommen, an ist eine unkorrelierte Folge von iid zufällige Variablen mit Null Mittelwert und endliche Varianz Dann ist ein autoregressiver, gleitender durchschnittlicher Prozess der Ordnung p, q, ARMA p, q, Die Wurzeln des autoregressiven Operators müssen alle außerhalb des Einheitskreises liegen Die Anzahl der Unbekannten ist pq 2 Die p und q sind offensichtlich Die 2 enthält die Ebene des Prozesses, m an D die Varianz des weißen Rauschbegriffs, sa 2.Suppulieren wir, dass wir unsere AR - und MA-Darstellungen kombinieren, so dass das Modell ist. und die Koeffizienten sind so normalisiert, dass bo 1 Dann wird diese Darstellung als ARMA p, q bezeichnet, wenn die Wurzeln von 1 alle liegen außerhalb des Einheitskreises Angenommen, dass die yt als Abweichungen vom Mittelwert gemessen werden, so dass wir ao fallen können, dann wird die Autokovarianzfunktion aus. if jq abgeleitet, dann gehen die MA-Ausdrücke in Erwartung zu geben. Das ist die Autokovarianzfunktion Sieht aus wie eine typische AR für Lags nach q sie sterben glatt nach q, aber wir können nicht sagen, wie 1,2, q wird aussehen Wir können auch die PACF für diese Klasse von Modell Das Modell kann geschrieben werden wie. Wir können schreiben Dies ist ein MA-Inf-Prozess. Das schlägt vor, dass die PACFs langsam mit irgendeiner Arithmetik aussterben, dass wir erst nach den ersten P-Spikes, die vom AR-Teil beigetragen werden, geschehen können. Empirisches Gesetz In Wirklichkeit kann eine stationäre Zeitreihe gut dargestellt werden Von p 2 und q 2 Wenn Ihr Unternehmen zu beweisen ist Ide eine gute Annäherung an die Realität und Güte der Passform ist Ihr Kriterium dann ist ein verschwenderisches Modell bevorzugt Wenn Ihr Interesse prädiktive Effizienz ist, dann ist das spärliche Modell bevorzugt. Experiment mit den ARMA Ideen, die oben mit einem MathCAD Arbeitsblatt vorgestellt. Autoregressive Integrieren Moving Average Models. MA Filter AR-Filter Filter integrieren. Manchmal ist der Prozess, oder Serien, wir versuchen zu modellieren ist nicht stationär in Ebenen Aber es könnte stationär sein, sagen, erste Unterschiede Das ist in seiner ursprünglichen Form die Autokovarianzen für die Serie nicht sein Unabhängig von der chronologischen Zeitspanne Wenn wir jedoch eine neue Serie konstruieren, die die ersten Unterschiede der Originalreihe ist, erfüllt diese neue Serie die Definition der Stationarität. Dies ist oft der Fall bei ökonomischen Daten, die stark trended. Definition Angenommen, dass zt Ist nicht stationär, aber zt - z t - 1 erfüllt die Definition der Stationarität Auch bei dem weißen Rauschbegriff hat endlich Mittelwert und Varianz Wir können w Rite das Modell as. This heißt ein ARIMA p, d, q Modell p identifiziert die Reihenfolge des AR-Operators, d identifiziert die Macht auf q identifiziert die Reihenfolge des MA-Operators Wenn die Wurzeln von f B außerhalb des Einheitskreises liegen dann Wir können die ARIMA p, d, q als linearen Filter umschreiben, ich kann es als MA schreiben. Wir behalten uns die Diskussion über die Erkennung von Einheitswurzeln für einen anderen Teil der Vorlesungsunterlagen vor. Betrachten Sie ein dynamisches System mit xt als Eingabe Serie und yt als Ausgabeserie schematisch wir haben. Diese Modelle sind eine diskrete Analogie von linearen Differentialgleichungen Wir nehmen die folgende Beziehung an. Wobei b eine reine Verzögerung anruft Erinnern Sie sich, dass 1-B Wenn Sie diese Substitution machen, kann das Modell geschrieben werden. Wenn der Koeffizient ist Polynom auf yt kann umgekehrt werden, dann kann das Modell geschrieben werden als. VB ist bekannt als die Impulsantwort Funktion Wir werden über diese Terminologie wieder in unserer späteren Diskussion der Vektor autoregressive Kointegration und Fehlerkorrektur Modelle. MODEL IDENTIFIKATION Mit de Auf eine Klasse von Modellen geklärt werden muss, muss man nun die Reihenfolge der Prozesse identifizieren, die die Daten erzeugen. Das heißt, man muss am besten über die Reihenfolge der AR - und MA-Prozesse hinausgehen, die die stationäre Serie betreiben. Eine stationäre Serie ist vollständig durch ihren Mittelwert charakterisiert Und autocovariances Aus analytischen Gründen arbeiten wir in der Regel mit den Autokorrelationen und partiellen Autokorrelationen Diese beiden Grundwerkzeuge haben einzigartige Muster für stationäre AR - und MA-Prozesse. Man könnte Stichprobenschätzungen der Autokorrelations - und Teilautokorrelationsfunktionen berechnen und mit tabellierten Ergebnissen für Standardmodelle vergleichen Autokovarianz Funktion. Sample Autokorrelation Funktion. Die Probe Teil Autokorrelationen werden. Using die Autokorrelationen und Teilautokorrelationen ist ganz einfach im Prinzip Angenommen, wir haben eine Reihe zt mit Null Mittel, was ist AR 1 Wenn wir die Regression von zt 2 laufen würde Auf zt 1 und zt würden wir erwarten zu finden, dass der Koeffizient auf zt nicht anders war M null, da diese partielle Autokorrelation null sein muss. Andererseits sollten die Autokorrelationen für diese Serie exponentiell abnehmen, um die Verzögerungen zu sehen, siehe das AR 1 Beispiel oben Angenommen, die Serie ist wirklich ein gleitender Durchschnitt. Die Autokorrelation sollte überall null sein Bei der ersten Verzögerung Die partielle Autokorrelation sollte exponentiell aussterben Auch aus unserem sehr flüchtigen Rummel durch die Grundlagen der Zeitreihenanalyse ist es offensichtlich, dass es eine Dualität zwischen AR - und MA-Prozessen gibt. Diese Dualität kann in der folgenden Tabelle zusammengefasst werden Moving Average Models MA Modelle. Time-Serienmodelle, die als ARIMA-Modelle bekannt sind, können autoregressive Begriffe und gleitende durchschnittliche Ausdrücke enthalten In Woche 1 haben wir einen autoregressiven Begriff in einem Zeitreihenmodell für die Variable xt gelernt, ist ein verzögerter Wert von xt Lag 1 autoregressiver Term ist x t-1 multipliziert mit einem Koeffizienten Diese Lektion definiert gleitende durchschnittliche Ausdrücke. Ein gleitender Durchschnittstermin in einem Zeitreihenmodell ist eine Vergangenheit e Rum multipliziert mit einem Koeffizienten. Let wt Overset N 0, Sigma 2w, was bedeutet, dass die wt identisch, unabhängig verteilt sind, jeweils mit einer Normalverteilung mit Mittelwert 0 und der gleichen Varianz. Das 1-stufige gleitende Durchschnittsmodell, das mit MA 1 bezeichnet wird Ist. Xt mu wt theta1w. Das 2. geordnete gleitende Durchschnittsmodell, das mit MA 2 bezeichnet wird, ist. Xt mu wt theta1w theta2w. Das gängige gleitende durchschnittliche Modell, das mit MA q bezeichnet wird, ist. Xt mu wt theta1w theta2w punkte thetaq. Note Viele Lehrbücher und Softwareprogramme definieren das Modell mit negativen Vorzeichen vor den Begriffen Dies ändert nicht die allgemeinen theoretischen Eigenschaften des Modells, obwohl es die algebraischen Zeichen der geschätzten Koeffizientenwerte und nicht quittierten Begriffe in Formeln für ACFs und Abweichungen Sie müssen Ihre Software überprüfen, um zu überprüfen, ob negative oder positive Zeichen verwendet wurden, um das geschätzte Modell R korrekt zu schreiben. R verwendet positive Zeichen in seinem zugrunde liegenden Modell, wie wir hier sind. Die theoretischen Eigenschaften einer Zeitreihe mit Ein MA 1 Modell. Hinweis, dass der einzige Wert ungleich Null in der theoretischen ACF ist für lag 1 Alle anderen Autokorrelationen sind 0 Also ein Beispiel ACF mit einer signifikanten Autokorrelation nur bei lag 1 ist ein Indikator für eine mögliche MA 1 Modell. Für interessierte Studenten, Beweise dieser Eigenschaften sind ein Anhang zu diesem Handout. Beispiel 1 Angenommen, dass ein MA 1 - Modell xt 10 wt 7 w t-1 ist, wo wt Overset N 0,1 Somit ist der Koeffizient 1 0 7 Th E theoretische ACF ist gegeben durch eine Handlung dieses ACF folgt. Die eben dargestellte Kurve ist die theoretische ACF für eine MA 1 mit 1 0 7 In der Praxis, eine Probe gewonnen t in der Regel bieten ein solches klares Muster Mit R, simulierten wir n 100 Sample-Werte mit dem Modell xt 10 wt 7 w t-1 wobei w t. iid N 0,1 Für diese Simulation folgt ein Zeitreihen-Plot der Sample-Daten. Wir können aus dieser Handlung viel erzählen. Die Probe ACF für die simulierte Daten folgt Wir sehen einen Spike bei Verzögerung 1, gefolgt von allgemein nicht signifikanten Werten für Verzögerungen nach 1. Beachten Sie, dass die Stichprobe ACF nicht mit dem theoretischen Muster des zugrunde liegenden MA 1 übereinstimmt, was bedeutet, dass alle Autokorrelationen für die Verzögerungen nach 1 0 sind Eine andere Probe würde eine etwas andere Probe ACF unten gezeigt haben, würde aber wahrscheinlich die gleichen breiten Features haben. Theroretische Eigenschaften einer Zeitreihe mit einem MA 2 Modell. Für das MA 2 Modell sind die theoretischen Eigenschaften die folgenden. Hinweis, dass die nur ungleich Null Werte in der theoretischen ACF sind für Verzögerungen 1 und 2 Autokorrelat Ionen für höhere Verzögerungen sind 0 Also, eine Stichprobe ACF mit signifikanten Autokorrelationen bei Verzögerungen 1 und 2, aber nicht signifikante Autokorrelationen für höhere Verzögerungen zeigt ein mögliches MA 2 Modell an. ND Die Koeffizienten sind 1 0 5 und 2 0 3 Da es sich hierbei um einen MA 2 handelt, hat der theoretische ACF nur ungleich Null-Werte nur bei Verzögerungen 1 und 2.Values ​​der beiden Nicht-Null-Autokorrelationen sind. Ein Diagramm der theoretischen ACF folgt. Wie fast immer der Fall ist, haben sich die Beispieldaten nicht gut verhalten So perfekt als Theorie Wir simulierten n 150 Sample-Werte für das Modell xt 10 wt 5 w t-1 3 w t-2 wobei w t. iid N 0,1 Die Zeitreihen-Plot der Daten folgt Wie bei der Zeitreihen-Plot für Die MA 1 Beispieldaten, können Sie t viel davon erzählen. Die Probe ACF für die simulierten Daten folgt Das Muster ist typisch für Situationen, in denen ein MA 2 - Modell nützlich sein kann Es gibt zwei statistisch signifikante Spikes bei den Verzögerungen 1 und 2 gefolgt von Nicht - signifikante Werte für andere Verzögerungen Beachten Sie, dass die Stichprobe ACF aufgrund des Stichprobenfehlers nicht übereinstimmt Das theoretische Muster genau. ACF für General MA q Modelle. Eigenschaft von MA q-Modelle im Allgemeinen ist, dass es keine Null-Autokorrelationen für die ersten q Verzögerungen und Autokorrelationen 0 für alle Verzögerungen q. Non-Eindeutigkeit der Verbindung zwischen den Werten von 1 und rho1 In MA 1 Modell Im MA 1 Modell, für jeden Wert von 1 der reziproke 1 1 gibt den gleichen Wert für. Als Beispiel, verwenden Sie 0 5 für 1 und verwenden Sie dann 1 0 5 2 für 1 Sie erhalten rho1 0 4 In beiden Fällen. Um eine theoretische Einschränkung als Invertierbarkeit zu befriedigen, beschränken wir MA 1 - Modelle, um Werte mit einem absoluten Wert kleiner als 1 zu haben. In dem gerade angegebenen Beispiel ist 1 0 5 ein zulässiger Parameterwert, wohingegen 1 1 0 5 2 nicht. Invertierbarkeit von MA-Modellen. Ein MA-Modell soll invertierbar sein, wenn es algebraisch äquivalent zu einem konvergierenden unendlichen Ordnungs-AR-Modell ist. Durch Konvergenz bedeutet das, dass die AR-Koeffizienten auf 0 abnehmen, wenn wir uns in der Zeit zurückziehen. Unverträglichkeit ist eine eingeschränkte Einschränkung Zeitreihen-Software zur Schätzung des Koeffizienten Icients von Modellen mit MA-Begriffen Es ist nicht etwas, das wir in der Datenanalyse überprüfen. Weitere Informationen über die Invertierbarkeitsbeschränkung für MA 1-Modelle finden Sie im Anhang. Advanced Theory Note Für ein MA q - Modell mit einem angegebenen ACF gibt es nur Ein invertierbares Modell Die notwendige Bedingung für die Invertierbarkeit ist, dass die Koeffizienten Werte haben, so dass die Gleichung 1- 1 y - - qyq 0 Lösungen für y hat, die außerhalb des Einheitskreises liegen. R Code für die Beispiele In Beispiel 1 haben wir die Theoretische ACF des Modells xt 10 wt 7w t-1 und dann simuliert n 150 Werte aus diesem Modell und plotten die Probe Zeitreihen und die Probe ACF für die simulierten Daten Die R-Befehle verwendet, um die theoretische ACF wurden. acfma1 ARMAacf ma c 0 7, 10 Verzögerungen von ACF für MA 1 mit theta1 0 7 Verzögerungen 0 10 erzeugt eine Variable namens Lags, die von 0 bis 10 Plot Lags, acfma1, xlim c 1,10, ylab r, Typ h, main ACF für MA 1 reicht Mit theta1 0 7 abline h 0 fügt eine horizontale Achse zum Plot hinzu E erster Befehl bestimmt die ACF und speichert sie in einem Objekt namens acfma1 unsere Wahl des Namens. Der Handlungsbefehl der 3. Befehls-Plots verzögert gegenüber den ACF-Werten für die Verzögerungen 1 bis 10 Der ylab-Parameter markiert die y-Achse und der Hauptparameter setzt einen Titel auf dem Plot. Um die numerischen Werte des ACF zu sehen, benutzen Sie einfach den Befehl acfma1. Die Simulation und Plots wurden mit den folgenden Befehlen durchgeführt. List ma c 0 7 Simuliert n 150 Werte aus MA 1 x xc 10 fügt 10 hinzu, um Mittel zu machen 10 Simulationsvorgaben bedeuten 0 Plot x, Typ b, Haupt Simuliert MA 1 Daten acf x, xlim c 1,10, Haupt-ACF für simuliert Beispieldaten In Beispiel 2 haben wir die theoretische ACF des Modells xt 10 wt 5 w t-1 3 w t-2 aufgetragen und dann n 150 Werte aus diesem Modell simuliert und die Sample-Zeitreihen und die Probe ACF für die simulierten aufgetragen Daten Die verwendeten R-Befehle waren. acfma2 ARMAacf ma c 0 5,0 3, acfma2-Verzögerungen 0 10 Plot-Verzögerungen, acfma2, xlim c 1,10, ylab r, Typ h, Haupt-ACF für MA 2 mit theta1 0 5, theta2 0 3 abline h 0 list ma c 0 5, 0 3 x xc 10 plot x, Typ b, main Simuliert MA 2 Serie acf x, xlim c 1,10, Haupt-ACF für simulierte MA 2 Daten. Appendix Nachweis der Eigenschaften von MA 1 Für interessierte Schüler sind hier Beweise für die theoretischen Eigenschaften des MA 1 Modells. Variante Text xt Text mu wt theta1 w 0 text wt text theta1w sigma 2w theta 21 sigma 2w 1 theta 21 sigma 2w. Wenn h 1, der vorherige ausdruck 1 W 2 Für jedes h 2 , Der vorhergehende Ausdruck 0 Der Grund dafür ist, dass durch die Definition der Unabhängigkeit der wt E wkwj 0 für irgendwelche kj Weiter, weil die wt haben Mittelwert 0, E wjwj E wj 2 w 2.For eine Zeitreihe. Apply dieses Ergebnis zu bekommen Die ACF, die oben gegeben wurde. Ein invertierbares MA-Modell ist eines, das als ein unendliches Auftrags-AR-Modell geschrieben werden kann, das konvergiert, so dass die AR-Koeffizienten zu 0 konvergieren, wenn wir uns unendlich zurück in der Zeit bewegen. Wir zeigen die Invertierbarkeit für das MA 1-Modell Ersatzbeziehung 2 für wt-1 in Gleichung 1. 3 zt wt theta1 z - theta1w wt theta1z - theta 2w. Die Zeit t-2 Gleichung 2 wird. Wir ersetzen dann die Beziehung 4 für w t-2 in Gleichung 3. zt wt Theta1z - theta1w wt theta1z - theta1w wt theta1z - theta1 2z theta 31.Wenn wir unendlich weitergehen wollten, würden wir das unendliche AR-Modell bekommen. Zt wt theta1 z - theta 21z theta 31z - theta 41z dots. Hinweis jedoch, dass wenn 1 1 die Koeffizienten, die die Verzögerungen von z multiplizieren, unendlich an Größe zunehmen werden, wenn wir uns in der Zeit zurückziehen Um dies zu verhindern, brauchen wir 1 1 Dies ist Die Bedingung für ein invertierbares MA 1 Modell. Unendliche Ordnung MA Modell. In Woche 3 sehen wir, dass ein AR 1 Modell in ein unendliches Auftrag MA Modell umgewandelt werden kann. Xt - mu wt phi1w phi 21w punkte phi k1 w punkte sum phi j1w. Diese Summierung der vergangenen weißen Rauschbegriffe ist als die kausale Darstellung eines AR 1 bekannt. Mit anderen Worten, xt ist ein spezieller Typ von MA mit unendlich vielen Terme Rückkehr in der Zeit Dies ist eine unendliche Ordnung MA oder MA Eine endliche Ordnung MA ist eine unendliche Ordnung AR und jede endliche Ordnung AR ist eine unendliche Ordnung MA. Recall in Woche 1, stellten wir fest, dass eine Voraussetzung für eine stationäre AR 1 ist, dass 1 1 Sei s berechnen die Var xt mit der Kausaldarstellung. Dieser letzte Schritt verwendet eine grundlegende Tatsache über geometrische Serien, die phi1 erfordert 1 sonst die Serie divergiert.


No comments:

Post a Comment