Thursday, 2 November 2017

Centered Moving Average Monatliche Daten


Bei der Berechnung eines laufenden Gleitendurchschnitts ist es sinnvoll, den Mittelwert in der mittleren Zeitperiode einzutragen. Im vorigen Beispiel haben wir den Durchschnitt der ersten 3 Zeiträume berechnet und neben der Periode 3 platziert. Wir hätten den Durchschnitt in der Mitte platzieren können Zeitintervall von drei Perioden, das heißt, neben Periode 2. Dies funktioniert gut mit ungeraden Zeitperioden, aber nicht so gut für sogar Zeitperioden. Also wo würden wir den ersten gleitenden Durchschnitt platzieren, wenn M 4 Technisch, würde der Moving Average bei t 2,5, 3,5 fallen. Um dieses Problem zu vermeiden, glätten wir die MAs unter Verwendung von M 2. So glätten wir die geglätteten Werte Wenn wir eine gerade Anzahl von Terme mitteln, müssen wir die geglätteten Werte glätten Die folgende Tabelle zeigt die Ergebnisse mit M 4.David, Ja, MapReduce ist Um auf einer großen Datenmenge zu arbeiten. Und die Idee ist, dass im Allgemeinen die Karte und reduzieren Funktionen sollte nicht kümmern, wie viele Mapper oder wie viele Reduzierer gibt es, die nur Optimierung ist. Wenn Sie sorgfältig über den Algorithmus ich gepostet denken, können Sie sehen, dass es doesn39t Angelegenheit, welche Mapper bekommt, welche Teile der Daten. Jeder Eingabesatz ist für jede reduzierte Operation verfügbar, die es benötigt. Ndash Joe K 18. September um 22:30 Im besten Fall meines Verständnisses gleitende Durchschnitt ist nicht schön Karten MapReduce-Paradigma, da seine Berechnung im Wesentlichen Schiebefenster über sortierte Daten ist, während MR Verarbeitung von nicht geschnittenen Bereichen von sortierten Daten. Lösung, die ich sehe, ist wie folgt: a) Um benutzerdefinierte Partitionierer zu implementieren, um zwei verschiedene Partitionen in zwei Ausführungen zu machen. In jedem Lauf erhalten Ihre Reduzierer verschiedene Bereiche der Daten und berechnen gleitenden Durchschnitt, wo passend, werde ich versuchen zu illustrieren: Im ersten Lauf Daten für Reduzierer sollte: R1: Q1, Q2, Q3, Q4 R2: Q5, Q6, Q7, Q8 . Hier werden Sie gleitenden Durchschnitt für einige Qs cacluate. Im nächsten Lauf sollten Ihre Reduzierer Daten wie erhalten: R1: Q1. Q6 R2: Q6. Q10 R3: Q10..Q14 Und caclulate den Rest der gleitenden Durchschnitte. Dann müssen Sie Ergebnisse zu aggregieren. Idee der benutzerdefinierten Partitionierer, dass es zwei Modi der Operation haben wird - jedes Mal in gleiche Bereiche, aber mit einigen Verschiebung. In einem Pseudocode sieht es so aus. Partition (keySHIFT) (MAXKEYnumOfPartitions) Dabei gilt: SHIFT wird aus der Konfiguration übernommen. MAXKEY-Maximalwert der Taste. Ich nehme zur Vereinfachung an, dass sie mit Null beginnen. RecordReader, IMHO ist keine Lösung, da es auf bestimmte Split beschränkt ist und kann nicht über Splits Grenze gleiten. Eine weitere Lösung wäre, um benutzerdefinierte Logik der Aufteilung der Eingangsdaten (es ist Teil der InputFormat) zu implementieren. Es kann getan werden, um 2 verschiedene Folien, ähnlich wie die Partitionierung zu tun. Beantwortet Sep 17 12 um 8: 596.2 Gleitende Mittelwerte ma 40 elecales, order 5 41 In der zweiten Spalte dieser Tabelle wird ein gleitender Durchschnitt der Ordnung 5 gezeigt, der eine Schätzung des Trendzyklus liefert. Der erste Wert in dieser Spalte ist der Durchschnitt der ersten fünf Beobachtungen (1989-1993) der zweite Wert in der 5-MA-Spalte ist der Durchschnitt der Werte 1990-1994 und so weiter. Jeder Wert in der Spalte 5-MA ist der Mittelwert der Beobachtungen in den fünf Jahren, die auf das entsprechende Jahr zentriert sind. Es gibt keine Werte für die ersten zwei Jahre oder die letzten zwei Jahre, weil wir nicht zwei Beobachtungen auf beiden Seiten haben. In der obigen Formel enthält Spalte 5-MA die Werte von Hut mit k2. Um zu sehen, wie die Trend-Schätzung aussieht, stellen wir sie zusammen mit den Originaldaten in Abbildung 6.7 dar. Grundstück 40 elecsales, HauptsacheResidential Elektrizität salesquot, ylab quotGWhquot. Xlab quotYearquot 41 Zeilen 40 ma 40 elecales, 5 41. col quotredquot 41 Beachten Sie, wie der Trend (in rot) glatter als die ursprünglichen Daten ist und erfasst die Hauptbewegung der Zeitreihe ohne alle geringfügigen Schwankungen. Das Verfahren mit gleitendem Mittel erlaubt keine Abschätzungen von T, wobei t nahe den Enden der Reihe ist, so daß sich die rote Linie nicht zu den Kanten des Graphen beiderseits erstreckt. Später werden wir anspruchsvollere Methoden der Trend-Zyklus-Schätzung verwenden, die Schätzungen nahe den Endpunkten erlauben. Die Reihenfolge des gleitenden Mittelwerts bestimmt die Glätte der Tendenzschätzung. Im Allgemeinen bedeutet eine größere Ordnung eine glattere Kurve. Die folgende Grafik zeigt die Auswirkung der Veränderung der Reihenfolge des gleitenden Durchschnitts für die privaten Stromverkaufsdaten. Einfache gleitende Mittelwerte wie diese sind meist ungerade (z. B. 3, 5, 7 usw.). Das ist also symmetrisch: In einem gleitenden Durchschnitt der Ordnung m2k1 gibt es k frühere Beobachtungen, k spätere Beobachtungen und die mittlere Beobachtung Die gemittelt werden. Aber wenn m gerade war, wäre es nicht mehr symmetrisch. Gleitende Mittelwerte der gleitenden Mittelwerte Es ist möglich, einen gleitenden Durchschnitt auf einen gleitenden Durchschnitt anzuwenden. Ein Grund hierfür besteht darin, einen gleitenden Durchschnitt gleichmäßig symmetrisch zu machen. Zum Beispiel könnten wir einen gleitenden Durchschnitt der Ordnung 4 nehmen und dann einen anderen gleitenden Durchschnitt der Ordnung 2 auf die Ergebnisse anwenden. In Tabelle 6.2 wurde dies für die ersten Jahre der australischen vierteljährlichen Bierproduktionsdaten durchgeführt. Beer2 lt - fenster 40 ausbeer, start 1992 41 ma4 lt - ma 40 beer2, bestellen 4. center FALSE 41 ma2x4 lt - ma 40 beer2, bestellen 4. center TRUE 41 Die Notation 2times4-MA in der letzten Spalte bedeutet ein 4-MA Gefolgt von einem 2-MA. Die Werte in der letzten Spalte werden durch einen gleitenden Durchschnitt der Ordnung 2 der Werte in der vorhergehenden Spalte erhalten. Beispielsweise sind die ersten beiden Werte in der 4-MA-Säule 451,2 (443410420532) 4 und 448,8 (410420532433) 4. Der erste Wert in der 2 × 4-MA-Säule ist der Durchschnitt dieser beiden: 450,0 (451.2448.8) 2. Wenn ein 2-MA einem gleitenden Durchschnitt gleicher Ordnung folgt (wie z. B. 4), wird er als zentrierter gleitender Durchschnitt der Ordnung 4 bezeichnet. Dies liegt daran, daß die Ergebnisse nun symmetrisch sind. Um zu sehen, dass dies der Fall ist, können wir die 2times4-MA wie folgt schreiben: begin hat amp frac Bigfrac (y y y y) frac (y y y y) Big amp frac y frac14y frac14y frac14y frac18y. Ende Es ist jetzt ein gewichteter Durchschnitt der Beobachtungen, aber er ist symmetrisch. Andere Kombinationen von gleitenden Durchschnitten sind ebenfalls möglich. Beispielsweise wird häufig ein 3times3-MA verwendet und besteht aus einem gleitenden Durchschnitt der Ordnung 3, gefolgt von einem anderen gleitenden Durchschnitt der Ordnung 3. Im allgemeinen sollte bei einer gleichmäßigen Ordnung MA eine gerade Ordnung MA folgen, um sie symmetrisch zu machen. Ähnlich sollte eine ungerade Ordnung MA eine ungerade Ordnung MA folgen. Schätzung des Trendzyklus mit saisonalen Daten Die häufigste Verwendung von zentrierten Bewegungsdurchschnitten ist die Schätzung des Trendzyklus aus saisonalen Daten. Betrachten Sie die 2times4-MA: hat frac y frac14y frac14y frac14y frac18y. Bei der Anwendung auf vierteljährliche Daten wird jedes Quartal des Jahres gleiches Gewicht gegeben, wie die ersten und letzten Bedingungen für das gleiche Quartal in aufeinander folgenden Jahren gelten. Infolgedessen wird die saisonale Veränderung ausgemittelt und die resultierenden Werte von Hut t haben wenig oder keine saisonale Veränderung übrig. Ein ähnlicher Effekt würde mit einem 2 × 8-MA oder einem 2 × 12-MA erhalten werden. Im allgemeinen ist ein 2-mal m-MA äquivalent zu einem gewichteten gleitenden Durchschnitt der Ordnung m1, wobei alle Beobachtungen 1 m betragen, mit Ausnahme der ersten und letzten Glieder, die Gewichte 1 (2 m) nehmen. Also, wenn die saisonale Zeit ist gleichmäßig und der Ordnung m, verwenden Sie eine 2times m-MA, um den Trend-Zyklus zu schätzen. Wenn die saisonale Periode ungerade und der Ordnung m ist, verwenden Sie eine m-MA, um den Trendzyklus abzuschätzen. Insbesondere kann ein 2 × 12-MA verwendet werden, um den Trendzyklus der monatlichen Daten abzuschätzen, und ein 7-MA kann verwendet werden, um den Trendzyklus der Tagesdaten abzuschätzen. Andere Optionen für die Reihenfolge der MA wird in der Regel in Trend-Zyklus Schätzungen durch die Saisonalität in den Daten kontaminiert werden. Beispiel 6.2 Herstellung elektrischer Geräte Abbildung 6.9 zeigt ein 2times12-MA, das auf den Index der elektrischen Ausrüstung angewendet wird. Beachten Sie, dass die glatte Linie keine Saisonalität zeigt, ist sie nahezu identisch mit dem in Abbildung 6.2 gezeigten Trendzyklus, der mit einer viel anspruchsvolleren Methode geschätzt wurde als die gleitenden Durchschnittswerte. Jede andere Wahl für die Reihenfolge des gleitenden Durchschnitts (mit Ausnahme von 24, 36 usw.) hätte zu einer glatten Linie geführt, die einige saisonale Schwankungen zeigt. Plot 40 elecequip, ylab quotNew Aufträge indexquot. (Euroregion) 41 Zeilen 40 ma 40 elecequip, bestellen 12 41. col quotredquot 41 Gewichtete gleitende Mittelwerte Kombinationen gleitender Mittelwerte ergeben gewichtete gleitende Mittelwerte. Zum Beispiel ist das oben diskutierte 2x4-MA äquivalent zu einem gewichteten 5-MA mit Gewichten, die durch frac, frac, frac, frac, frac gegeben werden. Im allgemeinen kann ein gewichtetes m-MA als Hut t sum k aj y geschrieben werden, wobei k (m-1) 2 und die Gewichte durch a, dots, ak gegeben sind. Es ist wichtig, daß die Gewichte alle auf eins addieren und daß sie symmetrisch sind, so daß aj a. Der einfache m-MA ist ein Spezialfall, bei dem alle Gewichte gleich 1m sind. Ein großer Vorteil von gewichteten gleitenden Durchschnitten ist, dass sie eine glattere Schätzung des Trendzyklus ergeben. Anstelle von Beobachtungen, die die Berechnung bei Vollgewicht verlassen und verlassen, werden ihre Gewichte langsam erhöht und dann langsam verringert, was zu einer glatteren Kurve führt. Einige spezifische Sätze von Gewichten sind weit verbreitet. Einige davon sind in Tabelle 6.3 aufgeführt.

No comments:

Post a Comment