Monday 6 February 2017

Processus Moyen De Déplacement En R

8.4 Modèles de moyenne mobile Au lieu d'utiliser les valeurs passées de la variable de prévision dans une régression, un modèle de moyenne mobile utilise des erreurs de prévision passées dans un modèle de type régression. Y c et theta e theta e dots theta e, où et est le bruit blanc. Nous appelons cela un modèle MA (q). Bien sûr, nous n'observons pas les valeurs de et, donc ce n'est pas vraiment une régression au sens usuel. Notez que chaque valeur de yt peut être considérée comme une moyenne mobile pondérée des dernières erreurs de prévision. Toutefois, les modèles de moyenne mobile ne doivent pas être confondus avec le lissage moyen mobile décrit au chapitre 6. Un modèle de moyenne mobile est utilisé pour prévoir les valeurs futures, tandis que le lissage moyen mobile est utilisé pour estimer le cycle tendanciel des valeurs passées. Figure 8.6: Deux exemples de données provenant de modèles de moyenne mobile avec des paramètres différents. A gauche: MA (1) avec y t 20e t 0.8e t-1. A droite: MA (2) avec y t e t - e t-1 0.8e t-2. Dans les deux cas, e t est le bruit blanc normalement distribué avec zéro moyen et variance un. La figure 8.6 présente certaines données d'un modèle MA (1) et d'un modèle MA (2). Modification des paramètres theta1, points, thetaq résultats dans différents modèles de séries chronologiques. Comme pour les modèles autorégressifs, la variance du terme d'erreur et ne changera que l'échelle de la série, et non pas les motifs. Il est possible d'écrire un modèle AR (p) stationnaire comme modèle MA (infty). Par exemple, en utilisant une substitution répétée, nous pouvons le démontrer pour un modèle AR (1): begin php phi1y ph php phi1y phi1y phi1y phi1y 1, la valeur de phi1k diminue à mesure que k devient plus grand. Ainsi, nous obtenons finalement un processus de MA (infty) et yt et phi1 e phi12 e phi13 e cdots. Le résultat inverse se vérifie si l'on impose certaines contraintes aux paramètres MA. Ensuite, le modèle MA est appelé inversible. C'est-à-dire que nous pouvons écrire tout processus inverse MA (q) comme un processus AR (infty). Les modèles Invertible ne sont pas simplement pour nous permettre de convertir des modèles MA en modèles AR. Ils ont aussi quelques propriétés mathématiques qui les rendent plus faciles à utiliser dans la pratique. Les contraintes d'inversibilité sont similaires aux contraintes de stationnarité. Pour un modèle MA (1): -1lttheta1lt1. Pour un modèle MA (2): -1lttheta2lt1, theta2theta1 gt-1, theta1-theta2 lt 1. Des conditions plus compliquées tiennent pour qge3. Une fois de plus, R prendra soin de ces contraintes lors de l'estimation des modèles. Moyennes de déplacement en R À ma connaissance, R n'a pas de fonction intégrée pour calculer les moyennes mobiles. En utilisant la fonction de filtrage, on peut écrire une fonction courte pour les moyennes mobiles: On peut alors utiliser la fonction sur n'importe quelle donnée: mav (data), ou mav (data, 11) si on veut spécifier un nombre différent de points de données Que les 5 tracés par défaut comme prévu: plot (mav (data)). En plus du nombre de points de données sur lesquels la moyenne, nous pouvons également changer l'argument des côtés des fonctions de filtre: sides2 utilise les deux côtés, sides1 utilise des valeurs passées seulement. Partagez ceci: Navigation des messages Navigation des commentaires Navigation des commentaires Les processus d'erreur moyenne mobile (ARMA) et les autres modèles impliquant des retards de termes d'erreur peuvent être estimés à l'aide d'instructions FIT et simulés ou prévisibles à l'aide des instructions SOLVE. Les modèles ARMA pour le processus d'erreur sont souvent utilisés pour les modèles avec des résidus autocorrélés. La macro AR peut être utilisée pour spécifier des modèles avec des processus d'erreur autorégressive. La macro MA peut être utilisée pour spécifier des modèles avec des processus d'erreur moyenne mobile. Erreurs autorégressives Un modèle avec des erreurs autorégressives de premier ordre, AR (1), a la forme alors qu'un processus d'erreur AR (2) a la forme et ainsi de suite pour les processus d'ordre supérieur. Notez que les s sont indépendants et identiquement distribués et ont une valeur attendue de 0. Un exemple d'un modèle avec une composante AR (2) est et ainsi de suite pour les processus d'ordre supérieur. Par exemple, vous pouvez écrire un modèle de régression linéaire simple avec MA (2) erreurs de moyenne mobile où MA1 et MA2 sont les paramètres de la moyenne mobile. Notez que RESID. Y est automatiquement défini par PROC MODEL comme La fonction ZLAG doit être utilisée pour les modèles MA pour tronquer la récursivité des décalages. Cela garantit que les erreurs retardées commencent à zéro dans la phase d'amorçage et ne propagent pas les valeurs manquantes lorsque des variables de période d'amorçage sont manquantes et il s'assure que les erreurs futures sont nulles plutôt que manquantes pendant la simulation ou la prévision. Pour plus de détails sur les fonctions de retard, reportez-vous à la section Lag Logic. Ce modèle écrit à l'aide de la macro MA est le suivant: Forme générale pour les modèles ARMA Le processus général ARMA (p, q) a la forme suivante Un modèle ARMA (p, q) peut être spécifié comme suit: où AR i et MA j représentent Les paramètres autorégressifs et de moyenne mobile pour les différents décalages. Vous pouvez utiliser tous les noms que vous voulez pour ces variables, et il existe de nombreuses façons équivalentes que la spécification pourrait être écrite. Les processus ARMA vectoriels peuvent également être estimés avec le MODÈLE PROC. Par exemple, un processus AR (1) à deux variables pour les erreurs des deux variables endogènes Y1 et Y2 peut être spécifié comme suit: Problèmes de convergence avec les modèles ARMA Les modèles ARMA peuvent être difficiles à estimer. Si les estimations des paramètres ne se situent pas dans la plage appropriée, les termes résiduels d'un modèle de moyenne mobile augmentent de façon exponentielle. Les résidus calculés pour les observations ultérieures peuvent être très importants ou peuvent déborder. Cela peut se produire soit parce que des valeurs de départ inappropriées ont été utilisées, soit parce que les itérations se sont éloignées de valeurs raisonnables. Il faut prendre soin de choisir les valeurs de départ pour les paramètres ARMA. Les valeurs initiales de 0,001 pour les paramètres ARMA fonctionnent habituellement si le modèle correspond bien aux données et que le problème est bien conditionné. Notez qu'un modèle MA peut souvent être approché par un modèle AR de haut niveau, et vice versa. Cela peut entraîner une collinearité élevée dans les modèles ARMA mixtes, ce qui peut entraîner un mauvais conditionnement dans les calculs et l'instabilité des paramètres estimés. Si vous avez des problèmes de convergence lors de l'estimation d'un modèle avec des processus d'erreur ARMA, essayez d'estimer par étapes. Tout d'abord, utilisez une déclaration FIT pour estimer uniquement les paramètres structurels avec les paramètres ARMA maintenus à zéro (ou à des estimations antérieures raisonnables si disponibles). Ensuite, utilisez une autre instruction FIT pour estimer les paramètres ARMA uniquement, en utilisant les valeurs des paramètres structurels de la première exécution. Puisque les valeurs des paramètres structurels sont vraisemblablement proches de leurs estimations finales, les estimations des paramètres ARMA pourraient alors converger. Enfin, utilisez une autre instruction FIT pour produire des estimations simultanées de tous les paramètres. Comme les valeurs initiales des paramètres sont maintenant susceptibles d'être très proches de leurs estimations conjointes finales, les estimations devraient converger rapidement si le modèle est approprié pour les données. AR Conditions initiales Les retards initiaux des termes d'erreur des modèles AR (p) peuvent être modélisés de différentes façons. Les méthodes de démarrage d'erreurs autorégressives supportées par les procédures SASETS sont les suivantes: Procédures minimales conditionnelles (Procédures ARIMA et MODEL) Procédures minimales inconditionnelles (procédures AUTOREG, ARIMA et MODEL) maximal (procédures AUTOREG, ARIMA et MODEL) Yule-Walker (AUTOREG Procédure AUTOREG, pour une explication et une discussion sur les mérites de différentes méthodes de démarrage AR (p). Les initialisations CLS, ULS, ML et HL peuvent être effectuées par PROC MODEL. Pour les erreurs AR (1), ces initialisations peuvent être produites comme indiqué dans le tableau 18.2. Ces méthodes sont équivalentes dans de grands échantillons. Tableau 18.2 Initialisations effectuées par PROC MODEL: AR (1) ERRORS Les retards initiaux des termes d'erreur des modèles MA (q) peuvent également être modélisés de différentes façons. Les paradigmes de démarrage d'erreur moyenne mobile suivants sont supportés par les procédures ARIMA et MODEL: les moindres carrés conditionnels les moindres carrés inconditionnels La méthode des moindres carrés conditionnels pour estimer les termes d'erreurs moyennes mobiles n'est pas optimale car elle ignore le problème de démarrage. Cela réduit l'efficacité des estimations, bien qu'elles demeurent impartiales. Les résidus retardés initiaux, qui s'étendent avant le début des données, sont supposés être 0, leur valeur inconditionnelle attendue. Ceci introduit une différence entre ces résidus et les résidus des moindres carrés généralisés pour la covariance de la moyenne mobile qui, contrairement au modèle autorégressif, persiste dans l'ensemble de données. Habituellement, cette différence converge rapidement vers 0, mais pour des processus de moyenne mobile non interchangeables, la convergence est assez lente. Pour minimiser ce problème, vous devriez avoir beaucoup de données, et les estimations des paramètres de la moyenne mobile devraient être bien dans la gamme inversible. Ce problème peut être corrigé au détriment d'écrire un programme plus complexe. On peut produire des estimations des moindres carrés inconditionnels pour le processus MA (1) en spécifiant le modèle comme suit: Les erreurs moyennes mobiles peuvent être difficiles à estimer. Vous devriez envisager d'utiliser une approximation AR (p) pour le processus de la moyenne mobile. Un processus à moyenne mobile peut généralement être bien approché par un processus autorégressif si les données n'ont pas été lissées ou différenciées. La macro AR La macro SAS AR génère des instructions de programmation pour le modèle PROC pour les modèles autorégressifs. La macro AR fait partie du logiciel SASETS et aucune option spéciale ne doit être définie pour utiliser la macro. Le processus autorégressif peut être appliqué aux erreurs d'équations structurelles ou aux séries endogènes elles-mêmes. La macro AR peut être utilisée pour les types d'autorégression suivants: autorégression vectorielle non restreinte autorégression vectorielle restreinte Autoregression univariée Pour modéliser le terme d'erreur d'une équation comme un processus autorégressif, utilisez l'instruction suivante après l'équation: Par exemple, supposons que Y est un Linéaire de X1, X2 et une erreur AR (2). Vous écririez ce modèle comme suit: Les appels à AR doivent venir après toutes les équations auxquelles s'applique le processus. L'invocation de la macro précédente, AR (y, 2), produit les instructions affichées dans la sortie LIST de la figure 18.58. Figure 18.58 Sortie d'option LIST pour un modèle AR (2) Les variables préfixées PRED sont des variables de programme temporaires utilisées de sorte que les retards des résidus sont les résidus corrects et non ceux qui sont redéfinis par cette équation. Notez que cela équivaut aux instructions explicitement écrites dans la section Formulaire général pour les modèles ARMA. Vous pouvez également restreindre les paramètres autorégressifs à zéro à des décalages sélectionnés. Par exemple, si vous voulez des paramètres autorégressifs aux lags 1, 12 et 13, vous pouvez utiliser les instructions suivantes: Ces instructions génèrent la sortie illustrée à la Figure 18.59. Figure 18.59 Sortie de l'option LIST pour un modèle AR avec Lags aux niveaux 1, 12 et 13 La liste des procédures MODEL de l'instruction de code du programme compilé est analysée PRED. yab x1 c x2 RESID. y PRED. y - ACTUAL. y ERROR. y PRED. Y-y OLDPRED. y PRED. y yl1 ZLAG1 (y-perdy) yl12 ZLAG12 (y-perdy) yl13 ZLAG13 (y-perdy) RESID. y PRED. y - ACTUAL. y ERROR. y PRED. y - y Il existe Variations selon la méthode des moindres carrés conditionnels, selon que les observations au début de la série sont utilisées pour réchauffer le processus AR. Par défaut, la méthode des moindres carrés conditionnels AR utilise toutes les observations et suppose des zéros pour les retards initiaux des termes autorégressifs. En utilisant l'option M, vous pouvez demander à AR que vous utilisiez la méthode des moindres carrés inconditionnels (ULS) ou du maximum de vraisemblance (ML). Par exemple, les discussions sur ces méthodes sont fournies dans la section AR Conditions initiales. En utilisant l'option MCLS n, vous pouvez demander que les n premières observations soient utilisées pour calculer les estimations des retards autorégressifs initiaux. Dans ce cas, l'analyse commence par l'observation n 1. Par exemple: Vous pouvez utiliser la macro AR pour appliquer un modèle autorégressif à la variable endogène, au lieu du terme d'erreur, en utilisant l'option TYPEV. Par exemple, si vous voulez ajouter les cinq décalages passés de Y à l'équation de l'exemple précédent, vous pouvez utiliser AR pour générer les paramètres et les retards en utilisant les instructions suivantes: Les instructions précédentes génèrent la sortie illustrée à la figure 18.60. Figure 18.60 Option LIST Sortie pour un modèle AR de Y Ce modèle prédit Y comme une combinaison linéaire de X1, X2, une interception et les valeurs de Y dans les cinq dernières périodes. Autoregression vecteur non restreint Pour modéliser les termes d'erreur d'un ensemble d'équations comme un processus autorégressif vectoriel, utilisez la forme suivante de la macro AR après les équations: La valeur nomprocessus est tout nom que vous fournissez à AR à utiliser pour créer des noms pour l'autorégressif paramètres. Vous pouvez utiliser la macro AR pour modéliser plusieurs processus AR différents pour différents ensembles d'équations en utilisant différents noms de processus pour chaque ensemble. Le nom du processus garantit que les noms de variable utilisés sont uniques. Utilisez une valeur processname courte pour le processus si des estimations de paramètres doivent être écrites dans un jeu de données de sortie. La macro AR essaie de construire des noms de paramètres inférieurs ou égaux à huit caractères, mais limité par la longueur de nomprocessus. Qui est utilisé comme préfixe pour les noms de paramètres AR. La variable listlist est la liste des variables endogènes des équations. Supposons, par exemple, que les erreurs des équations Y1, Y2 et Y3 soient générées par un processus autorégressif vectoriel de second ordre. Vous pouvez utiliser les instructions suivantes: qui génèrent ce qui suit pour Y1 et un code similaire pour Y2 et Y3: Seule la méthode des moindres carrés conditionnels (MCLS ou MCLS n) peut être utilisée pour les processus vectoriels. Vous pouvez également utiliser le même formulaire avec des restrictions que la matrice des coefficients soit 0 aux décalages sélectionnés. Par exemple, les instructions suivantes appliquent un processus vectoriel de troisième ordre aux erreurs d'équation avec tous les coefficients au retard 2 restreint à 0 et avec les coefficients aux écarts 1 et 3 sans restriction: Vous pouvez modéliser les trois séries Y1Y3 comme un processus vectoriel autorégressif Dans les variables plutôt que dans les erreurs en utilisant l'option TYPEV. Si vous souhaitez modéliser Y1Y3 en fonction de valeurs passées de Y1Y3 et de certaines variables ou constantes exogènes, vous pouvez utiliser AR pour générer les états pour les termes de retard. Écrivez une équation pour chaque variable pour la partie non-autorégressive du modèle, puis appelez AR avec l'option TYPEV. Par exemple, la partie non autorégressive du modèle peut être une fonction de variables exogènes, ou elle peut être des paramètres d'interception. S'il n'existe pas de composantes exogènes au modèle d'autorégression vectorielle, y compris les interceptions, affectez zéro à chacune des variables. Il doit y avoir une affectation à chacune des variables avant d'appeler AR. Cet exemple modélise le vecteur Y (Y1 Y2 Y3) comme une fonction linéaire uniquement de sa valeur dans les deux périodes précédentes et un vecteur d'erreur de bruit blanc. Le modèle a 18 (3 3 3 3) paramètres. Syntaxe de la macro AR Il existe deux cas de la syntaxe de la macro AR. Lorsque des restrictions sur un processus AR vectoriel ne sont pas nécessaires, la syntaxe de la macro AR a la forme générale spécifie un préfixe pour AR à utiliser dans la construction des noms de variables nécessaires pour définir le processus AR. Si l'endoliste n'est pas spécifié, la liste endogène prend par défaut le nom. Qui doit être le nom de l'équation à laquelle le processus d'erreur AR doit être appliqué. La valeur du nom ne peut pas dépasser 32 caractères. Est l'ordre du processus AR. Spécifie la liste des équations auxquelles le processus AR doit être appliqué. Si plus d'un nom est donné, un processus vectoriel non restreint est créé avec les résidus structurels de toutes les équations incluses comme régresseurs dans chacune des équations. Si non spécifié, endolist prend par défaut le nom. Spécifie la liste des délais auxquels les termes AR doivent être ajoutés. Les coefficients des termes aux décalages non listés sont mis à 0. Tous les retards indiqués doivent être inférieurs ou égaux à nlag. Et il ne doit pas y avoir de doubles. Si non spécifié, le laglist prend par défaut tous les retards 1 à nlag. Spécifie la méthode d'estimation à mettre en œuvre. Les valeurs valides de M sont CLS (estimations des moindres carrés conditionnels), ULS (estimations des moindres carrés inconditionnels) et ML (estimations du maximum de vraisemblance). MCLS est la valeur par défaut. Seul le MCLS est autorisé lorsque plus d'une équation est spécifiée. Les méthodes ULS et ML ne sont pas prises en charge par AR pour les modèles AR vectoriels. Spécifie que le processus AR doit être appliqué aux variables endogènes elles-mêmes plutôt qu'aux résidus structurels des équations. Auto-régression vectorielle restreinte Vous pouvez contrôler quels paramètres sont inclus dans le processus, en limitant à 0 ces paramètres que vous n'incluez pas. Tout d'abord, utilisez AR avec l'option DEFER pour déclarer la liste des variables et définir la dimension du processus. Ensuite, utilisez des appels AR supplémentaires pour générer des termes pour des équations sélectionnées avec des variables sélectionnées aux décalages sélectionnés. Les équations d'erreur produites sont les suivantes: Ce modèle indique que les erreurs pour Y1 dépendent des erreurs de Y1 et Y2 (mais pas de Y3) aux deux intervalles 1 et 2 et que les erreurs pour Y2 et Y3 dépendent Les erreurs précédentes pour les trois variables, mais seulement au décalage 1. Syntaxe AR Macro pour AR vectoriel restreint Une utilisation alternative d'AR est autorisée à imposer des restrictions sur un processus AR vectoriel en appelant AR plusieurs fois pour spécifier des termes AR différents et des décalages pour différents Équations. Le premier appel a la forme générale spécifie un préfixe pour AR à utiliser dans la construction de noms de variables nécessaires pour définir le processus vectoriel AR. Spécifie l'ordre du processus AR. Spécifie la liste des équations auxquelles le processus AR doit être appliqué. Spécifie que AR ne doit pas générer le processus AR mais doit attendre les informations supplémentaires spécifiées dans les appels AR ultérieurs pour la même valeur de nom. Les appels suivants ont la forme générale est la même que dans le premier appel. Spécifie la liste des équations auxquelles les spécifications de cet appel AR doivent être appliquées. Seuls les noms spécifiés dans la valeur endoliste du premier appel pour la valeur de nom peuvent apparaître dans la liste des équations dans eqlist. Spécifie la liste des équations dont les résidus structurels retardés doivent être inclus comme régresseurs dans les équations de eqlist. Seuls les noms de l'endoliste du premier appel de la valeur de nom peuvent apparaître dans varlist. Si non spécifié, varlist par défaut est endolist. Spécifie la liste des délais auxquels les termes AR doivent être ajoutés. Les coefficients des termes aux décalages non listés sont mis à 0. Tous les retards indiqués doivent être inférieurs ou égaux à la valeur de nlag. Et il ne doit pas y avoir de doubles. Si non spécifié, laglist prend par défaut tous les retards 1 à nlag. La macro MA La macro SAS MA génère des instructions de programmation pour le modèle PROC pour les modèles à moyenne mobile. La macro MA fait partie du logiciel SASETS et aucune option spéciale n'est nécessaire pour utiliser la macro. Le processus d'erreur moyenne mobile peut être appliqué aux erreurs d'équations structurelles. La syntaxe de la macro MA est la même que la macro AR sauf qu'il n'existe aucun argument TYPE. Lorsque vous utilisez les macros MA et AR combinées, la macro MA doit suivre la macro AR. Les instructions SASIML suivantes produisent un processus d'erreur ARMA (1, (1 3)) et l'enregistrent dans l'ensemble de données MADAT2. Les instructions PROC MODEL suivantes sont utilisées pour estimer les paramètres de ce modèle en utilisant la structure d'erreur de maximum de vraisemblance: Les estimations des paramètres produits par cette séquence sont présentées à la figure 18.61. Figure 18.61 Estimations d'un processus ARMA (1, (1 3)) Il existe deux cas de syntaxe pour la macro MA. Lorsque des restrictions sur un processus MA vectoriel ne sont pas nécessaires, la syntaxe de la macro MA a la forme générale spécifie un préfixe pour MA à utiliser dans la construction des noms de variables nécessaires pour définir le processus MA et est l'endoliste par défaut. Est l'ordre du processus MA. Spécifie les équations auxquelles le processus MA doit être appliqué. Si plus d'un nom est donné, l'estimation CLS est utilisée pour le processus vectoriel. Spécifie les délais auxquels les termes MA doivent être ajoutés. Tous les retards indiqués doivent être inférieurs ou égaux à nlag. Et il ne doit pas y avoir de doubles. Si non spécifié, le laglist prend par défaut tous les retards 1 à nlag. Spécifie la méthode d'estimation à mettre en œuvre. Les valeurs valides de M sont CLS (estimations des moindres carrés conditionnels), ULS (estimations des moindres carrés inconditionnels) et ML (estimations du maximum de vraisemblance). MCLS est la valeur par défaut. Seul le MCLS est autorisé lorsque plus d'une équation est spécifiée dans l'endoliste. MA Syntaxe macro pour le déplacement de vecteur restreint Une utilisation alternative de MA est autorisée à imposer des restrictions sur un processus MA vectoriel en appelant MA plusieurs fois pour spécifier différents termes de MA et des décalages pour différentes équations. Le premier appel a la forme générale spécifie un préfixe pour MA à utiliser dans la construction de noms de variables nécessaires pour définir le processus MA vecteur. Spécifie l'ordre du processus MA. Spécifie la liste des équations auxquelles le processus MA doit être appliqué. Spécifie que MA ne doit pas générer le processus MA mais doit attendre les informations supplémentaires spécifiées dans les appels MA ultérieurs pour la même valeur de nom. Les appels suivants ont la forme générale est la même que dans le premier appel. Spécifie la liste des équations auxquelles les spécifications de cet appel MA doivent être appliquées. Spécifie la liste des équations dont les résidus structurels retardés doivent être inclus comme régresseurs dans les équations de eqlist. Spécifie la liste des délais auxquels les termes MA doivent être ajoutés.


No comments:

Post a Comment