Tuesday, November 22, 2016

B) Modelos De Media Móvil

Procesos Autoregresivos de Movimiento-Error Promedio


Los procesos de error promedio móvil (errores ARMA) y otros modelos que implican retrasos de los términos de error pueden ser estimados usando sentencias FIT y simulados o pronosticados usando sentencias SOLVE. Los modelos ARMA para el proceso de error se usan con frecuencia para modelos con residuos autocorrelados. La macro% AR se puede utilizar para especificar modelos con procesos de error autorregresivo. La macro% MA se puede utilizar para especificar modelos con procesos de error de media móvil.


Errores Autoregresivos


Un modelo con errores autorregresivos de primer orden, AR (1), tiene la forma


Mientras que un proceso de error AR (2) tiene la forma


Y así sucesivamente para procesos de orden superior. Observe que los †™ s son independientes e idénticamente distribuidos y tienen un valor esperado de 0.


Un ejemplo de un modelo con un componente AR (2) es


Y así sucesivamente para procesos de orden superior.


Por ejemplo, puede escribir un modelo de regresión lineal simple con MA (2) errores de media móvil como


Donde MA1 y MA2 son los parámetros de la media móvil.


Tenga en cuenta que RESID. Y es definido automáticamente por PROC MODEL como


La función ZLAG debe utilizarse para que los modelos MA trunquen la recursividad de los retornos. Esto asegura que los errores rezagados empiezan a cero en la fase de cebado y no propagan los valores faltantes cuando faltan las variables del período de cebado y aseguran que los errores futuros son cero en lugar de faltar durante la simulación o la predicción. Para obtener más información sobre las funciones de retraso, consulte la sección Lag Logic.


Este modelo escrito con la macro% MA es el siguiente:


Formulario General para Modelos ARMA


El proceso general ARMA (p, q) tiene la siguiente forma


Un modelo ARMA (p, q) se puede especificar de la siguiente manera:


Donde AR i y MA j representan los parámetros autorregresivos y de media móvil para los diferentes desfases. Puede utilizar cualquier nombre que desee para estas variables, y hay muchas formas equivalentes de que la especificación podría escribirse.


Los procesos ARMA vectoriales también se pueden estimar con PROC MODEL. Por ejemplo, un proceso AR (1) de dos variables para los errores de las dos variables endógenas Y1 e Y2 puede especificarse de la siguiente manera:


Problemas de convergencia con los modelos ARMA


Los modelos ARMA pueden ser difíciles de estimar. Si las estimaciones de parámetros no están dentro del rango apropiado, los términos residuales de un modelo de media móvil crecen exponencialmente. Los residuos calculados para observaciones posteriores pueden ser muy grandes o pueden desbordarse. Esto puede ocurrir ya sea porque se utilizaron valores iniciales incorrectos o porque las iteraciones se alejaron de valores razonables.


Debe tenerse cuidado al elegir los valores iniciales para los parámetros ARMA. Los valores iniciales de 0,001 para los parámetros ARMA normalmente funcionan si el modelo se ajusta bien a los datos y el problema está bien condicionado. Tenga en cuenta que un modelo de MA a menudo puede ser aproximado por un modelo de AR de alto orden, y viceversa. Esto puede dar lugar a una alta colinealidad en los modelos ARMA mixtos, lo que a su vez puede causar un grave mal acondicionamiento en los cálculos y la inestabilidad de los parámetros estimados.


Si tiene problemas de convergencia mientras estima un modelo con procesos de error ARMA, intente estimarlos en pasos. En primer lugar, utilice una sentencia FIT para estimar sólo los parámetros estructurales con los parámetros ARMA mantenidos a cero (o a estimaciones previas razonables si están disponibles). A continuación, utilice otra instrucción FIT para estimar sólo los parámetros ARMA, utilizando los valores de los parámetros estructurales de la primera ejecución. Dado que los valores de los parámetros estructurales es probable que estén cerca de sus estimaciones finales, las estimaciones de los parámetros de ARMA podrían ahora converger. Finalmente, use otra instrucción FIT para producir estimaciones simultáneas de todos los parámetros. Dado que los valores iniciales de los parámetros ahora es probable que estén muy cerca de sus estimaciones conjuntas finales, las estimaciones deben converger rápidamente si el modelo es apropiado para los datos.


Condiciones iniciales


Los retardos iniciales de los términos de error de los modelos AR (p) se pueden modelar de diferentes maneras. Los métodos de arranque de errores autorregresivos soportados por los procedimientos SAS / ETS son los siguientes:


Mínimos condicionales (procedimientos ARIMA y MODEL)


Mínimos cuadrados incondicionales (procedimientos AUTOREG, ARIMA y MODEL)


Máxima verosimilitud (procedimientos AUTOREG, ARIMA y MODEL)


Yule-Walker (sólo procedimiento AUTOREG)


Hildreth-Lu, que elimina las primeras p observaciones (procedimiento MODEL solamente)


Consulte el Capítulo 8, Procedimiento AUTOREG, para una explicación y discusión de los méritos de varios métodos de arranque AR (p).


Las inicializaciones CLS, ULS, ML y HL pueden realizarse mediante PROC MODEL. Para errores AR (1), estas inicializaciones se pueden producir como se muestra en la Tabla 18.2. Estos métodos son equivalentes en muestras grandes.


Tabla 18.2 Inicializaciones realizadas por PROC MODEL: AR (1) ERRORS


Los retardos iniciales de los términos de error de los modelos MA (q) también se pueden modelar de diferentes maneras. Los siguientes paradigmas de arranque de errores de media móvil están soportados por los procedimientos ARIMA y MODEL:


Mínimos cuadrados incondicionales


Mínimos condicionales


El método de mínimos cuadrados condicionales para estimar los términos de error de media móvil no es óptimo porque ignora el problema de inicio. Esto reduce la eficiencia de las estimaciones, aunque siguen siendo imparciales. Los residuos rezagados iniciales, que se extienden antes del inicio de los datos, se supone que son 0, su valor esperado incondicional. Esto introduce una diferencia entre estos residuales y los residuos de mínimos cuadrados generalizados para la covarianza media móvil, que, a diferencia del modelo autorregresivo, persiste a través del conjunto de datos. Por lo general, esta diferencia converge rápidamente a 0, pero para los procesos de media móvil no inversa la convergencia es bastante lenta. Para minimizar este problema, debe tener un montón de datos, y las estimaciones de parámetros del promedio móvil deberían estar dentro del intervalo invertible.


Este problema se puede corregir a expensas de escribir un programa más complejo. Las estimaciones de mínimos cuadrados incondicionales para el proceso MA (1) se pueden producir especificando el modelo como sigue:


Los errores de media móvil pueden ser difíciles de estimar. Debe considerar usar una aproximación AR (p) al proceso del promedio móvil. Un proceso de media móvil normalmente puede ser bien aproximado por un proceso autorregresivo si los datos no han sido suavizados o diferenciados.


El% AR Macro


La macro% AR de SAS genera instrucciones de programación para MODELO PROC para modelos autorregresivos. La macro% AR forma parte del software SAS / ETS y no es necesario configurar ninguna opción especial para utilizar la macro. El proceso autorregresivo puede aplicarse a los errores de la ecuación estructural oa las propias series endógenas.


La macro% AR se puede utilizar para los siguientes tipos de autorregresión:


Autorregresión vectorial sin restricciones


Autorregresión vectorial restringida


Autoregresión univariada


Para modelar el término de error de una ecuación como un proceso autorregresivo, utilice la siguiente sentencia después de la ecuación:


Por ejemplo, supongamos que Y es una función lineal de X1, X2 y un error de AR (2). Escribirías este modelo de la siguiente manera:


Las llamadas a% AR deben venir después de todas las ecuaciones a las que se aplica el proceso.


La invocación de macro precedente,% AR (y, 2), produce las declaraciones mostradas en la salida LIST de la Figura 18.58.


Figura 18.58 Salida de opción LIST para un modelo AR (2)


Las variables prefijadas _PRED__ son variables temporales de programa utilizadas de manera que los retrasos de los residuos son los residuos correctos y no los redefinidos por esta ecuación. Tenga en cuenta que esto es equivalente a las declaraciones explícitamente escritas en la sección Formulario General para Modelos ARMA.


También puede restringir los parámetros autorregresivos a cero en los retornos seleccionados. Por ejemplo, si desea parámetros autorregresivos en los retornos 1, 12 y 13, puede utilizar las siguientes sentencias:


Estas declaraciones generan la salida mostrada en la Figura 18.59.


Figura 18.59 Salida de opción LIST para un modelo AR con Lags en 1, 12 y 13


El procedimiento MODEL


Listado del código de programa compilado


Declaración como Parsed


PRED. y = a + b * x _ {1} + c * x _ {2};


RESID. y = PRED. y - ACTUAL. y;


ERROR. y = PRED. y - y;


_OLD_PRED. y = PRED. y + y_l1 * ZLAG1 (y - _PRED__y) + y_l12 * ZLAG12 (y - _PRED__y) + y_l13 * ZLAG13 (y - _PRED__y);


RESID. y = PRED. y - ACTUAL. y;


ERROR. y = PRED. y - y;


Existen variaciones en el método de los mínimos cuadrados condicionales, dependiendo de si las observaciones al comienzo de la serie se utilizan para "calentar" el proceso de AR. De forma predeterminada, el método de mínimos cuadrados condicional% AR utiliza todas las observaciones y supone ceros para los retornos iniciales de los términos autorregresivos. Utilizando la opción M =, puede solicitar que% AR utilice el método de mínimos cuadrados incondicionales (ULS) o de máxima verosimilitud (ML). Por ejemplo,


Las discusiones de estos métodos se proporcionan en la sección AR Condiciones iniciales.


Mediante el uso de la opción M = CLS n, puede solicitar que las primeras n observaciones se utilicen para calcular estimaciones de los retrasos autorregresivos iniciales. En este caso, el análisis comienza con la observación n +1. Por ejemplo:


Puede utilizar la macro% AR para aplicar un modelo autorregresivo a la variable endógena, en lugar de al término de error, utilizando la opción TYPE = V. Por ejemplo, si desea agregar los cinco retrasos anteriores de Y a la ecuación del ejemplo anterior, podría usar% AR para generar los parámetros y rezagos mediante las siguientes sentencias:


Las sentencias anteriores generan la salida que se muestra en la Figura 18.60.


Figura 18.60 Salida de opción LIST para un modelo AR de Y


Este modelo predice Y como una combinación lineal de X1, X2, un intercepto, y los valores de Y en los cinco períodos más recientes.


Autorreversión vectorial sin restricciones


Para modelar los términos de error de un conjunto de ecuaciones como un proceso vectorial autorregresivo, utilice la siguiente forma de la macro% AR después de las ecuaciones:


El valor de nombre_proceso es cualquier nombre que proporcione para% AR que se utilice para crear nombres para los parámetros autorregresivos. Puede utilizar la macro% AR para modelar varios procesos AR diferentes para diferentes conjuntos de ecuaciones utilizando diferentes nombres de proceso para cada conjunto. El nombre del proceso garantiza que los nombres de variable utilizados sean únicos. Utilice un valor de nombre de proceso corto para el proceso si las estimaciones de parámetros deben escribirse en un conjunto de datos de salida. La macro% AR intenta construir nombres de parámetro menores o iguales a ocho caracteres, pero esto está limitado por la longitud de process_name. Que se utiliza como prefijo para los nombres de parámetro AR.


El valor variable_list es la lista de variables endógenas para las ecuaciones.


Por ejemplo, supongamos que los errores de las ecuaciones Y1, Y2 e Y3 son generados por un proceso autorregresivo vectorial de segundo orden. Puede utilizar las siguientes declaraciones:


Que generan lo siguiente para Y1 y código similar para Y2 e Y3:


Sólo el método de los mínimos cuadrados condicionales (M = CLS o M = CLS n) se puede utilizar para procesos vectoriales.


También puede usar el mismo formulario con restricciones de que la matriz de coeficientes sea 0 en retrasos seleccionados. Por ejemplo, las siguientes afirmaciones aplican un proceso vectorial de tercer orden a los errores de ecuación con todos los coeficientes con retraso 2 restringido a 0 y con los coeficientes en los retornos 1 y 3 sin restricciones:


Puede modelar las tres series Y1†"Y3 como un proceso vectorial autorregresivo en las variables en lugar de en los errores utilizando la opción TYPE = V. Si desea modelar Y1 - Y3 como una función de valores pasados ​​de Y1 - Y3 y algunas variables o constantes exógenas, puede usar% AR para generar las sentencias para los términos de retraso. Escriba una ecuación para cada variable para la parte no autorregresiva del modelo y, a continuación, llame a% AR con la opción TYPE = V. Por ejemplo,


La parte no autorregresiva del modelo puede ser una función de variables exógenas, o puede ser parámetros de intercepción. Si no hay componentes exógenos en el modelo de autorregresión vectorial, incluyendo no intercepciones, entonces asigne cero a cada una de las variables. Debe haber una asignación a cada una de las variables antes de llamar a% AR.


Este ejemplo modela el vector Y = (Y1 Y2 Y3) como una función lineal solamente de su valor en los dos períodos anteriores y un vector de error de ruido blanco. El modelo tiene 18 = (3 3 + 3 3) parámetros.


Sintaxis de la macro% AR


Hay dos casos de la sintaxis de la macro% AR. Cuando no se necesitan restricciones en un proceso AR vectorial, la sintaxis de la macro% AR tiene la forma general


Especifica un prefijo para% AR que se usará en la construcción de nombres de variables necesarios para definir el proceso AR. Si el endolist no se especifica, la lista endógena tiene por defecto el nombre. Que debe ser el nombre de la ecuación a la que se va a aplicar el proceso de error AR. El valor de nombre no puede superar los 32 caracteres.


Es el orden del proceso AR.


Especifica la lista de ecuaciones a las que se va a aplicar el proceso AR. Si se da más de un nombre, se crea un proceso vectorial sin restricciones con los residuos estructurales de todas las ecuaciones incluidas como regresores en cada una de las ecuaciones. Si no se especifica, endolist toma el nombre por defecto.


Especifica la lista de rezagos en los que se van a agregar los términos AR. Los coeficientes de los términos a intervalos no listados se ponen a 0. Todos los desfases enumerados deben ser menores o iguales a nlag. Y no debe haber duplicados. Si no se especifica, el laglist se ajusta por defecto a todos los retornos 1 a nlag.


Especifica el método de estimación a implementar. Los valores válidos de M = son CLS (estimaciones de mínimos cuadrados condicionales), ULS (estimaciones de mínimos cuadrados incondicionales) y ML (estimaciones de máxima verosimilitud). M = CLS es el valor predeterminado. Sólo se permite M = CLS cuando se especifica más de una ecuación. Los métodos ULS y ML no son compatibles con los modelos AR vectoriales en% AR.


Especifica que el proceso AR debe aplicarse a las variables endógenas en lugar de a los residuos estructurales de las ecuaciones.


Autoregulación vectorial restringida


Puede controlar qué parámetros se incluyen en el proceso, restringiendo a 0 aquellos parámetros que no incluye. Primero, use% AR con la opción DEFER para declarar la lista de variables y definir la dimensión del proceso. A continuación, utilice% de llamadas AR adicionales para generar términos para las ecuaciones seleccionadas con variables seleccionadas en retrasos seleccionados. Por ejemplo,


Las ecuaciones de error producidas son las siguientes:


Este modelo establece que los errores para Y1 dependen de los errores tanto de Y1 como de Y2 (pero no de Y3) en los dos intervalos 1 y 2, y que los errores de Y2 y Y3 dependen de los errores anteriores para las tres variables, pero sólo en Retraso 1.


% AR Sintaxis de macros para vector AR restringido


Un uso alternativo de% AR se le permite imponer restricciones en un proceso AR vectorial llamando a% AR varias veces para especificar diferentes términos de AR y retrasos para diferentes ecuaciones.


La primera llamada tiene la forma general


Especifica un prefijo para% AR que se usará en la construcción de nombres de variables necesarios para definir el proceso AR de vector.


Especifica el orden del proceso AR.


Especifica la lista de ecuaciones a las que se va a aplicar el proceso AR.


Especifica que% AR no es para generar el proceso AR sino que se espera que la información adicional especificada en las llamadas% AR posteriores tenga el mismo valor de nombre.


Las llamadas posteriores tienen la forma general


Es la misma que en la primera convocatoria.


Especifica la lista de ecuaciones a las que deben aplicarse las especificaciones de esta llamada% AR. Sólo los nombres especificados en el valor endolist de la primera llamada para el valor de nombre pueden aparecer en la lista de ecuaciones en eqlist.


Especifica la lista de ecuaciones cuyos residuos estructurales rezagados se incluyen como regresores en las ecuaciones de eqlist. Solamente los nombres en el endolist de la primera llamada para el valor del nombre pueden aparecer en varlist. Si no se especifica, varlist por defecto es endolist.


Especifica la lista de rezagos en los que se van a agregar los términos AR. Los coeficientes de los términos en retrasos no enumerados se establecen en 0. Todos los retornos enumerados deben ser inferiores o iguales al valor de nlag. Y no debe haber duplicados. Si no se especifica, laglist se ajusta por defecto a todos los retornos 1 a nlag.


La macro% MA


La macro SAS% MA genera instrucciones de programación para MODELO PROC para modelos de media móvil. La macro% MA forma parte del software SAS / ETS y no se necesitan opciones especiales para utilizar la macro. El proceso de error de media móvil puede aplicarse a los errores de la ecuación estructural. La sintaxis de la macro% MA es la misma que la macro% AR excepto que no hay ningún argumento TYPE =.


Cuando está utilizando las macros% MA y% AR combinadas, la macro% MA debe seguir la macro% AR. Las siguientes instrucciones SAS / IML producen un proceso de error ARMA (1, (1 3)) y lo guardan en el conjunto de datos MADAT2.


Las siguientes instrucciones PROC MODEL se usan para estimar los parámetros de este modelo usando la estructura de error de máxima verosimilitud:


Las estimaciones de los parámetros producidos por esta ejecución se muestran en la Figura 18.61.


Figura 18.61 Estimaciones de un proceso ARMA (1, (1 3))


Hay dos casos de la sintaxis para la macro% MA. Cuando no se necesitan restricciones en un proceso MA vectorial, la sintaxis de la macro% MA tiene la forma general


Especifica un prefijo para% MA para utilizar en la construcción de nombres de variables necesarias para definir el proceso MA y es el endolist por defecto.


Es el orden del proceso MA.


Especifica las ecuaciones a las que se aplica el proceso de MA. Si se da más de un nombre, la estimación CLS se utiliza para el proceso vectorial.


Especifica los rezagos en los que se van a agregar los términos MA. Todos los desfases enumerados deben ser inferiores o iguales a nlag. Y no debe haber duplicados. Si no se especifica, el laglist se ajusta por defecto a todos los retornos 1 a nlag.


Especifica el método de estimación a implementar. Los valores válidos de M = son CLS (estimaciones de mínimos cuadrados condicionales), ULS (estimaciones de mínimos cuadrados incondicionales) y ML (estimaciones de máxima verosimilitud). M = CLS es el valor predeterminado. Sólo se permite M = CLS cuando se especifica más de una ecuación en el endolista.


% MA Sintaxis de macros para movimientos variables de vector restringidos


Un uso alternativo de% MA se le permite imponer restricciones a un proceso de MA de vector llamando a% MA varias veces para especificar diferentes términos de MA y rezagos para diferentes ecuaciones.


La primera llamada tiene la forma general


Especifica un prefijo para% MA para utilizar en la construcción de nombres de variables necesarias para definir el proceso MA vector.


Especifica el orden del proceso MA.


Especifica la lista de ecuaciones a las que se aplicará el proceso de MA.


Especifica que% MA no es para generar el proceso MA sino que es esperar a que la información adicional especificada en posteriores MA% llamadas para el mismo valor de nombre.


Las llamadas posteriores tienen la forma general


Es la misma que en la primera convocatoria.


Especifica la lista de ecuaciones a las que se aplicarán las especificaciones de esta llamada% MA.


Especifica la lista de ecuaciones cuyos residuos estructurales rezagados se incluyen como regresores en las ecuaciones de eqlist.


Especifica la lista de retrasos en los que se van a agregar los términos MA.


No comments:

Post a Comment