Download SI-ING10 Series de tiempo

Document related concepts

Red neuronal artificial wikipedia , lookup

Pronóstico (estadística) wikipedia , lookup

Pronóstico por clase de referencia wikipedia , lookup

RNA de base radial wikipedia , lookup

Propagación hacia atrás wikipedia , lookup

Transcript
Caracterización empírica de series de tiempo y selección de la mejor técnica de
pronóstico basada en Redes Neuronales Artificiales
Ma. Guadalupe Villarreal Marroquín, Mauricio Cabrera Ríos
División de Postgrado en Ingeniería de Sistemas, Universidad Autónoma de Nuevo León, Cuidad
Universitaria, San Nicolás De los Garza, N. L, lupita@yalma.fime.uanl.mx, mauricio@yalma.fime.uanl.mx
RESUMEN
En este trabajo se propone un método para ayudar a las personas con poco entrenamiento estadístico a elaborar
un pronóstico de series de tiempo caracterizando primero su serie y, después en base a esta caracterización,
seleccionando la técnica más adecuada de pronóstico. El método utiliza redes neuronales artificiales para
realizar la selección. Se puso especial cuidado que tanto los métodos estadísticos como las redes neuronales
artificiales utilizadas pudieran ser instauradas en MS Excel, por lo que los requerimientos de paquetería
computacional son modestos.
1. INTRDUCCION
Nuestra vida cotidiana está llena de decisiones, tales dependen en gran medida de la información que tenemos
a la mano como de la que podemos proyectar a futuro. El área de pronósticos trata precisamente de generar
información estimada sobre el comportamiento de un fenómeno observable a futuro. En muchos casos, se basa
en el comportamiento histórico de tal fenómeno organizado en una serie de tiempo.
A pesar de que una gran cantidad de personas elaboran pronósticos diariamente, existen tres problemas que se
pueden hallar de manera común en esta práctica: 1) no contar con el entrenamiento estadístico necesario, 2) no
contar con paquetería computacional especializada, o 3) no tener tiempo suficiente para hallar el método más
adecuado. Estos tres problemas motivaron los estudios que se incluyen en este trabajo.
Este trabajo resulta en un método que no depende de software estadístico especializado y que permite
caracterizar y seleccionar la técnica más adecuada de pronósticos de una manera repetible. Tanto las técnicas
de pronóstico como las RNAs utilizadas son convenientemente instaurables en MS Excel. Un impacto probable
es que, a través de la aplicación de este método, las personas que generen pronósticos lo hagan
consistentemente mejor y más rápido. En consecuencia, sería posible tomar mejores decisiones en las
aplicaciones pertinentes aún en casos de contar con un entrenamiento estadístico modesto.
2. METODO PROPUESTO
La Figura 1 presenta un diagrama de flujo con el método propuesto. En este método, la parte de selección se
basa en las ideas presentadas en [1] en el terreno de secuenciamiento de tareas en plantas de manufactura. El
objetivo del método en este trabajo es determinar la mejor técnica de pronóstico de entre varias conocidas a
partir de una serie de tiempo caracterizada por dos parámetros sencillos de obtener.
1
Los pasos del método, partiendo de que se tiene una serie de tiempo, son como sigue:
1.
Escalar los datos al intervalo [-1,1]: los datos de la serie de tiempo se transforman para que caigan en un
rango de [-1,1] con la idea de eliminar efectos de dimensionalidad.
2.
Caracterizar la serie de tiempo: se determinan dos parámetros que caracterizan a la serie: el número de
períodos de la serie de tiempo (t) y el grado del primer polinomio (n) que se ajuste a los datos de la serie
con un coeficiente de determinación, R2 ≥80% (Ver Figura 2). La justificación de utilizar un valor R2
≥80% se encuentra en el [2].
n
1.50
3
y = -0.0079x + 0.1499x2 - 0.6164x + 0.0467
R2 = 0.8959
observación
1.00
0.50
0.00
1
2
3
4
5
6
7
8
9
10
11
12
t
-0.50
-1.00
-1.50
período
Serie de tiempo
Ajuste polinomial
Figura 2. Observación vs. Período y Ajuste de una línea de tendencia de tipo polinomial a los datos.
3.
Someter a la red neuronal artificial: se utiliza una red neuronal artificial (de tres capas) previamente
entrenada, donde se usan como entradas n y t y como salida la predicción del error cuadrado medio (MSE)
para cada uno de los métodos de pronóstico.
4.
Establecer un orden entre los métodos y escoger el mejor: por último, se ordenan los métodos de acuerdo
a su MSE predicho, y se escoge el que tenga el valor más pequeño en esta medida.
Escalar los datos a un rango de
1,1
Caracterizar la serie de tiempo
Someter a la red neuronal artificial
Establecer un orden entre los métodos y
determinar el mejor
Figura 1. Método propuesto para la selección de la mejor técnica de pronóstico entre varias conocidas.
El método propuesto se apoya en la capacidad de predicción de las RNAs al utilizar una de ellas para predecir
el desempeño de varias técnicas de pronóstico cuantificado por el MSE. La capacidad predictiva de las RNAs
2
ha sido estudiada y matemáticamente demostrada para funciones analíticas en [3] y la factibilidad de usar el
MSE como medida de desempeño en pronóstico se encuentra documentada en [4].
El método resultante en el punto 4 es el que se debe utilizar entonces para generar los pronósticos. Como se
dijo anteriormente, todos los métodos de pronóstico que se utilizaron en este trabajo fueron codificados en MS
Excel y se encuentran disponibles por parte de los autores. La creación de las RNAs que se utiliza para la
selección en este método se describe a continuación.
3. OBTENCION DE LAS RNAs A UTILIZAR EN EL METODO PROPUESTO
Las RNAs que se requieren para el método de selección propuesto deben ser capaces de predecir el desempeño
de cada método de pronóstico. Para construir una RNA se requiere de una fase de entrenamiento.
Adicionalmente, para corroborar que el modelo tenga una capacidad predictiva adecuada también se utiliza una
fase de validación.
Para poder construir las RNAs necesarias se generaron 54 series de tiempo para entrenamiento. Las series
utilizadas en entrenamiento tuvieron como parámetros t{12,36,60} períodos y aproximación polinomial dada
por n {1,2,3,4,5,6}, lo cual resulta en un total de 3 x 6 = 18 combinaciones de n y t. Para cada una de estas
combinaciones se generaron 3 réplicas por medio de una perturbación aditiva aleatoria, de ahí que haya un
total de 54 series de tiempo. Para validación se utilizaron además 22 series; 12 de ellas resultan de todas las
posibles combinaciones de series de tiempo con t{24,48} y aproximación polinomial de n{1,2,3,4,5,6}; 8
de las restantes comprenden series publicadas [5] y dos más de una compañía de telecomunicaciones.
Se consideraron 8 métodos de pronóstico tradicionales que se codificaron completamente en MS Excel: (1)
método ingenuo, (2) promedio, (3) promedios móviles, (4) suavizado exponencial simple, (5) ARIMA(0,1,1),
(6) regresión lineal, (7) suavizado exponencial doble y (8) ARIMA (0,2,2) [4,5].
Se entrenaron y validaron RNAs con dos y tres neuronas en la capa oculta en una etapa inicial, con resultados
prometedores pero con una tendencia de disminución de error de validación con el aumento de neuronas en la
capa oculta, por lo cual en una segunda etapa se extendió con cuatro hasta siete neuronas en la capa oculta;
posteriormente se presentaran los resultados y comparación de la primera y segunda etapa.
El entrenamiento de la RNA se pudo abordar con el optimizador incluído en MS Excel (Excel Solver). Dado
que este optimizador es de tipo local para un problema no lineal como el que se presenta al tratar de minimizar
la suma de errores cuadrados o SSE, se cuidó de inicializar los pesos en diferentes valores para aumentar la
probabilidad de tener una solución satisfactoria. Los pesos se inicializaron nueve veces. Las primeras cinco,
todos los pesos tomaban el mismo valor del siguiente conjunto {-1,-0.5,0,0.5,1}, las otras cuarto veces, se
inicializaron con valores aleatorios entre -1 y 1. Al final se mantuvieron los pesos que resultaron en el menor
SSE de validación independiente del error de entrenamiento, pues es precisamente la capacidad de predicción
lo que debemos preservar en este caso. El error de validación se utilizó como criterio para determinar el
número de neuronas en la capa oculta. Por supuesto a menor error de validación corresponde una mejor
capacidad de predicción.
La Tabla 3 muestra los errores de validación obtenidos para cada RNA tratada en la primera etapa. En esta
tabla se puede ver que una red no domina totalmente a la otra, por lo cual se recurrió a una prueba de hipótesis
para dos medias donde nuestra hipótesis nula es que no hay una diferencia significativa entre el desempeño de
las redes, contra la alternativa de que sí hay, con un nivel de significancia de α = 0.01. El estadístico de prueba
resulta con un valor de |t14|=0.244, el cual se debe comparar con un valor de tablas de t0.005,14=2.947. Dado que
|t14| < t0.005,14, no se puede rechazar la hipótesis nula, por lo que concluimos que en el 99% de nuestros casos no
hay una diferencia significativa en utilizar una red con dos o tres neuronas en la capa oculta. Considerando este
resultado se decidió en una primera etapa utilizar las redes de dos neuronas en la capa oculta, ya que son
modelos más simples que los de tres neuronas ocultas.
Método de pronóstico
SSE (dos neuronas)
SSE (tres neuronas)
3
Ingenuo
Promedio
Promedio móvil
ARIMA(0,1,1)
Suavizado exponencial simple
Regresión lineal
ARIMA(0,2,2)
Suavizado exponencial doble
0.950
2.965
0.260
0.680
0.924
2.552
1.409
1.501
0.954
3.028
0.223
0.948
0.954
1.881
1.210
1.245
Tabla 3: Suma de errores cuadrados de validación para RNAs con dos y tres neuronas en la capa oculta.
En una segunda etapa como ya se menciono se decidió utilizar RNAs con cuatro hasta siete neuronas en la
capa oculta para tratar de reducir el error de validación, sin embargo al mismo tiempo también se comparan
con las RNAs de la primera etapa. La Gráfica 4 muestran los errores de validación obtenidos para las RNAs
utilizadas en esta etapa. En esta gráfica se pueden observar los errores de validación para cada red, donde
igualmente que en la primer etapa ninguna supera a otra en todos los métodos, pero dado que la red para cada
uno de los métodos tradicionales de pronóstico es independiente entonces podemos elegir redes diferentes para
cada uno de éstos.
4.0
3.5
Ingenuo
3.0
Promedio
Promdio Movil
2.5
ARIMA(0,1,1)
2.0
Suavizado
Exponencial Simple
Regsion Lineal
1.5
1.0
ARIMA(0,2,2)
0.5
Suavizado
Exponencial Doble
0.0
2 NEURONA 3 NEURONA 4 NEURONA 5 NEURONA 6 NEURONA 7 NEURONA
Gráfica 4: RNAs con n neuronas en la capa ocultas vs. Suma de errores cuadrados de validación por RNAs
para cada método de pronóstico tradicional.
Las RNAs seleccionadas se pueden ahora utilizar para predecir el MSE de los ocho métodos de pronóstico para
series de tiempo caracterizadas por una combinación específica de n y t.
4. RESULTADOS DE LA APLICACIÓN DEL METODOD PROPUESTO
Para demostrar la utilización de las RNAs obtenidas anteriormente en el contexto del método propuesto se
utilizaron las series de validación. Cabe aclarar que los datos de validación no se encuentran memorizados en
la RNA, por lo que se preserva la objetividad de la evaluación.
Se obtuvo el MSE real para las 22 series de tiempo con combinaciones de n y t particulares y el MSE predicho
por las RNAs seleccionada para cada método de pronóstico en la etapa inicial tanto como en la segunda etapa.
Se observo que algunas series de tiempo tenían el mismo MSE para diferentes métodos, esto se debe a que
algunos métodos son casos particulares de otros. Así sucede, por ejemplo, con el método de promedio y el
método de promedios móviles. Adicionalmente, los MSE reales de ambos métodos presentan patrones
similares. Cuando el MSE predicho es el mismo en una serie en particular para diferentes métodos se considera
a éstos en el mismo lugar de preferencia. Queda entonces a criterio del usuario elegir uno si es necesario. Los
cálculos a detalle para los resultados se encuentran disponibles por los autores.
De los resultados anteriores se extrajo la información presentada en la Tabla 5 y en la Tabla 6, que es un
conteo de las veces en las que el mejor método de los ocho considerados (basados en el MSE) se encontró
entre los tres mejores predichos por la RNA. Esta información sirvió para determinar estadísticamente qué tan
buena fue la capacidad de predicción de las RNAs utilizadas en ambas etapas.
De las Tablas 5 y 6 podemos concluir que en 42 de 49 casos, las RNAs predijeron la mejor técnica real de
pronóstico dentro de las primeras tres mejores, para las dos etapas del estudio. Sin embargo, las RNAs
4
estudiadas en la segunda etapa mostraron un mejor desempeño pues si se observa a detalle, éstas predijeron en
17 casos el primer método real, mientras que las RNAs del la primera etapa predijeron solo 14. Con esta
información podemos obtener un intervalo de confianza de 95% para proporciones (θ), donde 0.751 <
<
0.962, por lo tanto para el 95% de todos los casos podemos asegurar que del 75% al 96% de éstos, las RNAs
predecirán la mejor técnica real dentro de las primeras 3. Se hace notar que en las Tablas 5 y 6 se toman 49
casos, siendo solamente 22 las series utilizadas para validar. La razón obedece a lo explicado anteriormente,
esto es que si el MSE real se repite 3 veces en el mejor lugar, se considera como tres series en las cuales este es
primero.
Real
Predichos
por la Red
1
2
3
Otro
Total
1
14
16
12
7
49
Tabla 5: Número de métodos predichos por las RNAs
seleccionadas en la primer etapa vs. Real.
Real
Predichos
por la Red
1
2
3
Otro
Total
1
17
15
10
7
49
Tabla 6: Número de métodos predichos por las
RNAs seleccionadas en la segunda etapa vs.
Real
5. CONCLSIONES Y TRABAJO A FUTURO
En este trabajo se propuso un método para seleccionar la mejor técnica de pronóstico para series de tiempo de
entre varias conocidas. Además se propuso una caracterización de series de tiempo cuyos resultados
preliminares resultan prometedores por su precisión y simpleza. Se describió también la construcción de las
RNAs que se deben utilizar con el método propuesto. Los resultados de validación permiten concluir que las
RNAs predijeron satisfactoriamente la mejor técnica dentro de las tres mejores técnicas en términos del MSE.
Esta conclusión se corroboró con un buen nivel de confianza obteniendo una prueba de hipótesis para
proporciones, donde ésta comprende las series en las cuales su mejor MSE real coincide con uno de los
mejores tres MSE predichos por la RNA.
Como una de las extensiones de este trabajo se tratará de ampliar el entrenamiento de las RNAs para abarcar
un mayor número de neuronas en la capa oculta de las redes utilizadas para probar la metodología propuesta.
Con ésto se pretende verificar si se puede mejorar aún más la precisión al aumentar el número de neuronas en
la capa oculta. Se pretende además probar si el ordenamiento de los métodos depende del tamaño y la precisión
de las RNAs o bien si el ordenamiento es en realidad robusto ante variaciones de precisión. Posteriormente, se
planea también investigar la factibilidad de incorporar parámetros adicionales a la caracterización propuesta a
fin de mejorarla, así como incrementar la certeza en la selección de la técnica de pronóstico por medio de una
segunda RNA que tome el resultado de la anterior para determinar un mejor orden de los datos. Ésta última
siguiendo las ideas y resultados presentados en [1]. Finalmente, dado que para una serie de tiempo con
características particulares se determina un mejor método de pronóstico de entre varios conocidos, entonces se
puede determinar qué método de pronóstico es más adecuado para un conjunto de series de tiempo con
características particulares. La conveniencia de tener esta información en tablas puede ayudar a difundir el
método aquí propuesto de una manera más sencilla.
REFERENCIAS
1. Gupta J.N.D., Sexton R.S., and Tunc E.A., “Selecting Scheduling Heuristics Using Neural Networks”,
Journal on Computing, Vol. 12, No.2, Spring 2000, pp.150-162.
2. Villarreal M.G.,“ Estudio en pronostico de series de tiempo: evaluación de métodos estadísticos y
selección del mejor método con RNAs” , Tesis de Licenciatura, Universidad Autónoma de Nuevo León, 2006.
5
3. Hillier F.S. and Lieberman G.J., Introduction to Operations Research, 7th Edition, McGraw Hill, 2001.
4. Hornik K., Stinchcombe M. and White H., “Multilayer feedforward networks are universal
approximatiors”, Neuronal Networks, Vol.2, No.5, 1989, pp.359-366.
5. Makridakis S., Wheelwright S.C., and Hyndman R.J., Forecasting Methods and Applications, 3rd
Edition, John Wiley &Sons, Inc., 1998.
6