Valencia, Vanegas, Correa, and Restrepo: Comparación de pronósticos para la dinámica del turismo en Medellín, Colombia



Introducción

El pronóstico de la demanda del sector turístico es un tema reconocido a nivel mundial. Diversos estudios emplean modelos de pronósticos para su caracterización y análisis de comportamiento, identificando, por ejemplo, co variables con incidencias significativas o patrones estacionales y tendencias (Guizzardi & Mazzocchi, 2010). Muchos de estos modelos van desde la teo ría clásica, o econométrica, hasta propuestas que comparan modelos clásicos con redes neuronales, como sucede en el trabajo de Claveria y Torra (2014).

Algunos temas relacionados con la teoría de modelos de pronósticos clá sicos, como es el caso de la regresión, presentan problemas asociados con la presencia de sesgos al pronosticar, debido a que cuando se prolonga el pe ríodo de predicción en el modelo con parámetros fijos se puede incurrir en predicciones erróneas. En otros casos hay algunos supuestos de los residuales que no se cumplen con facilidad, por presentar problemas como valores muy extremos, o un cambio repentino en el curso normal de una serie de tiempo.

Cuando la escala de la variable de respuesta inicial es de tipo discreto se pueden usar modelos de pronóstico basados en la distribución Poisson, y si toma valores de respuesta muy altos (más de 100) es posible realizar pronós ticos aproximados con modelos basados en datos con distribución Normal. Otros estudios aplicados a datos de conteo muestran algunos modelos sim ples como distribuciones empíricas o modelos de suavización exponencial. Kolasa (2016) compara pronósticos realizados con distribuciones empíricas, con la Poisson y Binomial Negativa; por otro lado, Wallström y Segerstedt (2010) comparan el método de suavización exponencial con otros como el de Croston.

Se observa, entonces, que la literatura exhibe estudios que muestran resul tados de pronósticos elaborados con modelos clásicos basados en la distribu ción normal o en la Poisson, pero también estudios de modelos con diferentes teorías de estimación como la bayesiana (Zellner, 1996; Valencia, 2016).

La comparación de pronósticos de la demanda del sector turístico en Me dellín es un tema que no ha sido abordado en Colombia usando modelos de regresión clásica y de regresión Bayesiana. En este trabajo se propone com parar un modelo de pronósticos econométrico clásico con dos bayesianos: uno basado en la regresión del autor Zellner, que asume una distribución normal para los datos y parámetros, y otro basado en MCMC (Monte Carlo por Cadenas de Markov), que asume la distribución Poisson para los datos y parámetros bajo la Distribución Normal Multivariada. Estos modelos son aplicados al caso de entradas de turismo a la ciudad de Medellín, Colombia, sin modificar las distribuciones de probabilidad iniciales para este trabajo. Es to puede proponerse en futuras aplicaciones, incluso, con diferentes formas de muestreo.

Con esta investigación se busca responder los siguientes interrogantes: ¿cuáles variables tienen más incidencia sobre la llegada de turistas a la ciu dad (fechas, clima, estaciones, meses)?, ¿con cuáles modelos es posible ajustar mejor la dinámica de demanda de turismo?, ¿la teoría Bayesiana es útil para efectuar pronósticos sobre la demanda de turismo?

Este artículo se presenta en el siguiente orden. En la sección I, se mues tra una revisión de literatura. En la sección II, se muestran los modelos a estimar e indicadores comparativos. En la sección III, se presentan los re sultados, donde se mostrará una exploración de datos y los modelos estima dos para ambas series de turistas (colombianos y extranjeros). La sección IV muestra la discusión de resultados. Finalmente se presentan las conclusiones y referencias.

I. Revisión de la literatura

El turismo en el mundo ha sido un tema de interés para la economía de muchos países (Crouch, 1995; Guizzardi & Mazzocchi, 2010; Lim, 1999; Peng, Song & Crouch, 2014; Zhou, Bonham & Gangnes, 2007). La deman da en este sector ha sido analizada desde el punto de vista de pronóstico en numerosos estudios a nivel internacional (Guizzardi & Stacchini, 2015; Song, Gao & Lin, 2013; Liu et al., 2014). Algunas de las revisiones literarias muestran una descripción completa de los métodos usados en la modelación y pronós tico de las demandas turísticas, que van desde las perspectivas econométricas clásicas has las nuevas técnicas de pronóstico emergentes, que emplean teoría estadística o matemática (Witt & Witt, 1995; Li, Song & Witt, 2005; Song & Li, 2008).

No obstante, en Colombia algunos estudios realizados se han centrado en el análisis del gasto, o en los servicios que se ofrecen al turista. Den tro de este grupo de trabajos se puede resaltar el efecto de la seguridad y el comercio, abordado por Bonilla y Moreno (2010), quienes, mediante un modelo de datos de panel, encuentran que los arribos de viajeros extranjeros es tán inversamente relacionados con los secuestros, y el índice de intercambio comercial lo hace de forma positiva. Otros trabajos han analizado las diná micas locales de los movimientos de viajeros. Cerda y Leguizamón (2005), por ejemplo, encuentran por medio de modelos hedónicos que la demanda interna de agentes nacionales por consumo de un bien turístico depende en gran manera del perfil del jefe de hogar, su poder adquisitivo y la composi ción familiar. A nivel de municipalidades o locaciones específicas, por ejem plo el caso de Cartagena, los estudios se centran en observar el impacto de las fluctuaciones cambiarias en la demanda turística (Galvis & Aguilera, 1999)2. Ahora bien, no se ha hecho un comparativo en pronósticos que evalúe los efectos estacionales de las demandas turísticas para la ciudad de Medellín, caracterizando a su vez, algunos factores controlables, que son importantes para proveer herramientas de planeación para el sector turístico y fomentar estrategias de mejoras en los servicios que se ofertan.

El tipo de modelos propuestos para el pronóstico, a nivel internacional, varía acorde con algunas características de las series de demandas turísticas, por ejemplo, hay estudios de su comportamiento lineal o no lineal (Chen, 2011); pero también se estudia la relación de flujos de turistas con las capa cidades de alojamientos (Zhou et al., 2007), o la inherencia de esta demanda con su ciclo de negocios (Guizzardi & Mazzocchi, 2010).

Existen modelos en los que se relaciona el pronóstico de demandas, con la optimización de recursos, como el caso de demandas e inventarios; para ello, se han usado muchos modelos estadísticos clásicos (Bes & Sethi, 1988; Gutiérrez & Vidal, 2008; Choi, Li & Yan, 2003; Samaratunga, Sethi & Zhou, 1997; Sarimveis et al., 2008) y luego su salida es usada para modelar los in ventarios. Vidal, Londoño y Contreras (2004), por ejemplo, implementan téc nicas sencillas de pronósticos y de control de inventarios. Cohen y Dunford (1986) proponen un modelo basado en una distribución empírica para la de manda y afirman que el requerimiento de una distribución normal para los residuales de los modelos ARIMA (Modelos Integrados Autorregresivos de Medias Móviles) y de regresión no se cumple en muchos casos. Shoesmith y Pinder (2001) emplean modelos VAR (Vector Autorregresivo) y BVAR (Ba yesian Vector Autorregresivo), usando pocos datos de la demanda de los pro ductos estudiados.

Frente a modelos para datos de conteo, existen trabajos comparativos recientes, basados en distribuciones empíricas, Poisson y Binomial negativa, presentados en Kolasa (2016), el cual está basado en Syntetos et al. (2011). A partir de una comparación de indicadores de error con probabilidad, estos trabajos encuentran un mejor desempeño de modelos basados en distribu ción empírica en comparación con los de la distribución Poisson y Bootstrap. Por su parte, Wallström y Segerstedt (2010) presentan el suavizado exponen cial simple (SES-Single Exponential Smoothing) versus Croston y algunas variaciones, aplicados para demandas intermitentes o no3, y encuentra que el modelo SES tiene mejor desempeño frente al de Croston cuando utiliza diferentes indicadores de error para elegir el mejor modelo. Para el caso del tema turístico, se encuentra el trabajo de Hellström (2002) que estima mode los de valor entero autorregresivos de media móvil (INARMA) para estudiar la interacción entre la elección del número de viajes de ocio de los hogares y el número de pernoctaciones.

La estadística Bayesiana ha ganado importancia para efectuar pronósti cos hace algún tiempo. Por ello, se han elaborado diferentes trabajos y textos basados en inferencia predictiva, valor esperado o modelos dinámicos baye sianos que muestran su utilidad para elaborar pronósticos, de forma univaria da o multivariada, basados en información a priori para los parámetros, para los datos y, quizá, información de expertos (Fei, Lu & Liu, 2011; Harrison & Stevens, 1976; De Mol, Giannone & Reichlin, 2008; Neelamegham & Chinta gunta, 1999; West & Harrison, 1997; Valencia, 2016). Un modelo de regresión Bayesiana, que es desarrollado en Zellner (1996), se basa en una distribución no informativa para los parámetros y una distribución normal para los datos, lo cual es posible suponer de manera aproximada cuando la serie de datos tie nen valores muy grandes, así sean discretos, como son la cantidad de turistas de las series temporales de este trabajo. Este modelo será usado para pronosticar la serie mensual de turistas que ingresan a la ciudad de Medellín, en el periodo temporal de 2007 a 2014, y su ajuste será comparado con un mode lo de pronósticos econométrico clásico, y otro bayesiano basado en MCMC (con MCMCpoisson), para determinar así, cual es el mejor modelo que facilite la mejor interpretación del comportamiento de dicha serie de turistas.

II. Métodos

Para iniciar el análisis en series temporales, se hace un corte en la serie de datos, de N valores, T(T < N) serán usados para analizar correlación y análisis descriptivo y para estimar modelos; los N − T restantes serán usados para validar la estimación y para determinar si el modelo tiene una capacidad de pronóstico adecuada. Se realiza un análisis estadístico detectando inicial mente valores atípicos y problemas de variabilidad de los valores de demanda turística de la ciudad de Medellín.

A. Modelo econométrico

El modelo econométrico es un modelo de regresión que contempla va riables autorregresivas endógenas, así como otras exógenas que pueden estar asociadas a la respuesta zt (Caridad y Ocerin, 1998; Bowerman, Oconnell & Koheler, 2007), partiendo de la ecuación general dada por (1):

1
0120-2596-le-86-00199-e1.png ()

Dentro de las covariables a estudiar se encuentran: rezagos de primer or den y estacional, el tiempo, una variable sinusoidal, variable mes como factor, temperatura, IPC, TRM y el consumo de energía por actividad económica. Se realizará un proceso de selección de variables de tipo paso a paso, vali dando el modelo final con las premisas de residuos (normalidad, varianza e incorrelación) y obteniendo al final el indicador de ajuste MAPE (error medio absoluto porcentual) y error relativo de pronóstico, con mayor eficiencia para la predicción. Estos indicadores de error serán comparados con el modelo de regresión clásica.

El MAPE suele ser útil para expresar de una forma simple, en términos porcentuales genéricos, el error cometido, incluso para alguien que no tiene idea de lo que constituye un error de “grande” como, por ejemplo, lo relativo a grandes montos de dinero; en especial, este indicador puede ser adecuado para cantidades que son mayores de una unidad. Cuando toma valores cerca nos a cero, se recurre más a menudo a utilizar el indicador MSE (Mean Square Error), RMSE (Root of Mean Square Error), sMSE (scale Mean Square Error) (Kolasa, 2016), o incluso la medida sMAPE (symmetric Mean Absoute Per centage Error) (Wallström & Segerstedt, 2010), ya que no incrementa más el porcentaje de error en estos casos cercanos al cero. Autores como Petris, Pe trone y Campagnoli (2009), quienes muestran en su libro aplicaciones de los modelos dinámicos bayesianos usando el software R, mencionan que el MA PE es una de las estadísticas más usadas para comparación de pronósticos, y se utiliza junto con otras dos: MAD (Mean Absolute Deviation) y MSE o RMSE, para comparar modelos.

En este trabajo se usan los criterios RMSE, MAPE y sMAPE (ver ecua ciones (2), (3) y (4)) para medir el desempeño en el ajuste y pronóstico sobre estimaciones de modelos clásicos y bayesianos, con respuestas que toman va lores muy altos y diferentes de cero, como son las series de tiempo de cantidad de turistas usadas aquí. Además de esto, se realizan procesos de selección y pruebas con relación a la significancia de covariables y, adicionalmente, prue bas de normalidad.

2
0120-2596-le-86-00199-e2.png ()

3
0120-2596-le-86-00199-e3.png ()

4
0120-2596-le-86-00199-e4.png ()

B. Modelo de regresión lineal bayesiano basado en la normal para los datos

En la teoría de la toma de decisiones, la probabilidad juega un papel fun damental. Las probabilidades previas de estados de la naturaleza pueden ser consideradas a priori con un carácter subjetivo, pero pueden diferir un poco de las reales (Hillier & Hillier, 2007). Con base en los principios del teorema de Bayes, al combinar el producto entre una probabilidad a priori con una condicionada a un hecho se obtiene lo que se conoce como probabilidad a posteriori. Estos principios son utilizados por la estadística bayesiana para inferir, por ejemplo, usando predicciones (Gill, 2007; Gelman et al., 2004).

En la Estadística Bayesiana, los parámetros de la ecuación de regresión no son fijos, sino que se pueden comportar acorde con una función de distribu ción, llamada a priori. Al utilizar el teorema de Bayes, es posible usar la premisa acerca de que el producto entre la distribución a priori para el parámetro y la verosimilitud de los datos genera un conocimiento de dicho parámetro, por medio de la distribución a posteriori. Zellner (1996) realiza la construcción del modelo de regresión a partir de las premisas: una distribución a priori no informativa: 1/σ, para los parámetros β, τ del modelo, y una distribución normal para los datos; con ello se construye la verosimilitud de la muestra. El producto entre dicha distribución a priori y la verosimilitud genera la a poste riori de dichos parámetros. Seguido a esto, la integral entre la distribución de los datos, multiplicada por la distribución a posteriori, genera la distribución predictiva bayesiana, función finalmente usada para pronósticos de la variable respuesta.

Zellner (1996) propone el uso de una distribución a priori no informativa: 1/σ para los parámetros. La función de verosimilitud de los datos, basada en la distribución normal, está dada por (5):

5
0120-2596-le-86-00199-e5.png ()

Luego del producto entre la distribución a priori por la verosimilitud (5) se obtiene la distribución a posteriori (6):

6
0120-2596-le-86-00199-e6.png ()

donde 0120-2596-le-86-00199-i007.png

La distribución predictiva, obtenida luego de hacer la integral entre la dis tribución de los datos y la distribución a posteriori (6), es una distribución T de Student (Zellner, 1996), con la cual se generan las estimaciones de la respuesta buscada, en este caso: turistas colombianos y turistas extranjeros, usando X como la matriz de diseño donde se incluyen las covariables.

C. Modelo de regresión Poisson bayesiano

Este modelo parte de las premisas de una distribución Poisson para los datos y una distribución a priori Normal Multivariada para el vector de pará metros β, que permiten obtener una distribución a posteriori de los paráme tros del modelo de regresión. La estimación del modelo puede hacerse con el paquete MCMCpack del programa R (Martin, Quinn & Park, 2011), cuya fun ción MCMCpoisson, permite muestrear los parámetros de dicha distribución a posteriori, usando un algoritmo llamado Metropolis de caminata aleatoria. Con esto se obtienen estadísticas para cada uno de los parámetros, como la media o los percentiles, que se reemplazan como parámetros del modelo de regresión y, de ésta forma, encontrar la respuesta media, que es el logaritmo natural de la serie original de los datos.

En resumen, la base teórica parte de una distribución de los datos, yi ~ Poisson(mui), con la función link inversa para la media mui = exp(Xβ), y el vector de parámetros β ~ N(b 0, B0 -1). Luego de hacer el producto de la distribución a priori por la de los datos, se obtiene la distribución a posteriori, de la cual se establecen condicionales por cada parámetro, y con éstas se hace el muestreo MCMC. De este modo se obtienen estadísticas de los parámetros β para la función inversa: 0120-2596-le-86-00199-i008.png por ejemplo, la media y la mediana, y con cada una de éstas es posible escribir el modelo ajustado, pero es necesario transformar nuevamente la respuesta estimada 0120-2596-le-86-00199-i009.png con exp(Z) = mui en la escala original.

III. Resultados

Variables respuesta: Serie A: Turistas colombianos, Serie B: Turistas ex tranjeros. Periodo: años 2007 a 2014. N = 96, T = 72, periodos de pronós tico: 24 (2 años).

A. Análisis exploratorio

Es común medir la actividad económica por medio del PIB; no obstante, las cifras estadísticas oficiales pueden presentar un sesgo optimista sobre el crecimiento de la economía. Por tanto, se puede interpretar un indicador efec tivo como el IPC para que los agentes económicos de la industria del turismo en Colombia puedan establecer unas asociaciones posibles y, con ello, utilizar dichas relaciones en los procesos de toma de decisiones. Similarmente, la ac tividad económica asociada al consumo de energía puede servir, en general, para diagnosticar si las tendencias del turismo en Colombia se relacionan o no con dicho consumo, sin excluir el sector informal de la economía4, estimando su efecto con los modelos que se presentan aquí.

Para alcanzar diagnósticos aceptables, se probaron diferentes variables utilizadas en la literatura, optando por explorar factores e índices que, por su naturaleza, guardan una relación estrecha con el dinamismo de la economía y, por supuesto, con el turismo. Tal es el caso de la cantidad de kilovatios hora de energía gastados en la ciudad en actividades económicas residencial, industrial y comercial para el mes respectivo, covariables que son usadas en la exploración de los modelos clásicos. Sin embargo, como se verá, no todas estas variables muestran asociaciones importantes con el flujo turístico.

Las series tienen tendencias lineales crecientes, con una variación que po dría ser cíclica (Gráfico 1). La característica de las variables discretas puede ocasionar que sea necesaria una transformación en los datos para inferir acer ca de su comportamiento; sin embargo, para efectos de comparar la capacidad predictiva del modelo regresivo normal con el bayesiano, no se realizará dicha transformación.

Gráfico 1

Series de tiempo: turistas colombianos, extranjeros, porcentaje de ocupación hotelera

0120-2596-le-86-00199-gch1.jpg

La serie A (turistas colombianos) presenta autocorrelación estacional, tal como se aprecia en los valores de autocorrelaciones significativas saliendo de las bandas de confianza, en los periodos estacionales semestrales en el Gráfico 2. Similarmente ocurre para la serie B (turistas extranjeros). Las característi cas encontradas en las series temporales muestran la necesidad de incorporar componentes que modelen estacionalidad y correlación (como variables auto rregresivas), así como variables indicadoras (que toman valores 1 o 0) (como el mes del año) o trigonométricas (senuidal o cosenoidal), probando hasta en contrar las variables con mayor significancia en el modelo. Si bien las series evidentemente no son estacionarias, dado que los valores de autocorrelación de los periodos entre 1 y L son estadísticamente diferentes de cero (ver Grá fico 2), la estimación del modelo de regresión tiene grandes ventajas por la inclusión de covariables que permiten modelar los componentes estacionales, como variables indicadoras y variables rezagadas que capturan este tipo de comportamientos y correlación de la serie. De esta manera se pueden generar residuales incorrelacionados, como se demuestra con el análisis presentado.

Gráfico 2

Autocorrelación y autocorrelación parcial para las series de tiempo: turistas colombianos, extranjeros

0120-2596-le-86-00199-gch2.jpg

Al realizar un análisis del comportamiento de variables, como IPC, y el gasto energético de actividades económicas, como residencial e industrial (ver Gráfico 3), se aprecia un aparente grado de disminución en el tiempo, lo que es contrario a las series de turistas que tienen tendencia a incrementarse.

Gráfico 3

Comportamiento de variables explicativas IPC, actividad económica residencial, actividad económica industrial

0120-2596-le-86-00199-gch3.jpg

La exploración de los promedios de turistas por mes, que se observan en el Gráfico 4, refuerza el análisis de la incidencia de dicho factor sobre las series, pues se aprecia que en los meses de junio, julio, enero y diciembre es mayor el total de turistas colombianos, mientras que en los meses de julio, agosto y diciembre vienen más turistas extranjeros, ya que estos meses corresponden a las vacaciones de los países respectivos.

Gráfico 4

Medias de turistas colombianos y extranjeros por mes

0120-2596-le-86-00199-gch4.jpg

B. Modelo lineal econométrico

Los modelos se estiman tomando en consideración la autocorrelación de tectada previamente, para ello se incluyen rezagos de la misma serie; para la estacionalidad detectada, se incluye el mes como variable indicadora. Estos modelos ayudan de manera exploratoria a detectar los efectos más signifi cativos en relación con las covariables mencionadas, y con éstas mismas se pueden ajustar los modelos bayesianos posteriormente.

La Tabla 1 muestra las tablas ANOVA tipo III estimadas para cada una de las series analizadas con los modelos de regresión.

Tabla 1

ANOVA tipo III para los dos modelos estimados

0120-2596-le-86-00199-gt1.png

[i]Fuente: elaboración propia.

En las tablas ANOVA se aprecia que todas las variables quedan signifi cativas para explicar la respuesta (valor p < 0, 05) en los respectivos mode los, luego del proceso de selección por pasos. Los coeficientes estimados se aprecian en la segunda columna de la Tabla 2. El rezago de orden 1 (Zt−1) es significativo para explicar la cantidad de turistas, tanto colombianos co mo extranjeros, lo cual indica la dependencia con respecto al valor del mes anterior.

Tabla 2

Valores de los coeficientes para los modelos estimados

0120-2596-le-86-00199-gt2.jpg

[i]Fuente: elaboración propia.

La Tabla 3 presenta los indicadores de ajuste para cada modelo estimado.

Tabla 3

Indicadores de error y validación de cada modelo

0120-2596-le-86-00199-gt3.png

[i]Fuente: elaboración propia.

La tabla 3 muestra, en la primera línea, los valores MAPE de ajuste para el modelo de regresión clásica. El menor valor de error MAPE se da en la serie de los turistas extranjeros, con 14 %, y los colombianos, con 15 %. La incorrelación en todos los residuales se cumple; es decir, los residuales tienen estacionariedad, pero no se comportan bajo la distribución normal, en los dos primeros modelos de las series de turistas (valor p< 0, 05). Los residuales no se comportan con dicha distribución porque existen puntos atípicos que lo implican, pero no deben eliminarse porque, de hecho, su información es muy valiosa para la estimación de estos modelos. Se hacen transformaciones de las variables respuesta como logaritmo natural, raíz cuadrada y potencia de Box Cox. Sin embargo, ninguna mejora el problema de no normalidad5.

En el Gráfico 5 se aprecian los valores observados (en negro), el ajuste (en línea punteada) de los modelos finales econométricos estimados para las series de turistas colombianos y extranjeros, y los respectivos intervalos de confianza al 95 %, bajo la distribución normal (en gris). Aunque se aprecia la mayoría de valores reales (en negro) dentro de los intervalos quedan por fuera algunos un poco extremos.

Gráfico 5

Ajuste de modelos econométricos para las series de turistas colombianos y extranjeros

0120-2596-le-86-00199-gch5.jpg

C. Modelos de regresión bayesiana

1) Regresión bayesiana basada en la distribución normal para los datos

Las variables explicativas que fueron encontradas significativas en el mo delo de regresión anterior, que reflejan el comportamiento que se visualizó en el análisis de autocorrelación, serán incluidas en estos modelos de regresión Bayesiana. En el primer modelo Bayesiano ajustado, se utiliza la fórmula con las covariables: rezago de orden 1, tiempo (tendencia), y como variable esta cional, el mes. En el Gráfico 6 se aprecia la línea de valores reales (en negro) vs valores ajustados (en línea punteada), para cada una de las series de tiempo de izquierda a derecha: turistas colombianos y extranjeros, con los respectivos intervalos del 95 % de probabilidad (en gris) de la distribución predictiva T de Student, con la cual se realizan los pronósticos.

Gráfico 6

Ajuste de los modelos de regresión bayesianos bajo la distribución normal para los datos Nota: Intervalos del 95 % (límites bilaterales, en los percentiles 2,5 % y 97,5 %).

0120-2596-le-86-00199-gch6.jpg

El ajuste del modelo bayesiano visto en el Gráfico 6 se basa en el percentil 50 de la distribución predictiva T de Student del modelo con la cuarta ecuación de la Tabla 4. Se observa cómo el ajuste se acerca mucho a la línea de datos reales. Además, los intervalos son un poco más amplios que los del modelo clásico y contienen más valores reales que los intervalos de éste.

Se estimaron diferentes modelos de regresión bayesiana con la distribu ción no informativa explicada en la sección I.B. Se usaron los percentiles 25 %, 50 % y 75 % de la distribución predictiva para encontrar diferentes valores ajustados acorde con cada ecuación previamente establecida y así determinar el mejor valor posible. Se estiman tres indicadores, MAPE, sMAPE, RMSE, con todos los valores observados vs los estimados. Estos resultados se mues tran en la Tabla 4.

Tabla 4

Indicadores estimados por serie, percentil y modelo

0120-2596-le-86-00199-gt4.png

[i]Fuente: elaboración propia.

Los mínimos indicadores hallados son menores que los encontrados para el modelo de regresión econométrico de la Tabla 3, para los tres indicadores, siendo la cuarta la mejor ecuación de covariables: y t−1, t, Sin, mes (tabla 4). Los datos señalados en cursiva para esta ecuación en cada serie son los mejores, los cuales corresponden a la mediana (50 %). Los tres indicadores coinciden en el resultado, lo cual muestra la efectividad que tienen para este tipo de valores tan altos en las series de tiempo.

2) Regresión bayesiana basada en la distribución Poisson para los datos

Tomando en cuenta los resultados de significancia determinados con los modelos de regresión para las series de turistas, se usaron las covariables fi nales de mayores efectos sobre la respuesta para estimar los modelos de re gresión Poisson bayesiana, vía MCMC, llegando a los siguientes resultados.

Los coeficientes se simulan de la distribución a posteriori, y la salida de R provee estadísticas de dichas muestras de cada coeficiente, como la media y diferentes percentiles. Con cada percentil es posible ajustar los valores de la regresión Poisson bayesiana. La Tabla 5 muestra la salida de R para la serie de datos de turistas colombianos, una tabla similar sale para la serie de turistas extranjeros, pero con las variables IPC y actividad económica industrial, como las variables encontradas para el modelo clásico. Con los valores de las medias y los percentiles 25 %, 50 % y 75 %, se pueden estimar 4 modelos por cada serie, cuyos indicadores de error MAPE, sMAPE y RMSE se muestran en la Tabla 6.

Tabla 5

Resultados de MCMC poisson para turistas colombianos

0120-2596-le-86-00199-gt5.png

[i]Fuente: elaboración propia.

En la Tabla 6 se aprecian indicadores más altos que los encontrados en los modelos anteriores. Sin embargo, no son valores muy malos en compara ción con la regresión bayesiana anterior, pero son mejores que los del modelo clásico. Lo anterior podría dejar este modelo como alternativa frente a otros casos de datos discretos que no tengan escalas muy altas para aproximar el modelo de regresión bayesiana bajo la escala normal.

Tabla 6

Indicadores de error de los modelos de la regresión Poisson bayesiana

0120-2596-le-86-00199-gt6.png

[i]Fuente: elaboración propia.

En el Gráfico 7, donde se aprecia el ajuste en línea punteada y límites de confianza en color gris, se observan un poco más datos por fuera de los inter valos estimados para este modelo vía MCMC, situación que en los anteriores modelos puede derivar en mayores errores al pronosticar.

Gráfico 7

Ajuste de los modelos Poisson bayesianos vía MCMC: turistas colombianos, extranjeros Nota: Intervalos al 95 % de la muestra de MCMC (Límites bilaterales, en los percentiles 2,5 % y 97,5%).

0120-2596-le-86-00199-gch7.jpg

IV. Discusión

Es importante notar que la regresión Bayesiana, tanto el modelo baye siano basado en la aproximación normal de los datos como el basado en la distribución Poisson con muestreo por MCMC, puede proporcionar un re sultado adecuado para predecir demandas turísticas, en modelos con cova riables muy similares a las encontradas en la regresión clásica, con mejores indicadores de error de ajuste. Modelos que también pueden ser comparados con otros como los usados con distribución empírica, binomial negativa, de regresión Poisson con bootstrap, en (Kolasa, 2016), o modelos dinámicos li neales, o incluso, con intervención de expertos, aspecto que incrementaría la información para realizar planeación de recursos y disponibilidades hoteleras por mes, mejorando las posibilidades de ingresos.

Conclusiones

Se encontraron modelos con adecuada representación de la variación tem poral de las series de turistas que llegan a Medellín, colombianos o extranje ros, diferentes a los modelos clásicos, basados en Estadística Bayesiana. Así mismo, se hallaron indicios de comportamientos estacionales, reflejados en la presencia de la variable indicadora mes, además, se encontró un impacto significativo del valor de turistas rezagado de orden 1, para explicar el com portamiento de la cantidad de ambos tipos de turistas que llegan a esta ciudad, es decir, tiene una dependencia temporal de primer orden. Esto permitió ca racterizar el comportamiento de este sector de la economía colombiana, y con ello, ayudar en la planeación de dicho sector.

Al usar los indicadores de errores sMAPE y RMSE -que son muy útiles en casos generales, en especial robustos cuando las respuestas se acercan a cero- se corrobora que el indicador MAPE puede ser apropiado, pero solo en casos en los que los datos toman valores muy altos, como se ve en este trabajo, alrededor de 5000 o más turistas por mes.

La variable mes también es una variable estadísticamente significativa en las demandas de turismo de colombianos y extranjeros, resultado que permite identificar los periodos de mayor incidencia para la planeación de recursos hoteleros. Por ejemplo, para los colombianos, las vacaciones entre diciembre-enero y junio-julio representan temporadas para visitar la ciudad de Medellín, y anualmente se repite dicho comportamiento.

Las asociaciones negativas, encontradas con los gastos energéticos, po drían deberse a diversas razones, una de ellas puede ser que los periodos de mayor flujo turístico son las vacaciones de los sectores educativos; sin em bargo, es necesario usar otro tipo de técnicas investigativas para determinar si hay algún grado de disminución de actividades o alguna otra razón.

Puede considerarse para futuros estudios la planeación de disponibilidad de hoteles en la ciudad, analizando la incidencia del mes, dados los resultados de éste estudio. Con ello, se puede requerir mayores recursos en los meses encontrados con mayor incidencia de los turistas extranjeros, como son: julio, agosto y diciembre, temporadas en que también se programan eventos de ciudad como la feria de las flores, en agosto, y los alumbrados, en diciembre. Por todo esto es importante programar estrategias de atención y cobertura de los servicios requeridos por este tipo de turistas.

Referencias

Agencia EFE (18 de septiempre de 2014). Informalidad del turismo en Colombia impide su crecimiento, según expertos. El Heraldo. Recupe rado de: http://www.elheraldo.co/turismo/informalidad-del-turismo-en colombia-impide-su-crecimiento-segun-expertos-167437

Agencia EFE 18092014Informalidad del turismo en Colombia impide su crecimiento, según expertosEl Heraldohttp://www.elheraldo.co/turismo/informalidad-del-turismo-en colombia-impide-su-crecimiento-segun-expertos-167437

Bes, Christian & Sethi, Suresh (1988). “Concepts of forecast and decision horizons: Applications to dynamic stochastic optimization problems”, Mathematics of Operations Research, Vol. 13, No. 2, pp. 295-310.

Christian Bes Suresh Sethi 1988Concepts of forecast and decision horizons: Applications to dynamic stochastic optimization problemsMathematics of Operations Research132295310

Bonilla, Jorge Mauricio & Moreno, María Margarita (2010). Determinan tes de la demanda de turismo en Colombia 2004-2007: seguridad, comercio y otros factores. Tesis de Pregrado para optar al título de Economista, Fa cultad de Economía, Universidad del Rosario, Colombia.

Jorge Mauricio Bonilla María Margarita Moreno 2010Determinan tes de la demanda de turismo en Colombia 2004-2007: seguridad, comercio y otros factoresEconomistaFa cultad de Economía, Universidad del RosarioColombia

Bowerman, Bruce L.; Oconnell, Richard T. & Koheler, Anne B. (2007). Pronósticos, series de tiempo y regresión: un enfoque aplicado. México: Cen gage Learning Editores S.A.

Bruce L. Bowerman Richard T. Oconnell Anne B Koheler 2007Pronósticos, series de tiempo y regresión: un enfoque aplicadoMéxicoCen gage Learning Editores S.A

Brown, Robert Goodell (1959). Statistical Forecasting for Inventory Control. New York: McGraw-Hill.

Robert Goodell Brown 1959Statistical Forecasting for Inventory ControlNew YorkMcGraw-Hil

Brown, Robert Goodell (1963). Smoothing, Forecasting and Prediction of Dis crete Time Series. New Jersey: Prentice Hall, Englewood Cliffs.

Robert Goodell Brown 1963Smoothing, Forecasting and Prediction of Dis crete Time SeriesNew JerseyPrentice Hall, Englewood Cliffs

Caridad y Ocerin, José María (1998). Econometria: Modelos Econométricos y series temporales. Barcelona: Editorial Reverté.

José María Caridad y Ocerin 1998Econometria: Modelos Econométricos y series temporalesBarcelonaEditorial Reverté.

Cerda, Rosa & Leguizamón, Manuel (2005). “Análisis del comportamiento de la demanda turística urbana de Colombia”, Turismo y Sociedad, Vol. 4, pp. 70-98.

Rosa Cerda Manuel Leguizamón 2005Análisis del comportamiento de la demanda turística urbana de ColombiaTurismo y Sociedad47098

Chen, Kuan-Yu (2011). “Combining linear and nonlinear model in forecas ting tourism demand”, Expert Systems with Applications, Vol. 38, No. 8, pp. 10368-10376.

Kuan-Yu Chen 2011Combining linear and nonlinear model in forecas ting tourism demandExpert Systems with Applications3881036810376

Choi, T.; Li, D. & Yan, H. (2003). “Optimal two-stage ordering policy with Bayesian information updating”, Journal of the Operational Research So ciety, Vol. 54, No. 8, pp. 846-859.

T. Choi D. Li H Yan 2003Optimal two-stage ordering policy with Bayesian information updatingJournal of the Operational Research So ciety548846859

Claveria, Oscar & Torra, Salvador (2014). “Forecasting tourism demand to Catalonia: Neural networks vs. time series models”, Economic Modelling, Vol. 36, pp. 220-228.

Oscar Claveria Salvador Torra 2014Forecasting tourism demand to Catalonia: Neural networks vs. time series modelsEconomic Modelling36220228

Cohen, Rochelle & Dunford, Fraser (1986). “Forecasting for Inventory Control: An Example of When ‘Simple’ Means ‘Better”’, Interfaces, Vol. 16, No. 6, pp. 95-99.

Rochelle Cohen Fraser Dunford 1986Forecasting for Inventory Control: An Example of When ‘Simple’ Means ‘BetterInterfaces1669599

Croston, J.D. (1972). “Forecasting and stock control for intermittent de mands”, Operational Research Quarterly, Vol. 42, No. 3, pp. 289-303.

J.D Croston 1972Forecasting and stock control for intermittent de mandsOperational Research Quarterly423289303

Crouch, Goeffrey (1995). “A meta-analysis of tourism demand”, Annals of tourism research, Vol. 22, No. 1, pp. 103-118.

Goeffrey Crouch 1995A meta-analysis of tourism demandAnnals of tourism research221103118

De Mol, Christine; Giannone, Domenico & Reichlin, Lucrezia (2008). “Forecasting using a large number of predictors: Is Bayesian shrinkage a valid alternative to principal components?”, Journal of Econometrics, Vol. 146, No. 2, pp. 318-328.

Christine De Mol Domenico Giannone Lucrezia Reichlin 2008Forecasting using a large number of predictors: Is Bayesian shrinkage a valid alternative to principal components?Journal of Econometrics1462318328

Fei, Xiang; Lu, Chung-Cheng & Liu, Ke (2011). “A bayesian dynamic linear model approach for real-time short-term freeway travel time prediction”, Transportation Research Part C:Emerging Technologies, Vol. 19, No. 6, pp. 1306-1318.

Xiang Fei Chung-Cheng Lu Ke Liu 2011A bayesian dynamic linear model approach for real-time short-term freeway travel time predictionTransportation Research Part C:Emerging Technologies19613061318

Galvis, Luis Armando & Aguilera, María Modesta (1999). “Determinantes de la demanda por turismo hacia Cartagena, 1987-1998”, Lecturas de Economía, No. 51, pp. 47-87.

Luis Armando Galvis María Modesta Aguilera 1999Determinantes de la demanda por turismo hacia Cartagena, 1987-1998Lecturas de Economía514787

Gelman, Andrew; Carlin, John; Stern, Hal & Rubin, Donald (2004). Ba yesian Data Analysis (2nd Ed.). Boca Raton, FL: CRC Press, Taylor & Francis Group.

Andrew Gelman John Carlin Hal Stern Donald Rubin 2004Ba yesian Data AnalysisBoca Raton, FLCRC Press, Taylor & Francis Group

Gill, Jeff (2007). Bayesian methods: A social and behavioral sciences approach (2nd Ed.). United States of America: Chapman & Hall.

Jeff Gill 2007Bayesian methods: A social and behavioral sciences approach2ndUnited States of AmericaChapman & Hall

Guizzardi, Andrea & Mazzocchi, Mario (2010). “Tourism demand for Italy and the business cycle”, Tourism Management, Vol. 31, No. 3, pp. 367-377.

Andrea Guizzardi Mario Mazzocchi 2010Tourism demand for Italy and the business cycleTourism Management313367377

Guizzardi, Andrea & Stacchini, Annalisa (2015). “Real-time forecasting regional tourism with business sentiment surveys”, Tourism Management, Vol. 47, pp. 213-223.

Andrea Guizzardi Annalisa Stacchini 2015Real-time forecasting regional tourism with business sentiment surveysTourism Management47213223

Gutiérrez, Valentina & Vidal, Carlos (2008) “Modelos de gestión de in ventarios en cadenas de abastecimiento: Revisión de la literatura”, Revista Facultad de Ingenieria, Vol. 43, pp. 134-149.

Valentina Gutiérrez Carlos Vidal 2008Modelos de gestión de in ventarios en cadenas de abastecimiento: Revisión de la literaturaRevista Facultad de Ingenieria43134149

Harrison, J. & Stevens, C. (1976). “Bayesian Forecasting”, Journal of the Royal Statistical Society. Series B (Methodological), Vol. 38, No. 3, pp. 205-247.

J. Harrison C Stevens 1976Bayesian ForecastingJournal of the Royal Statistical Society. Series B383. 205. 247

Hellström, Jörgen (2002). “Count data modelling and tourism demand”, Umeå Economic Studies, No. 584. Swedend: Umeå University.

Jörgen Hellström 2002Count data modelling and tourism demandUmeå Economic Studies584SwedendUmeå University

Hillier, Frederik & Hillier, Mark (2007). Métodos cuantitativos para admi nistración (3th Ed). México D.F.: McGraw-Hill.

Frederik Hillier Mark Hillier 2007Métodos cuantitativos para admi nistración3thMéxico D.F.McGraw-Hill

Kolasa, Stephan (2016). “Evaluating predictive count data distributions in retail sales forecasting”, International Journal of Forecasting, Vol. 32, No. 3, pp. 788-803.

Stephan Kolasa 2016Evaluating predictive count data distributions in retail sales forecastingInternational Journal of Forecasting323788803

Li, Gang; Song, Haiyan & Witt, Stephen (2005). “Recent developments in econometric modeling and forecasting”, Journal of Travel Research, Vol. 44, No. 1, pp. 82-99.

Gang Li Haiyan Song Stephen Witt 2005Recent developments in econometric modeling and forecastingJournal of Travel Research4418299

Lim, Christine (1999). “A meta-analytic review of international tourism de mand”, Journal of Travel Research, Vol. 37, No. 3, pp. 273-284.

Christine Lim 1999A meta-analytic review of international tourism de mandJournal of Travel Research373273284

Liu, Xiangyun; Peng, Hongqin; Bai, Yun; Zhu, Yujun & Liao, Lueling (2014). “Tourism Flows Prediction based on an Improved Grey GM(1,1) Model”, Procedia -Social and Behavioral Sciences, Vol. 138, pp. 767-775.

Xiangyun Liu Hongqin Peng Yun Bai Yujun Zhu Lueling Liao 2014Tourism Flows Prediction based on an Improved Grey GM(1,1) ModelProcedia -Social and Behavioral Sciences138767775

López, Ledys & Márquez, José Ignacio (2012). “Proyecto de observatorio de turismo para Medellín y Antioquia”, Revista Soluciones de Posgrado EIA, Vol. 5, No. 9, pp. 79-96.

Ledys López José Ignacio Márquez 2012Proyecto de observatorio de turismo para Medellín y AntioquiaRevista Soluciones de Posgrado EIA597996

Martin, Andrew; Quinn, Kevin & Park, Jong (2011). “MCMCpack: Mar kov Chain Monte Carlo in R.”, Journal of Statistical Software, Vol. 42, No. 9, pp. 1-21.

Andrew Martin Kevin Quinn Jong Park 2011MCMCpack: Mar kov Chain Monte Carlo in R.Journal of Statistical Software429121

Neelamegham, Ramya & Chintagunta, Pradeep (1999). “A Bayesian mo del to forecast new product performance in domestic and international markets”, Marketing Science, Vol. 18, No. 2, pp. 115-136.

Ramya Neelamegham Pradeep Chintagunta 1999A Bayesian mo del to forecast new product performance in domestic and international marketsMarketing Science182115136

Peng, Bo; Song, Haiyan & Crouch, Geoffrey (2014). “A meta-analysis of international tourism demand forecasting and implications for practice”, Tourism Management, Vol. 45, pp. 181-193.

Bo Peng Haiyan Song Geoffrey Crouch 2014A meta-analysis of international tourism demand forecasting and implications for practiceTourism Management45181193

Petris, Giovanni; Petrone, Sonia & Campagnoli, Patrizia (2009). Dynamic Linear Models with R. New York: Springer.

Giovanni Petris Sonia Petrone Patrizia Campagnoli 2009Dynamic Linear Models with RNew YorkSpringer

Samaratunga, Chand; Sethi, Suresh & Zhou, Xun Yu (1997). “Compu tational evaluation of hierarchical production control policies for sto chastic manufacturing systems”, Operations Research, Vol. 45, No. 2, pp. 258-274.

Chand Samaratunga Suresh Sethi Xun Yu Zhou 1997Compu tational evaluation of hierarchical production control policies for sto chastic manufacturing systemsOperations Research452258274

Sarimveis, Haralambos; Patrinos, Panagiotis; Tarantilis, Chris & Kira noudis, Chris (2008). “Dynamic modeling and control of supply chain systems: A review”, Computers & Operations Research, Vol. 35, No. 11, pp. 3530-3561.

Haralambos Sarimveis Panagiotis Patrinos Chris Tarantilis Chris Kira noudis 2008Dynamic modeling and control of supply chain systems: A reviewComputers & Operations Research351135303561

Shoesmith, G.L. & Pinder, J.P. (2001). “Potential Inventory Cost Reduc tions Using Advanced Time Series Forecasting Techniques”, Journal of the Operational Research Society, Vol. 52, No. 11, pp. 1267-1275.

G.L. Shoesmith J.P. Pinder 2001Potential Inventory Cost Reduc tions Using Advanced Time Series Forecasting TechniquesJournal of the Operational Research Society521112671275

Song, Haiyan & Li, Gang (2008). “Tourism demand modelling and forecasting-A review of recent research”, Tourism Management, Vol. 29, No. 2, pp. 203-220.

Haiyan Song Gang Li 2008Tourism demand modelling and forecasting-A review of recent researchTourism Management292203220

Song, Haiyan; Gao, Bastian Z. & Lin, Vera (2013). “Combining statistical and judgmental forecasts via a web-based tourism demand forecasting system”, International Journal of Forecasting, Vol. 29, No. 2, pp. 295-310.

Haiyan Song Bastian Z. Gao Vera Lin 2013Combining statistical and judgmental forecasts via a web-based tourism demand forecasting systemInternational Journal of Forecasting292295310

Syntetos, Aris; Babai, M. Zied; Lengu, David & Altay, Nezih (2011). “Dis tributional assumptions for parametric forecasting of intermittent de mand”. In: Altay, Nezih & Litteral, Lewis (Eds.), Service Parts Manage ment. Demand Forecasting and Inventory Control (pp. 31-52). London: Springer.

Aris Syntetos M. Zied Babai David Lengu Nezih Altay 2011Dis tributional assumptions for parametric forecasting of intermittent de mand Nezih Altay Lewis Litteral Service Parts Manage ment. Demand Forecasting and Inventory Control3152LondonSpringer

Valencia, Marisol (2016). Dynamic model for the multiproduct inventory op timization with multivariate demand. Tesis para optar al título de: PhD en Ingeniería-Industria y organizaciones, Facultad de Minas, Escuela de Ingeniería de la Organización, Universidad Nacional de Colombia.

Marisol Valencia 2016Dynamic model for the multiproduct inventory op timization with multivariate demandPhD en Ingeniería-Industria y organizacionesFacultad de Minas, Escuela de Ingeniería de la Organización, Universidad Nacional de Colombia

Vidal, Carlos; Londoño, Julio & Contreras, Fernando (2004) “Aplicación de Modelos de Inventarios en una Cadena de Abastecimiento de Produc tos de Consumo Masivo con una Bodega y N Puntos de Venta”, Ingenie ría y Competitividad, Vol. 6, No. 1, pp. 35-52.

Carlos Vidal Julio Londoño Fernando Contreras 2004Aplicación de Modelos de Inventarios en una Cadena de Abastecimiento de Produc tos de Consumo Masivo con una Bodega y N Puntos de VentaIngenie ría y Competitividad613552

Wallström, Peter & Segerstedt, Anders (2010). “Evaluation of forecasting error measurements and techniques for intermittent demand”, Interna tional Journal of Production Economics, Vol. 128, No. 2, pp. 625-636.

Peter Wallström Anders Segerstedt 2010Evaluation of forecasting error measurements and techniques for intermittent demandInterna tional Journal of Production Economics1282625636

West, Mike & Harrison, Jeff (1997). Bayesian Forecasting and Dynamic Models (2nd Ed.). New York. USA. : Springer Series in Statistics.

Mike West Jeff Harrison 1997Bayesian Forecasting and Dynamic Models2nd2ndNew York. USASpringer Series in Statistics

Witt, Stephen & Witt, Christine (1995). “Forecasting tourism demand: A review of empirical research”, International Journal of Forecasting, Vol. 11, No. 3, pp. 447-475.

Stephen Witt Christine Witt 1995Forecasting tourism demand: A review of empirical researchInternational Journal of Forecasting113447475

Zellner, Arnold (1996). An introduction to bayesian inference in econometrics (2nd Ed.). Canadá: Wiley Classics Library.

Arnold Zellner 1996An introduction to bayesian inference in econometrics2ndCanadáWiley Classics Library

Zhou, Ting; Bonham, Carl & Gangnes, Byron (2007). “Modelling the supply and demand for tourism: a fully identified VECM approach”, Working Papers, No. 2007-17. Department of Economics, University of Hawaii at Manoa.

Ting Zhou Carl Bonham Byron Gangnes 2007Modelling the supply and demand for tourism: a fully identified VECM approachWorking Papers2007-17Department of Economics, University of Hawaii at Manoa

[7]Este artículo es un producto derivado del proyecto de investigación “Flujos turísticos en Colombia: perspectivas y determinantes”, proyecto financiado por la Fundación Universitaria Autónoma de las Américas.

[8]También, se destaca el trabajo de López y Márquez (2012), en el que formulan un observatorio para el análisis del turismo y presentan su organización; sin embargo, a nivel de pronósticos de demanda, son pocos los trabajos existentes.

[9]Modelos que han sido usados por autores como Brown (1959; 1963).

[10]Según el presidente ejecutivo de la Asociación Hotelera y Turística de Colombia (Cotelco), Gustavo Adolfo Toro, la informalidad alcanza un 30 % del gremio (Agencia EFE, 2014).

[11]Una razón que justifica aún más el uso del modelo bayesiano descrito y cuyo algoritmo en R se desarrolla y presenta en este artículo (Zellner, 1996), ya que los modelos propuestos no se restringen a este supuesto restrictivo sobre sus residuos.


This display is generated from JATS XML (modified by UdeA) with jats-html.xsl. The XSLT engine is libxslt.

Resumen : 1046

Métricas de artículo

Cargando métricas ...

Metrics powered by PLOS ALM
';





Esta publicación hace parte del Sistema de Revistas de la Universidad de Antioquia
¿Quieres aprender a usar el Open Journal system? Ingresa al Curso virtual
Este sistema es administrado por el Programa Integración de Tecnologías a la Docencia
Universidad de Antioquia
Powered by Public Knowledge Project