Análisis de Series Temporales con Python y Prophet

El análisis de series temporales es una herramienta fundamental en diversas disciplinas, desde la economía y las finanzas hasta la meteorología y la ingeniería. Permite comprender patrones, tendencias y estacionalidades en datos que varían a lo largo del tiempo, lo que a su vez facilita la realización de predicciones informadas.

En este artículo, exploraremos cómo realizar análisis y predicciones de series temporales utilizando Python y la biblioteca Prophet, desarrollada por Facebook. Prophet está diseñada para trabajar con series temporales que exhiben fuertes patrones estacionales y tendencias, lo que la convierte en una opción ideal para una amplia gama de aplicaciones.

A lo largo de este artículo, cubriremos los conceptos básicos de las series temporales, la instalación y el uso de Prophet, la evaluación del modelo y un ejemplo práctico con datos económicos. ¡Prepárate para sumergirte en el fascinante mundo del análisis de series temporales!

Conceptos Básicos de Series Temporales

Una serie temporal es una secuencia de datos indexados en el tiempo. Estos datos pueden ser observaciones tomadas a intervalos regulares (por ejemplo, mediciones diarias de temperatura) o irregulares (por ejemplo, el tiempo entre fallas de un equipo).

Los componentes principales de una serie temporal son:

Tendencia: La dirección general en la que se mueve la serie a lo largo del tiempo (ascendente, descendente o estable).
Estacionalidad: Patrones repetitivos que ocurren a intervalos regulares (por ejemplo, picos de ventas en diciembre).
Ciclo: Fluctuaciones a largo plazo que no son necesariamente periódicas.
Ruido (o residuo): Variaciones aleatorias que no pueden ser explicadas por los componentes anteriores.

Es crucial comprender estos componentes para poder modelar y predecir series temporales con precisión.

Algunas operaciones comunes que se realizan en el análisis de series temporales son:

Descomposición: Separar la serie en sus componentes (tendencia, estacionalidad, ruido).
Suavizado: Reducir el ruido para resaltar la tendencia.
Pruebas de estacionariedad: Verificar si la serie tiene propiedades estadísticas constantes a lo largo del tiempo.
Autocorrelación: Medir la correlación entre una serie y sus valores pasados.

Uso de Prophet para Predicción

Prophet es una biblioteca de Python diseñada específicamente para la predicción de series temporales con fuertes componentes estacionales y de tendencia. Su API es sencilla e intuitiva, lo que la hace accesible incluso para aquellos que no tienen una amplia experiencia en modelado de series temporales.

Para instalar Prophet, puedes usar pip:

pip install prophet

El uso básico de Prophet implica los siguientes pasos:

Preparar los datos: Los datos deben estar en un DataFrame de Pandas con dos columnas llamadas ds (datestamp) e y (valor).
Crear un modelo Prophet: model = Prophet()
Ajustar el modelo a los datos: model.fit(df)
Crear un DataFrame para las predicciones futuras: future = model.make_future_dataframe(periods=365) (para predecir 365 días en el futuro)
Realizar las predicciones: forecast = model.predict(future)

Aquí tienes un ejemplo de código completo:


import pandas as pd
from prophet import Prophet

# Cargar los datos (ejemplo con datos ficticios)
data = {
 'ds': pd.to_datetime(['2023-01-01', '2023-01-02', '2023-01-03', '2023-01-04', '2023-01-05']),
 'y': [10, 12, 15, 13, 17]
}
df = pd.DataFrame(data)

# Crear y ajustar el modelo
model = Prophet()
model.fit(df)

# Crear un DataFrame para predicciones futuras
future = model.make_future_dataframe(periods=10)

# Realizar predicciones
forecast = model.predict(future)

# Imprimir las predicciones
print(forecast[['ds', 'yhat', 'yhat_lower', 'yhat_upper']].tail())

La columna yhat contiene la predicción, mientras que yhat_lower y yhat_upper representan los intervalos de confianza.

Prophet permite personalizar el modelo con parámetros como la estacionalidad (anual, semanal, etc.) y la inclusión de días festivos. Puedes encontrar más detalles en la documentación oficial de Prophet.

Evaluación del Modelo

Una vez que hayas entrenado tu modelo Prophet, es crucial evaluar su rendimiento para determinar su precisión y confiabilidad. Existen varias métricas que se utilizan comúnmente para evaluar modelos de series temporales.

Algunas métricas populares son:

Error Absoluto Medio (MAE): Promedio de las diferencias absolutas entre las predicciones y los valores reales.
Error Cuadrático Medio (MSE): Promedio de los cuadrados de las diferencias entre las predicciones y los valores reales.
Raíz del Error Cuadrático Medio (RMSE): Raíz cuadrada del MSE. Es más interpretable que el MSE ya que está en la misma unidad que los datos originales.
Error Porcentual Absoluto Medio (MAPE): Promedio de los errores porcentuales absolutos. Es útil para comparar el rendimiento de modelos en diferentes escalas.

Para calcular estas métricas, puedes utilizar bibliotecas como scikit-learn:


from sklearn.metrics import mean_absolute_error, mean_squared_error
import numpy as np

# Supongamos que tienes tus valores reales en 'y_true' y tus predicciones en 'y_pred'
y_true = df['y'][-10:] # últimos 10 valores reales
y_pred = forecast['yhat'][-10:] # últimos 10 valores predichos

# Calcular MAE
mae = mean_absolute_error(y_true, y_pred)
print(f'MAE: {mae}')

# Calcular MSE
mse = mean_squared_error(y_true, y_pred)
print(f'MSE: {mse}')

# Calcular RMSE
rmse = np.sqrt(mse)
print(f'RMSE: {rmse}')

# Calcular MAPE
def mape(y_true, y_pred):
 y_true, y_pred = np.array(y_true), np.array(y_pred)
 return np.mean(np.abs((y_true - y_pred) / y_true)) * 100

mape_value = mape(y_true, y_pred)
print(f'MAPE: {mape_value}')

Además de las métricas, es importante visualizar las predicciones junto con los valores reales para identificar posibles patrones de error.

También es recomendable realizar una validación cruzada de la serie temporal. Esto implica dividir la serie en múltiples conjuntos de entrenamiento y prueba, y evaluar el modelo en cada conjunto para obtener una estimación más robusta de su rendimiento. Prophet proporciona funciones integradas para realizar la validación cruzada.

Ejemplo con Datos Económicos

Para ilustrar el uso de Prophet con datos reales, utilizaremos un conjunto de datos de ejemplo que contiene información sobre el Producto Interno Bruto (PIB) de un país a lo largo del tiempo.

Primero, importaremos las bibliotecas necesarias y cargaremos los datos:


import pandas as pd
from prophet import Prophet
import matplotlib.pyplot as plt

# Cargar los datos desde un archivo CSV (reemplaza 'pib.csv' con tu archivo)
df = pd.read_csv('pib.csv')

#Convertir la columna 'fecha' a tipo datetime
df['fecha'] = pd.to_datetime(df['fecha'])

#Renombrar columnas para que coincidan con el formato de Prophet
df.rename(columns={'fecha': 'ds', 'pib': 'y'}, inplace=True)

print(df.head())

plt.figure(figsize=(10, 6))
plt.plot(df['ds'], df['y'])
plt.xlabel('Fecha')
plt.ylabel('PIB')
plt.title('Evolución del PIB')
plt.show()

Luego, crearemos y ajustaremos el modelo Prophet:


# Crear y ajustar el modelo
model = Prophet()
model.fit(df)

# Crear un DataFrame para predicciones futuras (5 años)
future = model.make_future_dataframe(periods=5*365)

# Realizar predicciones
forecast = model.predict(future)

print(forecast[['ds', 'yhat', 'yhat_lower', 'yhat_upper']].tail())

Finalmente, visualizaremos las predicciones:


# Visualizar las predicciones
fig1 = model.plot(forecast)
plt.show()

fig2 = model.plot_components(forecast)
plt.show()

Este ejemplo muestra cómo Prophet puede ser utilizado para predecir el PIB basándose en datos históricos. Puedes adaptar este código para analizar y predecir otras series temporales económicas, como el índice de precios al consumidor (IPC), las tasas de desempleo, etc.

En este artículo, hemos explorado el análisis de series temporales con Python y la biblioteca Prophet. Hemos cubierto los conceptos básicos de las series temporales, el uso de Prophet para la predicción, la evaluación del modelo y un ejemplo práctico con datos económicos.

Prophet es una herramienta poderosa y fácil de usar para la predicción de series temporales con fuertes componentes estacionales y de tendencia. Sin embargo, es importante recordar que ningún modelo es perfecto y que siempre es necesario evaluar su rendimiento y ajustar sus parámetros para obtener los mejores resultados.

Con la información proporcionada en este artículo, estás listo para comenzar a analizar y predecir tus propias series temporales. ¡Experimenta, explora y descubre el poder del análisis de series temporales!