Menu iconMenu icon
Fundamentos de Ingeniería de Datos

Proyecto 2: Pronóstico de Series Temporales con Ingeniería de Características

1.2 Características de Ventana Móvil para Capturar Tendencias y Estacionalidad

Otra técnica poderosa para el pronóstico de series temporales es la creación de características de ventana móvil. Estas características capturan tendencias y estacionalidad al resumir información sobre una ventana móvil de puntos de datos pasados. Al analizar una serie de observaciones consecutivas, las características de ventana móvil brindan una perspectiva dinámica sobre el comportamiento de los datos a lo largo del tiempo.

Algunas estadísticas comunes de ventana móvil incluyen:

  • Medias móviles: Estas medidas estadísticas suavizan eficazmente las fluctuaciones a corto plazo en los datos de series temporales, permitiendo la identificación y análisis de tendencias a largo plazo. Al calcular el promedio durante una ventana de tiempo especificada, las medias móviles pueden revelar patrones subyacentes que de otro modo podrían quedar oscurecidos por variaciones diarias. Por ejemplo, una media móvil de 7 días en cifras diarias de ventas puede descubrir tendencias semanales en el comportamiento del consumidor, proporcionando información valiosa para la gestión de inventarios y el pronóstico de ventas.
  • Medianas móviles: Como medida robusta de la tendencia central, las medianas móviles ofrecen una ventaja frente a las medias al tratar con conjuntos de datos que contienen valores extremos o atípicos ocasionales. Al seleccionar el valor medio dentro de una ventana de tiempo específica, las medianas móviles proporcionan una representación más estable de la tendencia central de los datos, siendo especialmente útiles en escenarios donde los valores atípicos podrían sesgar significativamente los resultados, como en series temporales financieras o ciertos conjuntos de datos ambientales.
  • Desviaciones estándar móviles: Estas medidas cuantifican la volatilidad o dispersión de los puntos de datos a lo largo del tiempo, ofreciendo información crucial sobre la estabilidad y predictibilidad de una serie temporal. Un aumento en las desviaciones estándar móviles puede señalar períodos de mayor incertidumbre o variabilidad, lo cual es particularmente valioso en la evaluación de riesgos y procesos de toma de decisiones. Por ejemplo, en los mercados financieros, el aumento de las desviaciones estándar puede indicar una mayor volatilidad del mercado, lo que lleva a los inversionistas a ajustar sus estrategias en consecuencia.
  • Mínimos y máximos móviles: Estas características son instrumentales para identificar los picos y valles dentro de una serie temporal, proporcionando una imagen clara del rango y extremos de los datos en un período específico. Esta información es especialmente pertinente en dominios como el análisis del mercado de valores, donde comprender los límites de precio puede informar estrategias de negociación, o en la previsión meteorológica, donde el seguimiento de los extremos de temperatura es crucial para predecir eventos climáticos severos y planificar respuestas adecuadas.

El tamaño de la ventana para estas características puede ajustarse según las características específicas de la serie temporal y los objetivos de pronóstico. Las ventanas más grandes capturan tendencias más amplias, pero pueden ser menos sensibles a los cambios recientes, mientras que las ventanas más pequeñas son más sensibles a las fluctuaciones a corto plazo.

Al incorporar estas características de ventana móvil, los modelos pueden reconocer tanto patrones a corto como a largo plazo en los datos de series temporales. Esta capacidad mejorada para capturar dependencias temporales a menudo conduce a pronósticos más precisos y matizados, ya que el modelo puede aprovechar un conjunto más rico de información histórica al hacer predicciones sobre valores futuros.

1.2.1 Por Qué Son Importantes las Características de Ventana Móvil

Las características de ventana móvil proporcionan un método sofisticado para capturar la naturaleza dinámica de los datos de series temporales, permitiendo que los modelos disciernan cómo evolucionan las variables objetivo a lo largo del tiempo. Este enfoque implica calcular estadísticas sobre una ventana deslizante de observaciones, que se mueve a través del conjunto de datos a medida que el tiempo avanza. Por ejemplo, calcular un promedio móvil de 7 días de las cifras de ventas puede revelar patrones semanales mientras se suavizan las irregularidades diarias, ofreciendo una visión más clara de las tendencias generales.

Estas características son especialmente valiosas cuando se trabaja con datos que exhiben estacionalidad o contienen ruido significativo. Al agregar información sobre un período de tiempo específico, las estadísticas de ventana móvil pueden resaltar efectivamente tendencias más amplias mientras minimizan el impacto de fluctuaciones a corto plazo. Esto es crucial en muchos escenarios del mundo real, como el pronóstico financiero o la predicción de demanda, donde los patrones a largo plazo suelen tener mayor poder predictivo que las variaciones diarias.

Además, las características de ventana móvil ofrecen flexibilidad para capturar diferentes escalas temporales. Ajustar el tamaño de la ventana permite a los analistas enfocarse en horizontes temporales específicos relevantes para sus objetivos de pronóstico. Por ejemplo, una ventana de 30 días podría ser más apropiada para identificar tendencias mensuales en ventas minoristas, mientras que una ventana de 52 semanas podría revelar patrones anuales en los datos de turismo. Esta adaptabilidad convierte a las características de ventana móvil en una herramienta poderosa en el conjunto de herramientas de un analista de series temporales, permitiendo predicciones más matizadas y precisas a lo largo de varios dominios y escalas temporales.

Ejemplo: Creación de Características de Ventana Móvil

Continuemos trabajando con nuestro conjunto de datos de ventas y generemos algunas estadísticas de ventana móvil. Calcularemos la media móvil de 7 días y la desviación estándar móvil de 7 días para ayudar a capturar la tendencia general y la volatilidad en las ventas.

# Sample data: daily sales figures
import pandas as pd

data = {'Date': pd.date_range(start='2022-01-01', periods=15, freq='D'),
        'Sales': [100, 120, 130, 150, 170, 160, 155, 180, 190, 210, 220, 230, 225, 240, 260]}

df = pd.DataFrame(data)

# Set the Date column as the index
df.set_index('Date', inplace=True)

# Create a 7-day rolling mean and standard deviation
df['RollingMean_7'] = df['Sales'].rolling(window=7).mean()
df['RollingStd_7'] = df['Sales'].rolling(window=7).std()

# View the dataframe with rolling features
print(df)

En este ejemplo:

  • Primero, se importa la biblioteca pandas y se crea un conjunto de datos de ejemplo con cifras de ventas diarias durante 15 días.
  • Los datos se convierten en un DataFrame de pandas, con la columna 'Date' configurada como el índice.
  • Se crean dos características de ventana móvil:
    • Media móvil de 7 días (RollingMean_7): Calcula el promedio de ventas durante los últimos 7 días para cada punto de datos.
    • Desviación estándar móvil de 7 días (RollingStd_7): Calcula la desviación estándar de las ventas durante los últimos 7 días para cada punto de datos.

La media móvil ayuda a suavizar las fluctuaciones a corto plazo y resalta las tendencias generales, mientras que la desviación estándar móvil captura la volatilidad en las ventas durante la ventana de 7 días.

Finalmente, el código imprime el DataFrame, que ahora incluye estas nuevas características de ventana móvil junto con los datos de ventas originales.

Estas características de ventana móvil pueden ser entradas valiosas para los modelos de pronóstico de series temporales, ya que proporcionan información sobre las tendencias y la volatilidad recientes en los datos.

1.2.2 Interpretación de las Características de Ventana Móvil

Las características de ventana móvil ofrecen información valiosa sobre los patrones y características subyacentes de los datos de series temporales. Al analizar estas características, podemos obtener una comprensión más profunda del comportamiento de los datos a lo largo del tiempo y hacer predicciones más informadas.

  • La media móvil actúa como un mecanismo de suavizado, filtrando eficazmente el ruido a corto plazo y resaltando la tendencia general en los datos. Esto es particularmente beneficioso cuando se trabaja con series temporales que exhiben estacionalidad o patrones cíclicos. Al reducir el impacto de las fluctuaciones diarias, la media móvil nos permite identificar y enfocarnos en tendencias a más largo plazo que de otro modo podrían estar ocultas. Por ejemplo, en datos de ventas al por menor, una media móvil puede ayudar a revelar tendencias de crecimiento o disminución subyacentes que pueden no ser evidentes al observar solo las cifras diarias.
  • La desviación estándar móvil sirve como una medida de volatilidad o dispersión en la variable objetivo durante la ventana especificada. Esta métrica es crucial para entender la estabilidad y predictibilidad de la serie temporal. Las desviaciones grandes del promedio pueden indicar períodos de actividad inusual o inestabilidad en los datos. Por ejemplo, en el pronóstico de ventas, los picos en la desviación estándar móvil pueden señalar eventos promocionales, interrupciones en la cadena de suministro o cambios en las condiciones del mercado. Al incorporar esta información en nuestros modelos, podemos tener en cuenta períodos de mayor incertidumbre y mejorar potencialmente la precisión de nuestras previsiones.

Además, la combinación de la media y la desviación estándar móviles proporciona una visión completa del comportamiento de la serie temporal. Mientras que la media móvil muestra la tendencia central a lo largo del tiempo, la desviación estándar móvil captura la dispersión alrededor de esa tendencia. Esta perspectiva dual nos permite identificar no solo tendencias, sino también períodos de relativa estabilidad o inestabilidad en los datos.

Asimismo, estas características de ventana móvil pueden ser especialmente útiles para detectar anomalías o cambios estructurales en la serie temporal. Cambios repentinos en la media móvil o aumentos persistentes en la desviación estándar móvil podrían indicar cambios fundamentales en el proceso subyacente que genera los datos, lo que justifica una investigación adicional o ajustes en el modelo.

1.2.3 Ajuste del Tamaño de la Ventana

El tamaño de la ventana para las características de ventana móvil es un parámetro crucial que impacta significativamente los patrones y tendencias capturados en el análisis de series temporales. La elección del tamaño de la ventana depende de varios factores, incluyendo la naturaleza de los datos de series temporales, la frecuencia de las observaciones y los patrones específicos o tendencias que deseas identificar. Por ejemplo, al analizar datos de ventas diarias, una ventana de 7 días es particularmente efectiva para capturar tendencias semanales, ya que abarca un ciclo comercial completo. Este tamaño de ventana puede revelar patrones como mayores ventas los fines de semana o menores ventas ciertos días de la semana.

Por otro lado, una ventana de 30 días es más adecuada para identificar tendencias mensuales en el mismo conjunto de datos. Esta ventana más larga puede suavizar las fluctuaciones a corto plazo y resaltar patrones más amplios, como picos de ventas al final del mes o variaciones estacionales que ocurren mensualmente. Es importante señalar que las ventanas más largas, aunque útiles para identificar tendencias generales, pueden ser menos sensibles a cambios repentinos o fluctuaciones a corto plazo en los datos.

El proceso de selección del tamaño óptimo de la ventana suele implicar cierto grado de experimentación y conocimiento del dominio. Al probar diferentes tamaños de ventana, los analistas pueden descubrir varios patrones en diferentes escalas temporales. Por ejemplo, además de ventanas semanales y mensuales, podrías considerar:

  • Una ventana de 90 días para capturar tendencias trimestrales
  • Una ventana de 365 días para identificar patrones anuales o cambios año a año
  • Tamaños de ventana personalizados basados en ciclos comerciales específicos o periodicidades conocidas en tus datos

También vale la pena considerar el uso simultáneo de múltiples tamaños de ventana en tu análisis. Este enfoque de múltiples escalas puede proporcionar una visión más completa de la serie temporal, permitiéndote capturar tanto las fluctuaciones a corto plazo como las tendencias a largo plazo. Al comparar los resultados de diferentes tamaños de ventana, puedes obtener conocimientos más profundos sobre la dinámica subyacente de tus datos de series temporales y tomar decisiones más informadas en tus modelos de pronóstico.

# Create a 30-day rolling mean to capture monthly trends
df['RollingMean_30'] = df['Sales'].rolling(window=30, min_periods=1).mean()

# View the new rolling feature
print(df)

Aquí calculamos una media móvil de 30 días para capturar tendencias mensuales más amplias en los datos. Al ajustar el tamaño de la ventana, podemos afinar la cantidad de información histórica que queremos capturar.

Desglose de lo que hace el código:

  • Crea una nueva columna en el DataFrame llamada 'RollingMean_30'.
  • La función rolling() se aplica a la columna 'Sales' con un tamaño de ventana de 30 días, lo que significa que calculará el promedio de los últimos 30 días para cada punto de datos.
  • El parámetro min_periods=1 permite que el cálculo comience desde el primer día, incluso cuando hay menos de 30 días de datos disponibles, lo que ayuda a evitar valores NaN al inicio del conjunto de datos.
  • Luego, se aplica la función mean() para calcular el promedio sobre esta ventana de 30 días.
  • Finalmente, el código imprime el DataFrame actualizado para mostrar la nueva característica de media móvil.

Esta media móvil de 30 días ayuda a capturar tendencias mensuales más amplias en los datos de ventas. Al usar un tamaño de ventana mayor (30 días en lugar de 7 días), suavizamos las fluctuaciones a corto plazo y nos enfocamos en patrones a más largo plazo en los datos.

1.2.4 Manejo de Valores Faltantes en las Características de Ventana Móvil

Al igual que con las características de rezago, las características de ventana móvil pueden resultar en valores faltantes al inicio del conjunto de datos debido a que la ventana necesita llenarse con datos. Este problema surge porque los cálculos de ventana móvil requieren un cierto número de puntos de datos previos para calcular las estadísticas. Por ejemplo, una media móvil de 7 días necesitaría al menos 7 días de datos para calcular el primer valor no faltante. Existen varias estrategias para abordar estos valores faltantes, cada una con sus ventajas e inconvenientes:

  1. Eliminar filas con valores faltantes: Esta es una solución sencilla, pero puede llevar a la pérdida de datos. Si bien es fácil de implementar, esta opción podría no ser ideal si los valores faltantes ocurren en una porción significativa de tu conjunto de datos, especialmente al inicio. Es importante considerar el impacto en tu análisis y en el entrenamiento del modelo si eliges este método.
  2. Imputar valores faltantes: Puedes rellenar los valores faltantes utilizando técnicas como el relleno hacia adelante, hacia atrás o usando un valor predeterminado como 0. El relleno hacia adelante propaga el último valor conocido, lo cual puede ser útil si esperas que los valores faltantes sean similares al último valor registrado. El relleno hacia atrás hace lo contrario, usando valores futuros conocidos para llenar el pasado. Usar un valor predeterminado como 0 podría ser adecuado en algunos casos, pero es importante evaluar si esto tiene sentido para tu conjunto de datos específico y análisis.
  3. Usar una estrategia de imputación personalizada: Dependiendo de tu conocimiento del dominio y la naturaleza de tus datos, podrías desarrollar una estrategia de imputación más sofisticada. Por ejemplo, podrías usar la media de los primeros valores conocidos o implementar un algoritmo más complejo que considere patrones estacionales u otros factores relevantes.
  4. Ajustar dinámicamente el tamaño de la ventana: Otro enfoque es comenzar con un tamaño de ventana más pequeño e incrementarlo gradualmente a medida que haya más datos disponibles. Este método asegura que tengas alguna forma de estadística móvil desde el principio del conjunto de datos, incluso si no se basa inicialmente en el tamaño completo de la ventana.

La elección de cómo manejar los valores faltantes en las características de ventana móvil depende de diversos factores, como los requisitos específicos de tu análisis, las características de tus datos y el impacto potencial en el rendimiento de tu modelo. A menudo es beneficioso experimentar con diferentes enfoques y evaluar sus efectos en los resultados de tu pronóstico.

# Impute missing values in rolling features using forward fill
df.fillna(method='ffill', inplace=True)

# View the imputed dataframe
print(df)

Aquí, elegimos imputar los valores faltantes utilizando el método de relleno hacia adelante, que propaga la última observación disponible para completar las entradas faltantes.

Explicación del código:

  • df.fillna(method='ffill', inplace=True): Esta línea usa el método fillna() de pandas para llenar los valores faltantes. El parámetro method='ffill' especifica que debe usarse el método de relleno hacia adelante, que propaga el último valor conocido para rellenar los valores faltantes. inplace=True significa que los cambios se aplican directamente al DataFrame df sin crear una copia nueva.
  • print(df): Esta línea imprime el DataFrame actualizado, lo que permite ver el resultado después de imputar los valores faltantes.

En este caso, se elige el método de relleno hacia adelante para manejar los valores faltantes en las características de ventana móvil. Este enfoque es útil cuando se espera que los valores faltantes sean similares al último valor conocido. Cabe mencionar que este es solo uno de varios métodos para tratar con valores faltantes en las características de ventana móvil, y la elección del método puede depender de los requisitos específicos de tu análisis y la naturaleza de tus datos.

1.2.5 Por Qué las Características de Ventana Móvil Mejoran la Predicción

La incorporación de estadísticas de ventana móvil en nuestro modelo mejora significativamente su capacidad para capturar e interpretar patrones temporales complejos en los datos. Al aprovechar estas características avanzadas, permitimos que el modelo discierna y analice tendencias y volatilidades a largo plazo que de otro modo podrían permanecer ocultas al depender solo de características de rezago. Las medias móviles son herramientas poderosas para suavizar los datos, reduciendo efectivamente el ruido y proporcionando una visión más clara de los patrones subyacentes. Este efecto de suavizado puede mejorar sustancialmente la precisión predictiva del modelo al permitirle enfocarse en tendencias significativas en lugar de ser influenciado por fluctuaciones a corto plazo.

Complementando a las medias móviles, las desviaciones estándar móviles desempeñan un papel crucial al cuantificar y tener en cuenta períodos de incertidumbre variable dentro de la serie temporal. Esta capacidad es particularmente valiosa al tratar con datos que muestran patrones irregulares o no estacionarios. Al incorporar información sobre la volatilidad cambiante de los datos, el modelo se vuelve más robusto y adaptable, capaz de ajustar sus predicciones en función del nivel de incertidumbre presente en diferentes períodos. Este enfoque adaptativo es especialmente beneficioso en escenarios del mundo real donde los datos de series temporales a menudo muestran comportamientos complejos y en evolución que las características de rezago simples pueden tener dificultades para capturar adecuadamente.

1.2.6 Conclusiones Clave y Consideraciones Avanzadas

  • Las características de ventana móvil son esenciales para capturar patrones complejos en datos de series temporales. Las medias móviles suavizan el ruido y destacan las tendencias subyacentes, mientras que las desviaciones estándar móviles cuantifican la volatilidad. Estas características permiten que los modelos se adapten a las dinámicas cambiantes de los datos y capturen tanto las fluctuaciones a corto plazo como los patrones a largo plazo.
  • La selección del tamaño de la ventana es crucial y debe adaptarse a las características específicas de tus datos. Ventanas más pequeñas (por ejemplo, 7 días) son ideales para capturar patrones semanales, mientras que ventanas más grandes (por ejemplo, 30 o 90 días) revelan tendencias mensuales o trimestrales. Considera el uso de múltiples tamaños de ventana para capturar dinámicas temporales a diferentes escalas.
  • El manejo adecuado de los valores faltantes en las características de ventana móvil es fundamental para la precisión del modelo. Técnicas como el relleno hacia adelante, hacia atrás o estrategias de imputación personalizada deben elegirse cuidadosamente según la naturaleza de los datos y los requisitos específicos del análisis.
  • Las características de ventana móvil pueden mejorar significativamente el rendimiento del modelo al proporcionar una visión más integral de la serie temporal. Permiten que el modelo considere patrones en evolución, estacionalidad y volatilidad cambiante, lo que conduce a pronósticos más sólidos y precisos.
  • Al implementar características de ventana móvil, considera el costo computacional y el posible sesgo de anticipación. Asegúrate de que tu proceso de ingeniería de características se alinee con escenarios de pronóstico del mundo real y no introduzca inadvertidamente información futura en puntos de datos históricos.

1.2 Características de Ventana Móvil para Capturar Tendencias y Estacionalidad

Otra técnica poderosa para el pronóstico de series temporales es la creación de características de ventana móvil. Estas características capturan tendencias y estacionalidad al resumir información sobre una ventana móvil de puntos de datos pasados. Al analizar una serie de observaciones consecutivas, las características de ventana móvil brindan una perspectiva dinámica sobre el comportamiento de los datos a lo largo del tiempo.

Algunas estadísticas comunes de ventana móvil incluyen:

  • Medias móviles: Estas medidas estadísticas suavizan eficazmente las fluctuaciones a corto plazo en los datos de series temporales, permitiendo la identificación y análisis de tendencias a largo plazo. Al calcular el promedio durante una ventana de tiempo especificada, las medias móviles pueden revelar patrones subyacentes que de otro modo podrían quedar oscurecidos por variaciones diarias. Por ejemplo, una media móvil de 7 días en cifras diarias de ventas puede descubrir tendencias semanales en el comportamiento del consumidor, proporcionando información valiosa para la gestión de inventarios y el pronóstico de ventas.
  • Medianas móviles: Como medida robusta de la tendencia central, las medianas móviles ofrecen una ventaja frente a las medias al tratar con conjuntos de datos que contienen valores extremos o atípicos ocasionales. Al seleccionar el valor medio dentro de una ventana de tiempo específica, las medianas móviles proporcionan una representación más estable de la tendencia central de los datos, siendo especialmente útiles en escenarios donde los valores atípicos podrían sesgar significativamente los resultados, como en series temporales financieras o ciertos conjuntos de datos ambientales.
  • Desviaciones estándar móviles: Estas medidas cuantifican la volatilidad o dispersión de los puntos de datos a lo largo del tiempo, ofreciendo información crucial sobre la estabilidad y predictibilidad de una serie temporal. Un aumento en las desviaciones estándar móviles puede señalar períodos de mayor incertidumbre o variabilidad, lo cual es particularmente valioso en la evaluación de riesgos y procesos de toma de decisiones. Por ejemplo, en los mercados financieros, el aumento de las desviaciones estándar puede indicar una mayor volatilidad del mercado, lo que lleva a los inversionistas a ajustar sus estrategias en consecuencia.
  • Mínimos y máximos móviles: Estas características son instrumentales para identificar los picos y valles dentro de una serie temporal, proporcionando una imagen clara del rango y extremos de los datos en un período específico. Esta información es especialmente pertinente en dominios como el análisis del mercado de valores, donde comprender los límites de precio puede informar estrategias de negociación, o en la previsión meteorológica, donde el seguimiento de los extremos de temperatura es crucial para predecir eventos climáticos severos y planificar respuestas adecuadas.

El tamaño de la ventana para estas características puede ajustarse según las características específicas de la serie temporal y los objetivos de pronóstico. Las ventanas más grandes capturan tendencias más amplias, pero pueden ser menos sensibles a los cambios recientes, mientras que las ventanas más pequeñas son más sensibles a las fluctuaciones a corto plazo.

Al incorporar estas características de ventana móvil, los modelos pueden reconocer tanto patrones a corto como a largo plazo en los datos de series temporales. Esta capacidad mejorada para capturar dependencias temporales a menudo conduce a pronósticos más precisos y matizados, ya que el modelo puede aprovechar un conjunto más rico de información histórica al hacer predicciones sobre valores futuros.

1.2.1 Por Qué Son Importantes las Características de Ventana Móvil

Las características de ventana móvil proporcionan un método sofisticado para capturar la naturaleza dinámica de los datos de series temporales, permitiendo que los modelos disciernan cómo evolucionan las variables objetivo a lo largo del tiempo. Este enfoque implica calcular estadísticas sobre una ventana deslizante de observaciones, que se mueve a través del conjunto de datos a medida que el tiempo avanza. Por ejemplo, calcular un promedio móvil de 7 días de las cifras de ventas puede revelar patrones semanales mientras se suavizan las irregularidades diarias, ofreciendo una visión más clara de las tendencias generales.

Estas características son especialmente valiosas cuando se trabaja con datos que exhiben estacionalidad o contienen ruido significativo. Al agregar información sobre un período de tiempo específico, las estadísticas de ventana móvil pueden resaltar efectivamente tendencias más amplias mientras minimizan el impacto de fluctuaciones a corto plazo. Esto es crucial en muchos escenarios del mundo real, como el pronóstico financiero o la predicción de demanda, donde los patrones a largo plazo suelen tener mayor poder predictivo que las variaciones diarias.

Además, las características de ventana móvil ofrecen flexibilidad para capturar diferentes escalas temporales. Ajustar el tamaño de la ventana permite a los analistas enfocarse en horizontes temporales específicos relevantes para sus objetivos de pronóstico. Por ejemplo, una ventana de 30 días podría ser más apropiada para identificar tendencias mensuales en ventas minoristas, mientras que una ventana de 52 semanas podría revelar patrones anuales en los datos de turismo. Esta adaptabilidad convierte a las características de ventana móvil en una herramienta poderosa en el conjunto de herramientas de un analista de series temporales, permitiendo predicciones más matizadas y precisas a lo largo de varios dominios y escalas temporales.

Ejemplo: Creación de Características de Ventana Móvil

Continuemos trabajando con nuestro conjunto de datos de ventas y generemos algunas estadísticas de ventana móvil. Calcularemos la media móvil de 7 días y la desviación estándar móvil de 7 días para ayudar a capturar la tendencia general y la volatilidad en las ventas.

# Sample data: daily sales figures
import pandas as pd

data = {'Date': pd.date_range(start='2022-01-01', periods=15, freq='D'),
        'Sales': [100, 120, 130, 150, 170, 160, 155, 180, 190, 210, 220, 230, 225, 240, 260]}

df = pd.DataFrame(data)

# Set the Date column as the index
df.set_index('Date', inplace=True)

# Create a 7-day rolling mean and standard deviation
df['RollingMean_7'] = df['Sales'].rolling(window=7).mean()
df['RollingStd_7'] = df['Sales'].rolling(window=7).std()

# View the dataframe with rolling features
print(df)

En este ejemplo:

  • Primero, se importa la biblioteca pandas y se crea un conjunto de datos de ejemplo con cifras de ventas diarias durante 15 días.
  • Los datos se convierten en un DataFrame de pandas, con la columna 'Date' configurada como el índice.
  • Se crean dos características de ventana móvil:
    • Media móvil de 7 días (RollingMean_7): Calcula el promedio de ventas durante los últimos 7 días para cada punto de datos.
    • Desviación estándar móvil de 7 días (RollingStd_7): Calcula la desviación estándar de las ventas durante los últimos 7 días para cada punto de datos.

La media móvil ayuda a suavizar las fluctuaciones a corto plazo y resalta las tendencias generales, mientras que la desviación estándar móvil captura la volatilidad en las ventas durante la ventana de 7 días.

Finalmente, el código imprime el DataFrame, que ahora incluye estas nuevas características de ventana móvil junto con los datos de ventas originales.

Estas características de ventana móvil pueden ser entradas valiosas para los modelos de pronóstico de series temporales, ya que proporcionan información sobre las tendencias y la volatilidad recientes en los datos.

1.2.2 Interpretación de las Características de Ventana Móvil

Las características de ventana móvil ofrecen información valiosa sobre los patrones y características subyacentes de los datos de series temporales. Al analizar estas características, podemos obtener una comprensión más profunda del comportamiento de los datos a lo largo del tiempo y hacer predicciones más informadas.

  • La media móvil actúa como un mecanismo de suavizado, filtrando eficazmente el ruido a corto plazo y resaltando la tendencia general en los datos. Esto es particularmente beneficioso cuando se trabaja con series temporales que exhiben estacionalidad o patrones cíclicos. Al reducir el impacto de las fluctuaciones diarias, la media móvil nos permite identificar y enfocarnos en tendencias a más largo plazo que de otro modo podrían estar ocultas. Por ejemplo, en datos de ventas al por menor, una media móvil puede ayudar a revelar tendencias de crecimiento o disminución subyacentes que pueden no ser evidentes al observar solo las cifras diarias.
  • La desviación estándar móvil sirve como una medida de volatilidad o dispersión en la variable objetivo durante la ventana especificada. Esta métrica es crucial para entender la estabilidad y predictibilidad de la serie temporal. Las desviaciones grandes del promedio pueden indicar períodos de actividad inusual o inestabilidad en los datos. Por ejemplo, en el pronóstico de ventas, los picos en la desviación estándar móvil pueden señalar eventos promocionales, interrupciones en la cadena de suministro o cambios en las condiciones del mercado. Al incorporar esta información en nuestros modelos, podemos tener en cuenta períodos de mayor incertidumbre y mejorar potencialmente la precisión de nuestras previsiones.

Además, la combinación de la media y la desviación estándar móviles proporciona una visión completa del comportamiento de la serie temporal. Mientras que la media móvil muestra la tendencia central a lo largo del tiempo, la desviación estándar móvil captura la dispersión alrededor de esa tendencia. Esta perspectiva dual nos permite identificar no solo tendencias, sino también períodos de relativa estabilidad o inestabilidad en los datos.

Asimismo, estas características de ventana móvil pueden ser especialmente útiles para detectar anomalías o cambios estructurales en la serie temporal. Cambios repentinos en la media móvil o aumentos persistentes en la desviación estándar móvil podrían indicar cambios fundamentales en el proceso subyacente que genera los datos, lo que justifica una investigación adicional o ajustes en el modelo.

1.2.3 Ajuste del Tamaño de la Ventana

El tamaño de la ventana para las características de ventana móvil es un parámetro crucial que impacta significativamente los patrones y tendencias capturados en el análisis de series temporales. La elección del tamaño de la ventana depende de varios factores, incluyendo la naturaleza de los datos de series temporales, la frecuencia de las observaciones y los patrones específicos o tendencias que deseas identificar. Por ejemplo, al analizar datos de ventas diarias, una ventana de 7 días es particularmente efectiva para capturar tendencias semanales, ya que abarca un ciclo comercial completo. Este tamaño de ventana puede revelar patrones como mayores ventas los fines de semana o menores ventas ciertos días de la semana.

Por otro lado, una ventana de 30 días es más adecuada para identificar tendencias mensuales en el mismo conjunto de datos. Esta ventana más larga puede suavizar las fluctuaciones a corto plazo y resaltar patrones más amplios, como picos de ventas al final del mes o variaciones estacionales que ocurren mensualmente. Es importante señalar que las ventanas más largas, aunque útiles para identificar tendencias generales, pueden ser menos sensibles a cambios repentinos o fluctuaciones a corto plazo en los datos.

El proceso de selección del tamaño óptimo de la ventana suele implicar cierto grado de experimentación y conocimiento del dominio. Al probar diferentes tamaños de ventana, los analistas pueden descubrir varios patrones en diferentes escalas temporales. Por ejemplo, además de ventanas semanales y mensuales, podrías considerar:

  • Una ventana de 90 días para capturar tendencias trimestrales
  • Una ventana de 365 días para identificar patrones anuales o cambios año a año
  • Tamaños de ventana personalizados basados en ciclos comerciales específicos o periodicidades conocidas en tus datos

También vale la pena considerar el uso simultáneo de múltiples tamaños de ventana en tu análisis. Este enfoque de múltiples escalas puede proporcionar una visión más completa de la serie temporal, permitiéndote capturar tanto las fluctuaciones a corto plazo como las tendencias a largo plazo. Al comparar los resultados de diferentes tamaños de ventana, puedes obtener conocimientos más profundos sobre la dinámica subyacente de tus datos de series temporales y tomar decisiones más informadas en tus modelos de pronóstico.

# Create a 30-day rolling mean to capture monthly trends
df['RollingMean_30'] = df['Sales'].rolling(window=30, min_periods=1).mean()

# View the new rolling feature
print(df)

Aquí calculamos una media móvil de 30 días para capturar tendencias mensuales más amplias en los datos. Al ajustar el tamaño de la ventana, podemos afinar la cantidad de información histórica que queremos capturar.

Desglose de lo que hace el código:

  • Crea una nueva columna en el DataFrame llamada 'RollingMean_30'.
  • La función rolling() se aplica a la columna 'Sales' con un tamaño de ventana de 30 días, lo que significa que calculará el promedio de los últimos 30 días para cada punto de datos.
  • El parámetro min_periods=1 permite que el cálculo comience desde el primer día, incluso cuando hay menos de 30 días de datos disponibles, lo que ayuda a evitar valores NaN al inicio del conjunto de datos.
  • Luego, se aplica la función mean() para calcular el promedio sobre esta ventana de 30 días.
  • Finalmente, el código imprime el DataFrame actualizado para mostrar la nueva característica de media móvil.

Esta media móvil de 30 días ayuda a capturar tendencias mensuales más amplias en los datos de ventas. Al usar un tamaño de ventana mayor (30 días en lugar de 7 días), suavizamos las fluctuaciones a corto plazo y nos enfocamos en patrones a más largo plazo en los datos.

1.2.4 Manejo de Valores Faltantes en las Características de Ventana Móvil

Al igual que con las características de rezago, las características de ventana móvil pueden resultar en valores faltantes al inicio del conjunto de datos debido a que la ventana necesita llenarse con datos. Este problema surge porque los cálculos de ventana móvil requieren un cierto número de puntos de datos previos para calcular las estadísticas. Por ejemplo, una media móvil de 7 días necesitaría al menos 7 días de datos para calcular el primer valor no faltante. Existen varias estrategias para abordar estos valores faltantes, cada una con sus ventajas e inconvenientes:

  1. Eliminar filas con valores faltantes: Esta es una solución sencilla, pero puede llevar a la pérdida de datos. Si bien es fácil de implementar, esta opción podría no ser ideal si los valores faltantes ocurren en una porción significativa de tu conjunto de datos, especialmente al inicio. Es importante considerar el impacto en tu análisis y en el entrenamiento del modelo si eliges este método.
  2. Imputar valores faltantes: Puedes rellenar los valores faltantes utilizando técnicas como el relleno hacia adelante, hacia atrás o usando un valor predeterminado como 0. El relleno hacia adelante propaga el último valor conocido, lo cual puede ser útil si esperas que los valores faltantes sean similares al último valor registrado. El relleno hacia atrás hace lo contrario, usando valores futuros conocidos para llenar el pasado. Usar un valor predeterminado como 0 podría ser adecuado en algunos casos, pero es importante evaluar si esto tiene sentido para tu conjunto de datos específico y análisis.
  3. Usar una estrategia de imputación personalizada: Dependiendo de tu conocimiento del dominio y la naturaleza de tus datos, podrías desarrollar una estrategia de imputación más sofisticada. Por ejemplo, podrías usar la media de los primeros valores conocidos o implementar un algoritmo más complejo que considere patrones estacionales u otros factores relevantes.
  4. Ajustar dinámicamente el tamaño de la ventana: Otro enfoque es comenzar con un tamaño de ventana más pequeño e incrementarlo gradualmente a medida que haya más datos disponibles. Este método asegura que tengas alguna forma de estadística móvil desde el principio del conjunto de datos, incluso si no se basa inicialmente en el tamaño completo de la ventana.

La elección de cómo manejar los valores faltantes en las características de ventana móvil depende de diversos factores, como los requisitos específicos de tu análisis, las características de tus datos y el impacto potencial en el rendimiento de tu modelo. A menudo es beneficioso experimentar con diferentes enfoques y evaluar sus efectos en los resultados de tu pronóstico.

# Impute missing values in rolling features using forward fill
df.fillna(method='ffill', inplace=True)

# View the imputed dataframe
print(df)

Aquí, elegimos imputar los valores faltantes utilizando el método de relleno hacia adelante, que propaga la última observación disponible para completar las entradas faltantes.

Explicación del código:

  • df.fillna(method='ffill', inplace=True): Esta línea usa el método fillna() de pandas para llenar los valores faltantes. El parámetro method='ffill' especifica que debe usarse el método de relleno hacia adelante, que propaga el último valor conocido para rellenar los valores faltantes. inplace=True significa que los cambios se aplican directamente al DataFrame df sin crear una copia nueva.
  • print(df): Esta línea imprime el DataFrame actualizado, lo que permite ver el resultado después de imputar los valores faltantes.

En este caso, se elige el método de relleno hacia adelante para manejar los valores faltantes en las características de ventana móvil. Este enfoque es útil cuando se espera que los valores faltantes sean similares al último valor conocido. Cabe mencionar que este es solo uno de varios métodos para tratar con valores faltantes en las características de ventana móvil, y la elección del método puede depender de los requisitos específicos de tu análisis y la naturaleza de tus datos.

1.2.5 Por Qué las Características de Ventana Móvil Mejoran la Predicción

La incorporación de estadísticas de ventana móvil en nuestro modelo mejora significativamente su capacidad para capturar e interpretar patrones temporales complejos en los datos. Al aprovechar estas características avanzadas, permitimos que el modelo discierna y analice tendencias y volatilidades a largo plazo que de otro modo podrían permanecer ocultas al depender solo de características de rezago. Las medias móviles son herramientas poderosas para suavizar los datos, reduciendo efectivamente el ruido y proporcionando una visión más clara de los patrones subyacentes. Este efecto de suavizado puede mejorar sustancialmente la precisión predictiva del modelo al permitirle enfocarse en tendencias significativas en lugar de ser influenciado por fluctuaciones a corto plazo.

Complementando a las medias móviles, las desviaciones estándar móviles desempeñan un papel crucial al cuantificar y tener en cuenta períodos de incertidumbre variable dentro de la serie temporal. Esta capacidad es particularmente valiosa al tratar con datos que muestran patrones irregulares o no estacionarios. Al incorporar información sobre la volatilidad cambiante de los datos, el modelo se vuelve más robusto y adaptable, capaz de ajustar sus predicciones en función del nivel de incertidumbre presente en diferentes períodos. Este enfoque adaptativo es especialmente beneficioso en escenarios del mundo real donde los datos de series temporales a menudo muestran comportamientos complejos y en evolución que las características de rezago simples pueden tener dificultades para capturar adecuadamente.

1.2.6 Conclusiones Clave y Consideraciones Avanzadas

  • Las características de ventana móvil son esenciales para capturar patrones complejos en datos de series temporales. Las medias móviles suavizan el ruido y destacan las tendencias subyacentes, mientras que las desviaciones estándar móviles cuantifican la volatilidad. Estas características permiten que los modelos se adapten a las dinámicas cambiantes de los datos y capturen tanto las fluctuaciones a corto plazo como los patrones a largo plazo.
  • La selección del tamaño de la ventana es crucial y debe adaptarse a las características específicas de tus datos. Ventanas más pequeñas (por ejemplo, 7 días) son ideales para capturar patrones semanales, mientras que ventanas más grandes (por ejemplo, 30 o 90 días) revelan tendencias mensuales o trimestrales. Considera el uso de múltiples tamaños de ventana para capturar dinámicas temporales a diferentes escalas.
  • El manejo adecuado de los valores faltantes en las características de ventana móvil es fundamental para la precisión del modelo. Técnicas como el relleno hacia adelante, hacia atrás o estrategias de imputación personalizada deben elegirse cuidadosamente según la naturaleza de los datos y los requisitos específicos del análisis.
  • Las características de ventana móvil pueden mejorar significativamente el rendimiento del modelo al proporcionar una visión más integral de la serie temporal. Permiten que el modelo considere patrones en evolución, estacionalidad y volatilidad cambiante, lo que conduce a pronósticos más sólidos y precisos.
  • Al implementar características de ventana móvil, considera el costo computacional y el posible sesgo de anticipación. Asegúrate de que tu proceso de ingeniería de características se alinee con escenarios de pronóstico del mundo real y no introduzca inadvertidamente información futura en puntos de datos históricos.

1.2 Características de Ventana Móvil para Capturar Tendencias y Estacionalidad

Otra técnica poderosa para el pronóstico de series temporales es la creación de características de ventana móvil. Estas características capturan tendencias y estacionalidad al resumir información sobre una ventana móvil de puntos de datos pasados. Al analizar una serie de observaciones consecutivas, las características de ventana móvil brindan una perspectiva dinámica sobre el comportamiento de los datos a lo largo del tiempo.

Algunas estadísticas comunes de ventana móvil incluyen:

  • Medias móviles: Estas medidas estadísticas suavizan eficazmente las fluctuaciones a corto plazo en los datos de series temporales, permitiendo la identificación y análisis de tendencias a largo plazo. Al calcular el promedio durante una ventana de tiempo especificada, las medias móviles pueden revelar patrones subyacentes que de otro modo podrían quedar oscurecidos por variaciones diarias. Por ejemplo, una media móvil de 7 días en cifras diarias de ventas puede descubrir tendencias semanales en el comportamiento del consumidor, proporcionando información valiosa para la gestión de inventarios y el pronóstico de ventas.
  • Medianas móviles: Como medida robusta de la tendencia central, las medianas móviles ofrecen una ventaja frente a las medias al tratar con conjuntos de datos que contienen valores extremos o atípicos ocasionales. Al seleccionar el valor medio dentro de una ventana de tiempo específica, las medianas móviles proporcionan una representación más estable de la tendencia central de los datos, siendo especialmente útiles en escenarios donde los valores atípicos podrían sesgar significativamente los resultados, como en series temporales financieras o ciertos conjuntos de datos ambientales.
  • Desviaciones estándar móviles: Estas medidas cuantifican la volatilidad o dispersión de los puntos de datos a lo largo del tiempo, ofreciendo información crucial sobre la estabilidad y predictibilidad de una serie temporal. Un aumento en las desviaciones estándar móviles puede señalar períodos de mayor incertidumbre o variabilidad, lo cual es particularmente valioso en la evaluación de riesgos y procesos de toma de decisiones. Por ejemplo, en los mercados financieros, el aumento de las desviaciones estándar puede indicar una mayor volatilidad del mercado, lo que lleva a los inversionistas a ajustar sus estrategias en consecuencia.
  • Mínimos y máximos móviles: Estas características son instrumentales para identificar los picos y valles dentro de una serie temporal, proporcionando una imagen clara del rango y extremos de los datos en un período específico. Esta información es especialmente pertinente en dominios como el análisis del mercado de valores, donde comprender los límites de precio puede informar estrategias de negociación, o en la previsión meteorológica, donde el seguimiento de los extremos de temperatura es crucial para predecir eventos climáticos severos y planificar respuestas adecuadas.

El tamaño de la ventana para estas características puede ajustarse según las características específicas de la serie temporal y los objetivos de pronóstico. Las ventanas más grandes capturan tendencias más amplias, pero pueden ser menos sensibles a los cambios recientes, mientras que las ventanas más pequeñas son más sensibles a las fluctuaciones a corto plazo.

Al incorporar estas características de ventana móvil, los modelos pueden reconocer tanto patrones a corto como a largo plazo en los datos de series temporales. Esta capacidad mejorada para capturar dependencias temporales a menudo conduce a pronósticos más precisos y matizados, ya que el modelo puede aprovechar un conjunto más rico de información histórica al hacer predicciones sobre valores futuros.

1.2.1 Por Qué Son Importantes las Características de Ventana Móvil

Las características de ventana móvil proporcionan un método sofisticado para capturar la naturaleza dinámica de los datos de series temporales, permitiendo que los modelos disciernan cómo evolucionan las variables objetivo a lo largo del tiempo. Este enfoque implica calcular estadísticas sobre una ventana deslizante de observaciones, que se mueve a través del conjunto de datos a medida que el tiempo avanza. Por ejemplo, calcular un promedio móvil de 7 días de las cifras de ventas puede revelar patrones semanales mientras se suavizan las irregularidades diarias, ofreciendo una visión más clara de las tendencias generales.

Estas características son especialmente valiosas cuando se trabaja con datos que exhiben estacionalidad o contienen ruido significativo. Al agregar información sobre un período de tiempo específico, las estadísticas de ventana móvil pueden resaltar efectivamente tendencias más amplias mientras minimizan el impacto de fluctuaciones a corto plazo. Esto es crucial en muchos escenarios del mundo real, como el pronóstico financiero o la predicción de demanda, donde los patrones a largo plazo suelen tener mayor poder predictivo que las variaciones diarias.

Además, las características de ventana móvil ofrecen flexibilidad para capturar diferentes escalas temporales. Ajustar el tamaño de la ventana permite a los analistas enfocarse en horizontes temporales específicos relevantes para sus objetivos de pronóstico. Por ejemplo, una ventana de 30 días podría ser más apropiada para identificar tendencias mensuales en ventas minoristas, mientras que una ventana de 52 semanas podría revelar patrones anuales en los datos de turismo. Esta adaptabilidad convierte a las características de ventana móvil en una herramienta poderosa en el conjunto de herramientas de un analista de series temporales, permitiendo predicciones más matizadas y precisas a lo largo de varios dominios y escalas temporales.

Ejemplo: Creación de Características de Ventana Móvil

Continuemos trabajando con nuestro conjunto de datos de ventas y generemos algunas estadísticas de ventana móvil. Calcularemos la media móvil de 7 días y la desviación estándar móvil de 7 días para ayudar a capturar la tendencia general y la volatilidad en las ventas.

# Sample data: daily sales figures
import pandas as pd

data = {'Date': pd.date_range(start='2022-01-01', periods=15, freq='D'),
        'Sales': [100, 120, 130, 150, 170, 160, 155, 180, 190, 210, 220, 230, 225, 240, 260]}

df = pd.DataFrame(data)

# Set the Date column as the index
df.set_index('Date', inplace=True)

# Create a 7-day rolling mean and standard deviation
df['RollingMean_7'] = df['Sales'].rolling(window=7).mean()
df['RollingStd_7'] = df['Sales'].rolling(window=7).std()

# View the dataframe with rolling features
print(df)

En este ejemplo:

  • Primero, se importa la biblioteca pandas y se crea un conjunto de datos de ejemplo con cifras de ventas diarias durante 15 días.
  • Los datos se convierten en un DataFrame de pandas, con la columna 'Date' configurada como el índice.
  • Se crean dos características de ventana móvil:
    • Media móvil de 7 días (RollingMean_7): Calcula el promedio de ventas durante los últimos 7 días para cada punto de datos.
    • Desviación estándar móvil de 7 días (RollingStd_7): Calcula la desviación estándar de las ventas durante los últimos 7 días para cada punto de datos.

La media móvil ayuda a suavizar las fluctuaciones a corto plazo y resalta las tendencias generales, mientras que la desviación estándar móvil captura la volatilidad en las ventas durante la ventana de 7 días.

Finalmente, el código imprime el DataFrame, que ahora incluye estas nuevas características de ventana móvil junto con los datos de ventas originales.

Estas características de ventana móvil pueden ser entradas valiosas para los modelos de pronóstico de series temporales, ya que proporcionan información sobre las tendencias y la volatilidad recientes en los datos.

1.2.2 Interpretación de las Características de Ventana Móvil

Las características de ventana móvil ofrecen información valiosa sobre los patrones y características subyacentes de los datos de series temporales. Al analizar estas características, podemos obtener una comprensión más profunda del comportamiento de los datos a lo largo del tiempo y hacer predicciones más informadas.

  • La media móvil actúa como un mecanismo de suavizado, filtrando eficazmente el ruido a corto plazo y resaltando la tendencia general en los datos. Esto es particularmente beneficioso cuando se trabaja con series temporales que exhiben estacionalidad o patrones cíclicos. Al reducir el impacto de las fluctuaciones diarias, la media móvil nos permite identificar y enfocarnos en tendencias a más largo plazo que de otro modo podrían estar ocultas. Por ejemplo, en datos de ventas al por menor, una media móvil puede ayudar a revelar tendencias de crecimiento o disminución subyacentes que pueden no ser evidentes al observar solo las cifras diarias.
  • La desviación estándar móvil sirve como una medida de volatilidad o dispersión en la variable objetivo durante la ventana especificada. Esta métrica es crucial para entender la estabilidad y predictibilidad de la serie temporal. Las desviaciones grandes del promedio pueden indicar períodos de actividad inusual o inestabilidad en los datos. Por ejemplo, en el pronóstico de ventas, los picos en la desviación estándar móvil pueden señalar eventos promocionales, interrupciones en la cadena de suministro o cambios en las condiciones del mercado. Al incorporar esta información en nuestros modelos, podemos tener en cuenta períodos de mayor incertidumbre y mejorar potencialmente la precisión de nuestras previsiones.

Además, la combinación de la media y la desviación estándar móviles proporciona una visión completa del comportamiento de la serie temporal. Mientras que la media móvil muestra la tendencia central a lo largo del tiempo, la desviación estándar móvil captura la dispersión alrededor de esa tendencia. Esta perspectiva dual nos permite identificar no solo tendencias, sino también períodos de relativa estabilidad o inestabilidad en los datos.

Asimismo, estas características de ventana móvil pueden ser especialmente útiles para detectar anomalías o cambios estructurales en la serie temporal. Cambios repentinos en la media móvil o aumentos persistentes en la desviación estándar móvil podrían indicar cambios fundamentales en el proceso subyacente que genera los datos, lo que justifica una investigación adicional o ajustes en el modelo.

1.2.3 Ajuste del Tamaño de la Ventana

El tamaño de la ventana para las características de ventana móvil es un parámetro crucial que impacta significativamente los patrones y tendencias capturados en el análisis de series temporales. La elección del tamaño de la ventana depende de varios factores, incluyendo la naturaleza de los datos de series temporales, la frecuencia de las observaciones y los patrones específicos o tendencias que deseas identificar. Por ejemplo, al analizar datos de ventas diarias, una ventana de 7 días es particularmente efectiva para capturar tendencias semanales, ya que abarca un ciclo comercial completo. Este tamaño de ventana puede revelar patrones como mayores ventas los fines de semana o menores ventas ciertos días de la semana.

Por otro lado, una ventana de 30 días es más adecuada para identificar tendencias mensuales en el mismo conjunto de datos. Esta ventana más larga puede suavizar las fluctuaciones a corto plazo y resaltar patrones más amplios, como picos de ventas al final del mes o variaciones estacionales que ocurren mensualmente. Es importante señalar que las ventanas más largas, aunque útiles para identificar tendencias generales, pueden ser menos sensibles a cambios repentinos o fluctuaciones a corto plazo en los datos.

El proceso de selección del tamaño óptimo de la ventana suele implicar cierto grado de experimentación y conocimiento del dominio. Al probar diferentes tamaños de ventana, los analistas pueden descubrir varios patrones en diferentes escalas temporales. Por ejemplo, además de ventanas semanales y mensuales, podrías considerar:

  • Una ventana de 90 días para capturar tendencias trimestrales
  • Una ventana de 365 días para identificar patrones anuales o cambios año a año
  • Tamaños de ventana personalizados basados en ciclos comerciales específicos o periodicidades conocidas en tus datos

También vale la pena considerar el uso simultáneo de múltiples tamaños de ventana en tu análisis. Este enfoque de múltiples escalas puede proporcionar una visión más completa de la serie temporal, permitiéndote capturar tanto las fluctuaciones a corto plazo como las tendencias a largo plazo. Al comparar los resultados de diferentes tamaños de ventana, puedes obtener conocimientos más profundos sobre la dinámica subyacente de tus datos de series temporales y tomar decisiones más informadas en tus modelos de pronóstico.

# Create a 30-day rolling mean to capture monthly trends
df['RollingMean_30'] = df['Sales'].rolling(window=30, min_periods=1).mean()

# View the new rolling feature
print(df)

Aquí calculamos una media móvil de 30 días para capturar tendencias mensuales más amplias en los datos. Al ajustar el tamaño de la ventana, podemos afinar la cantidad de información histórica que queremos capturar.

Desglose de lo que hace el código:

  • Crea una nueva columna en el DataFrame llamada 'RollingMean_30'.
  • La función rolling() se aplica a la columna 'Sales' con un tamaño de ventana de 30 días, lo que significa que calculará el promedio de los últimos 30 días para cada punto de datos.
  • El parámetro min_periods=1 permite que el cálculo comience desde el primer día, incluso cuando hay menos de 30 días de datos disponibles, lo que ayuda a evitar valores NaN al inicio del conjunto de datos.
  • Luego, se aplica la función mean() para calcular el promedio sobre esta ventana de 30 días.
  • Finalmente, el código imprime el DataFrame actualizado para mostrar la nueva característica de media móvil.

Esta media móvil de 30 días ayuda a capturar tendencias mensuales más amplias en los datos de ventas. Al usar un tamaño de ventana mayor (30 días en lugar de 7 días), suavizamos las fluctuaciones a corto plazo y nos enfocamos en patrones a más largo plazo en los datos.

1.2.4 Manejo de Valores Faltantes en las Características de Ventana Móvil

Al igual que con las características de rezago, las características de ventana móvil pueden resultar en valores faltantes al inicio del conjunto de datos debido a que la ventana necesita llenarse con datos. Este problema surge porque los cálculos de ventana móvil requieren un cierto número de puntos de datos previos para calcular las estadísticas. Por ejemplo, una media móvil de 7 días necesitaría al menos 7 días de datos para calcular el primer valor no faltante. Existen varias estrategias para abordar estos valores faltantes, cada una con sus ventajas e inconvenientes:

  1. Eliminar filas con valores faltantes: Esta es una solución sencilla, pero puede llevar a la pérdida de datos. Si bien es fácil de implementar, esta opción podría no ser ideal si los valores faltantes ocurren en una porción significativa de tu conjunto de datos, especialmente al inicio. Es importante considerar el impacto en tu análisis y en el entrenamiento del modelo si eliges este método.
  2. Imputar valores faltantes: Puedes rellenar los valores faltantes utilizando técnicas como el relleno hacia adelante, hacia atrás o usando un valor predeterminado como 0. El relleno hacia adelante propaga el último valor conocido, lo cual puede ser útil si esperas que los valores faltantes sean similares al último valor registrado. El relleno hacia atrás hace lo contrario, usando valores futuros conocidos para llenar el pasado. Usar un valor predeterminado como 0 podría ser adecuado en algunos casos, pero es importante evaluar si esto tiene sentido para tu conjunto de datos específico y análisis.
  3. Usar una estrategia de imputación personalizada: Dependiendo de tu conocimiento del dominio y la naturaleza de tus datos, podrías desarrollar una estrategia de imputación más sofisticada. Por ejemplo, podrías usar la media de los primeros valores conocidos o implementar un algoritmo más complejo que considere patrones estacionales u otros factores relevantes.
  4. Ajustar dinámicamente el tamaño de la ventana: Otro enfoque es comenzar con un tamaño de ventana más pequeño e incrementarlo gradualmente a medida que haya más datos disponibles. Este método asegura que tengas alguna forma de estadística móvil desde el principio del conjunto de datos, incluso si no se basa inicialmente en el tamaño completo de la ventana.

La elección de cómo manejar los valores faltantes en las características de ventana móvil depende de diversos factores, como los requisitos específicos de tu análisis, las características de tus datos y el impacto potencial en el rendimiento de tu modelo. A menudo es beneficioso experimentar con diferentes enfoques y evaluar sus efectos en los resultados de tu pronóstico.

# Impute missing values in rolling features using forward fill
df.fillna(method='ffill', inplace=True)

# View the imputed dataframe
print(df)

Aquí, elegimos imputar los valores faltantes utilizando el método de relleno hacia adelante, que propaga la última observación disponible para completar las entradas faltantes.

Explicación del código:

  • df.fillna(method='ffill', inplace=True): Esta línea usa el método fillna() de pandas para llenar los valores faltantes. El parámetro method='ffill' especifica que debe usarse el método de relleno hacia adelante, que propaga el último valor conocido para rellenar los valores faltantes. inplace=True significa que los cambios se aplican directamente al DataFrame df sin crear una copia nueva.
  • print(df): Esta línea imprime el DataFrame actualizado, lo que permite ver el resultado después de imputar los valores faltantes.

En este caso, se elige el método de relleno hacia adelante para manejar los valores faltantes en las características de ventana móvil. Este enfoque es útil cuando se espera que los valores faltantes sean similares al último valor conocido. Cabe mencionar que este es solo uno de varios métodos para tratar con valores faltantes en las características de ventana móvil, y la elección del método puede depender de los requisitos específicos de tu análisis y la naturaleza de tus datos.

1.2.5 Por Qué las Características de Ventana Móvil Mejoran la Predicción

La incorporación de estadísticas de ventana móvil en nuestro modelo mejora significativamente su capacidad para capturar e interpretar patrones temporales complejos en los datos. Al aprovechar estas características avanzadas, permitimos que el modelo discierna y analice tendencias y volatilidades a largo plazo que de otro modo podrían permanecer ocultas al depender solo de características de rezago. Las medias móviles son herramientas poderosas para suavizar los datos, reduciendo efectivamente el ruido y proporcionando una visión más clara de los patrones subyacentes. Este efecto de suavizado puede mejorar sustancialmente la precisión predictiva del modelo al permitirle enfocarse en tendencias significativas en lugar de ser influenciado por fluctuaciones a corto plazo.

Complementando a las medias móviles, las desviaciones estándar móviles desempeñan un papel crucial al cuantificar y tener en cuenta períodos de incertidumbre variable dentro de la serie temporal. Esta capacidad es particularmente valiosa al tratar con datos que muestran patrones irregulares o no estacionarios. Al incorporar información sobre la volatilidad cambiante de los datos, el modelo se vuelve más robusto y adaptable, capaz de ajustar sus predicciones en función del nivel de incertidumbre presente en diferentes períodos. Este enfoque adaptativo es especialmente beneficioso en escenarios del mundo real donde los datos de series temporales a menudo muestran comportamientos complejos y en evolución que las características de rezago simples pueden tener dificultades para capturar adecuadamente.

1.2.6 Conclusiones Clave y Consideraciones Avanzadas

  • Las características de ventana móvil son esenciales para capturar patrones complejos en datos de series temporales. Las medias móviles suavizan el ruido y destacan las tendencias subyacentes, mientras que las desviaciones estándar móviles cuantifican la volatilidad. Estas características permiten que los modelos se adapten a las dinámicas cambiantes de los datos y capturen tanto las fluctuaciones a corto plazo como los patrones a largo plazo.
  • La selección del tamaño de la ventana es crucial y debe adaptarse a las características específicas de tus datos. Ventanas más pequeñas (por ejemplo, 7 días) son ideales para capturar patrones semanales, mientras que ventanas más grandes (por ejemplo, 30 o 90 días) revelan tendencias mensuales o trimestrales. Considera el uso de múltiples tamaños de ventana para capturar dinámicas temporales a diferentes escalas.
  • El manejo adecuado de los valores faltantes en las características de ventana móvil es fundamental para la precisión del modelo. Técnicas como el relleno hacia adelante, hacia atrás o estrategias de imputación personalizada deben elegirse cuidadosamente según la naturaleza de los datos y los requisitos específicos del análisis.
  • Las características de ventana móvil pueden mejorar significativamente el rendimiento del modelo al proporcionar una visión más integral de la serie temporal. Permiten que el modelo considere patrones en evolución, estacionalidad y volatilidad cambiante, lo que conduce a pronósticos más sólidos y precisos.
  • Al implementar características de ventana móvil, considera el costo computacional y el posible sesgo de anticipación. Asegúrate de que tu proceso de ingeniería de características se alinee con escenarios de pronóstico del mundo real y no introduzca inadvertidamente información futura en puntos de datos históricos.

1.2 Características de Ventana Móvil para Capturar Tendencias y Estacionalidad

Otra técnica poderosa para el pronóstico de series temporales es la creación de características de ventana móvil. Estas características capturan tendencias y estacionalidad al resumir información sobre una ventana móvil de puntos de datos pasados. Al analizar una serie de observaciones consecutivas, las características de ventana móvil brindan una perspectiva dinámica sobre el comportamiento de los datos a lo largo del tiempo.

Algunas estadísticas comunes de ventana móvil incluyen:

  • Medias móviles: Estas medidas estadísticas suavizan eficazmente las fluctuaciones a corto plazo en los datos de series temporales, permitiendo la identificación y análisis de tendencias a largo plazo. Al calcular el promedio durante una ventana de tiempo especificada, las medias móviles pueden revelar patrones subyacentes que de otro modo podrían quedar oscurecidos por variaciones diarias. Por ejemplo, una media móvil de 7 días en cifras diarias de ventas puede descubrir tendencias semanales en el comportamiento del consumidor, proporcionando información valiosa para la gestión de inventarios y el pronóstico de ventas.
  • Medianas móviles: Como medida robusta de la tendencia central, las medianas móviles ofrecen una ventaja frente a las medias al tratar con conjuntos de datos que contienen valores extremos o atípicos ocasionales. Al seleccionar el valor medio dentro de una ventana de tiempo específica, las medianas móviles proporcionan una representación más estable de la tendencia central de los datos, siendo especialmente útiles en escenarios donde los valores atípicos podrían sesgar significativamente los resultados, como en series temporales financieras o ciertos conjuntos de datos ambientales.
  • Desviaciones estándar móviles: Estas medidas cuantifican la volatilidad o dispersión de los puntos de datos a lo largo del tiempo, ofreciendo información crucial sobre la estabilidad y predictibilidad de una serie temporal. Un aumento en las desviaciones estándar móviles puede señalar períodos de mayor incertidumbre o variabilidad, lo cual es particularmente valioso en la evaluación de riesgos y procesos de toma de decisiones. Por ejemplo, en los mercados financieros, el aumento de las desviaciones estándar puede indicar una mayor volatilidad del mercado, lo que lleva a los inversionistas a ajustar sus estrategias en consecuencia.
  • Mínimos y máximos móviles: Estas características son instrumentales para identificar los picos y valles dentro de una serie temporal, proporcionando una imagen clara del rango y extremos de los datos en un período específico. Esta información es especialmente pertinente en dominios como el análisis del mercado de valores, donde comprender los límites de precio puede informar estrategias de negociación, o en la previsión meteorológica, donde el seguimiento de los extremos de temperatura es crucial para predecir eventos climáticos severos y planificar respuestas adecuadas.

El tamaño de la ventana para estas características puede ajustarse según las características específicas de la serie temporal y los objetivos de pronóstico. Las ventanas más grandes capturan tendencias más amplias, pero pueden ser menos sensibles a los cambios recientes, mientras que las ventanas más pequeñas son más sensibles a las fluctuaciones a corto plazo.

Al incorporar estas características de ventana móvil, los modelos pueden reconocer tanto patrones a corto como a largo plazo en los datos de series temporales. Esta capacidad mejorada para capturar dependencias temporales a menudo conduce a pronósticos más precisos y matizados, ya que el modelo puede aprovechar un conjunto más rico de información histórica al hacer predicciones sobre valores futuros.

1.2.1 Por Qué Son Importantes las Características de Ventana Móvil

Las características de ventana móvil proporcionan un método sofisticado para capturar la naturaleza dinámica de los datos de series temporales, permitiendo que los modelos disciernan cómo evolucionan las variables objetivo a lo largo del tiempo. Este enfoque implica calcular estadísticas sobre una ventana deslizante de observaciones, que se mueve a través del conjunto de datos a medida que el tiempo avanza. Por ejemplo, calcular un promedio móvil de 7 días de las cifras de ventas puede revelar patrones semanales mientras se suavizan las irregularidades diarias, ofreciendo una visión más clara de las tendencias generales.

Estas características son especialmente valiosas cuando se trabaja con datos que exhiben estacionalidad o contienen ruido significativo. Al agregar información sobre un período de tiempo específico, las estadísticas de ventana móvil pueden resaltar efectivamente tendencias más amplias mientras minimizan el impacto de fluctuaciones a corto plazo. Esto es crucial en muchos escenarios del mundo real, como el pronóstico financiero o la predicción de demanda, donde los patrones a largo plazo suelen tener mayor poder predictivo que las variaciones diarias.

Además, las características de ventana móvil ofrecen flexibilidad para capturar diferentes escalas temporales. Ajustar el tamaño de la ventana permite a los analistas enfocarse en horizontes temporales específicos relevantes para sus objetivos de pronóstico. Por ejemplo, una ventana de 30 días podría ser más apropiada para identificar tendencias mensuales en ventas minoristas, mientras que una ventana de 52 semanas podría revelar patrones anuales en los datos de turismo. Esta adaptabilidad convierte a las características de ventana móvil en una herramienta poderosa en el conjunto de herramientas de un analista de series temporales, permitiendo predicciones más matizadas y precisas a lo largo de varios dominios y escalas temporales.

Ejemplo: Creación de Características de Ventana Móvil

Continuemos trabajando con nuestro conjunto de datos de ventas y generemos algunas estadísticas de ventana móvil. Calcularemos la media móvil de 7 días y la desviación estándar móvil de 7 días para ayudar a capturar la tendencia general y la volatilidad en las ventas.

# Sample data: daily sales figures
import pandas as pd

data = {'Date': pd.date_range(start='2022-01-01', periods=15, freq='D'),
        'Sales': [100, 120, 130, 150, 170, 160, 155, 180, 190, 210, 220, 230, 225, 240, 260]}

df = pd.DataFrame(data)

# Set the Date column as the index
df.set_index('Date', inplace=True)

# Create a 7-day rolling mean and standard deviation
df['RollingMean_7'] = df['Sales'].rolling(window=7).mean()
df['RollingStd_7'] = df['Sales'].rolling(window=7).std()

# View the dataframe with rolling features
print(df)

En este ejemplo:

  • Primero, se importa la biblioteca pandas y se crea un conjunto de datos de ejemplo con cifras de ventas diarias durante 15 días.
  • Los datos se convierten en un DataFrame de pandas, con la columna 'Date' configurada como el índice.
  • Se crean dos características de ventana móvil:
    • Media móvil de 7 días (RollingMean_7): Calcula el promedio de ventas durante los últimos 7 días para cada punto de datos.
    • Desviación estándar móvil de 7 días (RollingStd_7): Calcula la desviación estándar de las ventas durante los últimos 7 días para cada punto de datos.

La media móvil ayuda a suavizar las fluctuaciones a corto plazo y resalta las tendencias generales, mientras que la desviación estándar móvil captura la volatilidad en las ventas durante la ventana de 7 días.

Finalmente, el código imprime el DataFrame, que ahora incluye estas nuevas características de ventana móvil junto con los datos de ventas originales.

Estas características de ventana móvil pueden ser entradas valiosas para los modelos de pronóstico de series temporales, ya que proporcionan información sobre las tendencias y la volatilidad recientes en los datos.

1.2.2 Interpretación de las Características de Ventana Móvil

Las características de ventana móvil ofrecen información valiosa sobre los patrones y características subyacentes de los datos de series temporales. Al analizar estas características, podemos obtener una comprensión más profunda del comportamiento de los datos a lo largo del tiempo y hacer predicciones más informadas.

  • La media móvil actúa como un mecanismo de suavizado, filtrando eficazmente el ruido a corto plazo y resaltando la tendencia general en los datos. Esto es particularmente beneficioso cuando se trabaja con series temporales que exhiben estacionalidad o patrones cíclicos. Al reducir el impacto de las fluctuaciones diarias, la media móvil nos permite identificar y enfocarnos en tendencias a más largo plazo que de otro modo podrían estar ocultas. Por ejemplo, en datos de ventas al por menor, una media móvil puede ayudar a revelar tendencias de crecimiento o disminución subyacentes que pueden no ser evidentes al observar solo las cifras diarias.
  • La desviación estándar móvil sirve como una medida de volatilidad o dispersión en la variable objetivo durante la ventana especificada. Esta métrica es crucial para entender la estabilidad y predictibilidad de la serie temporal. Las desviaciones grandes del promedio pueden indicar períodos de actividad inusual o inestabilidad en los datos. Por ejemplo, en el pronóstico de ventas, los picos en la desviación estándar móvil pueden señalar eventos promocionales, interrupciones en la cadena de suministro o cambios en las condiciones del mercado. Al incorporar esta información en nuestros modelos, podemos tener en cuenta períodos de mayor incertidumbre y mejorar potencialmente la precisión de nuestras previsiones.

Además, la combinación de la media y la desviación estándar móviles proporciona una visión completa del comportamiento de la serie temporal. Mientras que la media móvil muestra la tendencia central a lo largo del tiempo, la desviación estándar móvil captura la dispersión alrededor de esa tendencia. Esta perspectiva dual nos permite identificar no solo tendencias, sino también períodos de relativa estabilidad o inestabilidad en los datos.

Asimismo, estas características de ventana móvil pueden ser especialmente útiles para detectar anomalías o cambios estructurales en la serie temporal. Cambios repentinos en la media móvil o aumentos persistentes en la desviación estándar móvil podrían indicar cambios fundamentales en el proceso subyacente que genera los datos, lo que justifica una investigación adicional o ajustes en el modelo.

1.2.3 Ajuste del Tamaño de la Ventana

El tamaño de la ventana para las características de ventana móvil es un parámetro crucial que impacta significativamente los patrones y tendencias capturados en el análisis de series temporales. La elección del tamaño de la ventana depende de varios factores, incluyendo la naturaleza de los datos de series temporales, la frecuencia de las observaciones y los patrones específicos o tendencias que deseas identificar. Por ejemplo, al analizar datos de ventas diarias, una ventana de 7 días es particularmente efectiva para capturar tendencias semanales, ya que abarca un ciclo comercial completo. Este tamaño de ventana puede revelar patrones como mayores ventas los fines de semana o menores ventas ciertos días de la semana.

Por otro lado, una ventana de 30 días es más adecuada para identificar tendencias mensuales en el mismo conjunto de datos. Esta ventana más larga puede suavizar las fluctuaciones a corto plazo y resaltar patrones más amplios, como picos de ventas al final del mes o variaciones estacionales que ocurren mensualmente. Es importante señalar que las ventanas más largas, aunque útiles para identificar tendencias generales, pueden ser menos sensibles a cambios repentinos o fluctuaciones a corto plazo en los datos.

El proceso de selección del tamaño óptimo de la ventana suele implicar cierto grado de experimentación y conocimiento del dominio. Al probar diferentes tamaños de ventana, los analistas pueden descubrir varios patrones en diferentes escalas temporales. Por ejemplo, además de ventanas semanales y mensuales, podrías considerar:

  • Una ventana de 90 días para capturar tendencias trimestrales
  • Una ventana de 365 días para identificar patrones anuales o cambios año a año
  • Tamaños de ventana personalizados basados en ciclos comerciales específicos o periodicidades conocidas en tus datos

También vale la pena considerar el uso simultáneo de múltiples tamaños de ventana en tu análisis. Este enfoque de múltiples escalas puede proporcionar una visión más completa de la serie temporal, permitiéndote capturar tanto las fluctuaciones a corto plazo como las tendencias a largo plazo. Al comparar los resultados de diferentes tamaños de ventana, puedes obtener conocimientos más profundos sobre la dinámica subyacente de tus datos de series temporales y tomar decisiones más informadas en tus modelos de pronóstico.

# Create a 30-day rolling mean to capture monthly trends
df['RollingMean_30'] = df['Sales'].rolling(window=30, min_periods=1).mean()

# View the new rolling feature
print(df)

Aquí calculamos una media móvil de 30 días para capturar tendencias mensuales más amplias en los datos. Al ajustar el tamaño de la ventana, podemos afinar la cantidad de información histórica que queremos capturar.

Desglose de lo que hace el código:

  • Crea una nueva columna en el DataFrame llamada 'RollingMean_30'.
  • La función rolling() se aplica a la columna 'Sales' con un tamaño de ventana de 30 días, lo que significa que calculará el promedio de los últimos 30 días para cada punto de datos.
  • El parámetro min_periods=1 permite que el cálculo comience desde el primer día, incluso cuando hay menos de 30 días de datos disponibles, lo que ayuda a evitar valores NaN al inicio del conjunto de datos.
  • Luego, se aplica la función mean() para calcular el promedio sobre esta ventana de 30 días.
  • Finalmente, el código imprime el DataFrame actualizado para mostrar la nueva característica de media móvil.

Esta media móvil de 30 días ayuda a capturar tendencias mensuales más amplias en los datos de ventas. Al usar un tamaño de ventana mayor (30 días en lugar de 7 días), suavizamos las fluctuaciones a corto plazo y nos enfocamos en patrones a más largo plazo en los datos.

1.2.4 Manejo de Valores Faltantes en las Características de Ventana Móvil

Al igual que con las características de rezago, las características de ventana móvil pueden resultar en valores faltantes al inicio del conjunto de datos debido a que la ventana necesita llenarse con datos. Este problema surge porque los cálculos de ventana móvil requieren un cierto número de puntos de datos previos para calcular las estadísticas. Por ejemplo, una media móvil de 7 días necesitaría al menos 7 días de datos para calcular el primer valor no faltante. Existen varias estrategias para abordar estos valores faltantes, cada una con sus ventajas e inconvenientes:

  1. Eliminar filas con valores faltantes: Esta es una solución sencilla, pero puede llevar a la pérdida de datos. Si bien es fácil de implementar, esta opción podría no ser ideal si los valores faltantes ocurren en una porción significativa de tu conjunto de datos, especialmente al inicio. Es importante considerar el impacto en tu análisis y en el entrenamiento del modelo si eliges este método.
  2. Imputar valores faltantes: Puedes rellenar los valores faltantes utilizando técnicas como el relleno hacia adelante, hacia atrás o usando un valor predeterminado como 0. El relleno hacia adelante propaga el último valor conocido, lo cual puede ser útil si esperas que los valores faltantes sean similares al último valor registrado. El relleno hacia atrás hace lo contrario, usando valores futuros conocidos para llenar el pasado. Usar un valor predeterminado como 0 podría ser adecuado en algunos casos, pero es importante evaluar si esto tiene sentido para tu conjunto de datos específico y análisis.
  3. Usar una estrategia de imputación personalizada: Dependiendo de tu conocimiento del dominio y la naturaleza de tus datos, podrías desarrollar una estrategia de imputación más sofisticada. Por ejemplo, podrías usar la media de los primeros valores conocidos o implementar un algoritmo más complejo que considere patrones estacionales u otros factores relevantes.
  4. Ajustar dinámicamente el tamaño de la ventana: Otro enfoque es comenzar con un tamaño de ventana más pequeño e incrementarlo gradualmente a medida que haya más datos disponibles. Este método asegura que tengas alguna forma de estadística móvil desde el principio del conjunto de datos, incluso si no se basa inicialmente en el tamaño completo de la ventana.

La elección de cómo manejar los valores faltantes en las características de ventana móvil depende de diversos factores, como los requisitos específicos de tu análisis, las características de tus datos y el impacto potencial en el rendimiento de tu modelo. A menudo es beneficioso experimentar con diferentes enfoques y evaluar sus efectos en los resultados de tu pronóstico.

# Impute missing values in rolling features using forward fill
df.fillna(method='ffill', inplace=True)

# View the imputed dataframe
print(df)

Aquí, elegimos imputar los valores faltantes utilizando el método de relleno hacia adelante, que propaga la última observación disponible para completar las entradas faltantes.

Explicación del código:

  • df.fillna(method='ffill', inplace=True): Esta línea usa el método fillna() de pandas para llenar los valores faltantes. El parámetro method='ffill' especifica que debe usarse el método de relleno hacia adelante, que propaga el último valor conocido para rellenar los valores faltantes. inplace=True significa que los cambios se aplican directamente al DataFrame df sin crear una copia nueva.
  • print(df): Esta línea imprime el DataFrame actualizado, lo que permite ver el resultado después de imputar los valores faltantes.

En este caso, se elige el método de relleno hacia adelante para manejar los valores faltantes en las características de ventana móvil. Este enfoque es útil cuando se espera que los valores faltantes sean similares al último valor conocido. Cabe mencionar que este es solo uno de varios métodos para tratar con valores faltantes en las características de ventana móvil, y la elección del método puede depender de los requisitos específicos de tu análisis y la naturaleza de tus datos.

1.2.5 Por Qué las Características de Ventana Móvil Mejoran la Predicción

La incorporación de estadísticas de ventana móvil en nuestro modelo mejora significativamente su capacidad para capturar e interpretar patrones temporales complejos en los datos. Al aprovechar estas características avanzadas, permitimos que el modelo discierna y analice tendencias y volatilidades a largo plazo que de otro modo podrían permanecer ocultas al depender solo de características de rezago. Las medias móviles son herramientas poderosas para suavizar los datos, reduciendo efectivamente el ruido y proporcionando una visión más clara de los patrones subyacentes. Este efecto de suavizado puede mejorar sustancialmente la precisión predictiva del modelo al permitirle enfocarse en tendencias significativas en lugar de ser influenciado por fluctuaciones a corto plazo.

Complementando a las medias móviles, las desviaciones estándar móviles desempeñan un papel crucial al cuantificar y tener en cuenta períodos de incertidumbre variable dentro de la serie temporal. Esta capacidad es particularmente valiosa al tratar con datos que muestran patrones irregulares o no estacionarios. Al incorporar información sobre la volatilidad cambiante de los datos, el modelo se vuelve más robusto y adaptable, capaz de ajustar sus predicciones en función del nivel de incertidumbre presente en diferentes períodos. Este enfoque adaptativo es especialmente beneficioso en escenarios del mundo real donde los datos de series temporales a menudo muestran comportamientos complejos y en evolución que las características de rezago simples pueden tener dificultades para capturar adecuadamente.

1.2.6 Conclusiones Clave y Consideraciones Avanzadas

  • Las características de ventana móvil son esenciales para capturar patrones complejos en datos de series temporales. Las medias móviles suavizan el ruido y destacan las tendencias subyacentes, mientras que las desviaciones estándar móviles cuantifican la volatilidad. Estas características permiten que los modelos se adapten a las dinámicas cambiantes de los datos y capturen tanto las fluctuaciones a corto plazo como los patrones a largo plazo.
  • La selección del tamaño de la ventana es crucial y debe adaptarse a las características específicas de tus datos. Ventanas más pequeñas (por ejemplo, 7 días) son ideales para capturar patrones semanales, mientras que ventanas más grandes (por ejemplo, 30 o 90 días) revelan tendencias mensuales o trimestrales. Considera el uso de múltiples tamaños de ventana para capturar dinámicas temporales a diferentes escalas.
  • El manejo adecuado de los valores faltantes en las características de ventana móvil es fundamental para la precisión del modelo. Técnicas como el relleno hacia adelante, hacia atrás o estrategias de imputación personalizada deben elegirse cuidadosamente según la naturaleza de los datos y los requisitos específicos del análisis.
  • Las características de ventana móvil pueden mejorar significativamente el rendimiento del modelo al proporcionar una visión más integral de la serie temporal. Permiten que el modelo considere patrones en evolución, estacionalidad y volatilidad cambiante, lo que conduce a pronósticos más sólidos y precisos.
  • Al implementar características de ventana móvil, considera el costo computacional y el posible sesgo de anticipación. Asegúrate de que tu proceso de ingeniería de características se alinee con escenarios de pronóstico del mundo real y no introduzca inadvertidamente información futura en puntos de datos históricos.