Menu iconMenu icon
Fundamentos de Ingeniería de Datos

Quiz Parte 3: Limpieza de Datos y Preprocesamiento

Preguntas

Este Quiz evaluará tu comprensión de las técnicas cubiertas en la Parte 3. Cada pregunta se enfoca en conceptos clave de limpieza avanzada de datos, manejo de series temporales y reducción de dimensionalidad.

1. ¿Cuál de los siguientes métodos es más efectivo para eliminar características con muy baja varianza?

a) Eliminación Recursiva de Características (RFE)

b) Umbral de Varianza

c) Análisis de Componentes Principales (PCA)

d) Regresión Lasso

2. Al trabajar con datos de series temporales, ¿qué técnica sería la más apropiada para manejar fechas faltantes y mantener la consistencia temporal del conjunto de datos?

a) Eliminar todas las filas con fechas faltantes

b) Rellenar fechas faltantes con la fecha promedio

c) Reindexar los datos a una frecuencia regular y usar rellenado hacia adelante o hacia atrás

d) Reemplazar las fechas faltantes con un valor de fecha constante

3. ¿Qué representa el ratio de varianza explicada en PCA?

a) La varianza del conjunto de datos capturada por cada característica original

b) El número de componentes seleccionados para alcanzar el 100% de varianza

c) La proporción de la varianza del conjunto de datos capturada por cada componente principal

d) La varianza total de los datos transformados

4. ¿En cuál de los siguientes escenarios sería más apropiado utilizar la codificación cíclica (transformación seno y coseno) para una característica?

a) Codificar cifras de ventas diarias

b) Codificar variables categóricas como categorías de productos

c) Codificar características con patrones cíclicos, como el día de la semana

d) Codificar identificaciones de usuarios en un conjunto de datos

5. ¿Cuál de las siguientes NO es una característica de los métodos de filtro en la selección de características?

a) Clasifican características independientemente de un modelo específico

b) Son computacionalmente eficientes

c) Se basan en el entrenamiento del modelo para determinar la importancia de las características

d) Usan métricas como la correlación y la varianza para la selección de características

6. ¿Qué técnica de reducción de dimensionalidad utiliza una transformación lineal para crear nuevos ejes que capturen la máxima varianza?

a) Análisis Discriminante Lineal (LDA)

b) Análisis de Componentes Principales (PCA)

c) Eliminación Recursiva de Características (RFE)

d) Regresión Lasso

7. Si dos características en un conjunto de datos tienen un coeficiente de correlación cercano a 1, ¿qué técnica ayudaría a reducir la redundancia sin perder información crítica?

a) Eliminación Recursiva de Características (RFE)

b) Umbral de Varianza

c) Umbral de Correlación

d) Regresión Lasso

8. ¿En qué situación los métodos de envoltura para la selección de características podrían ser más efectivos que los métodos de filtro?

a) Cuando la eficiencia computacional es la máxima prioridad

b) Al trabajar con un conjunto de datos con muchas características altamente correlacionadas

c) Cuando se necesita capturar efectos de interacción entre características

d) Al clasificar características basándose solo en propiedades estadísticas

9. ¿Cuál es una desventaja común de usar la regresión Lasso para la selección de características?

a) Puede no eliminar ninguna característica del modelo

b) No puede combinarse con otros métodos de reducción de dimensionalidad

c) Puede penalizar en exceso las características, lo que potencialmente lleva a un subajuste

d) No asigna un coeficiente de cero a características no importantes

10. ¿Por qué se recomienda usar validación cruzada al aplicar métodos de envoltura como la Eliminación Recursiva de Características (RFE) en conjuntos de datos pequeños?

a) Para maximizar las interacciones entre características

b) Para asegurarse de que las características seleccionadas generalicen bien a nuevos datos

c) Para evitar fugas de datos

d) Para priorizar la eficiencia computacional

Preguntas

Este Quiz evaluará tu comprensión de las técnicas cubiertas en la Parte 3. Cada pregunta se enfoca en conceptos clave de limpieza avanzada de datos, manejo de series temporales y reducción de dimensionalidad.

1. ¿Cuál de los siguientes métodos es más efectivo para eliminar características con muy baja varianza?

a) Eliminación Recursiva de Características (RFE)

b) Umbral de Varianza

c) Análisis de Componentes Principales (PCA)

d) Regresión Lasso

2. Al trabajar con datos de series temporales, ¿qué técnica sería la más apropiada para manejar fechas faltantes y mantener la consistencia temporal del conjunto de datos?

a) Eliminar todas las filas con fechas faltantes

b) Rellenar fechas faltantes con la fecha promedio

c) Reindexar los datos a una frecuencia regular y usar rellenado hacia adelante o hacia atrás

d) Reemplazar las fechas faltantes con un valor de fecha constante

3. ¿Qué representa el ratio de varianza explicada en PCA?

a) La varianza del conjunto de datos capturada por cada característica original

b) El número de componentes seleccionados para alcanzar el 100% de varianza

c) La proporción de la varianza del conjunto de datos capturada por cada componente principal

d) La varianza total de los datos transformados

4. ¿En cuál de los siguientes escenarios sería más apropiado utilizar la codificación cíclica (transformación seno y coseno) para una característica?

a) Codificar cifras de ventas diarias

b) Codificar variables categóricas como categorías de productos

c) Codificar características con patrones cíclicos, como el día de la semana

d) Codificar identificaciones de usuarios en un conjunto de datos

5. ¿Cuál de las siguientes NO es una característica de los métodos de filtro en la selección de características?

a) Clasifican características independientemente de un modelo específico

b) Son computacionalmente eficientes

c) Se basan en el entrenamiento del modelo para determinar la importancia de las características

d) Usan métricas como la correlación y la varianza para la selección de características

6. ¿Qué técnica de reducción de dimensionalidad utiliza una transformación lineal para crear nuevos ejes que capturen la máxima varianza?

a) Análisis Discriminante Lineal (LDA)

b) Análisis de Componentes Principales (PCA)

c) Eliminación Recursiva de Características (RFE)

d) Regresión Lasso

7. Si dos características en un conjunto de datos tienen un coeficiente de correlación cercano a 1, ¿qué técnica ayudaría a reducir la redundancia sin perder información crítica?

a) Eliminación Recursiva de Características (RFE)

b) Umbral de Varianza

c) Umbral de Correlación

d) Regresión Lasso

8. ¿En qué situación los métodos de envoltura para la selección de características podrían ser más efectivos que los métodos de filtro?

a) Cuando la eficiencia computacional es la máxima prioridad

b) Al trabajar con un conjunto de datos con muchas características altamente correlacionadas

c) Cuando se necesita capturar efectos de interacción entre características

d) Al clasificar características basándose solo en propiedades estadísticas

9. ¿Cuál es una desventaja común de usar la regresión Lasso para la selección de características?

a) Puede no eliminar ninguna característica del modelo

b) No puede combinarse con otros métodos de reducción de dimensionalidad

c) Puede penalizar en exceso las características, lo que potencialmente lleva a un subajuste

d) No asigna un coeficiente de cero a características no importantes

10. ¿Por qué se recomienda usar validación cruzada al aplicar métodos de envoltura como la Eliminación Recursiva de Características (RFE) en conjuntos de datos pequeños?

a) Para maximizar las interacciones entre características

b) Para asegurarse de que las características seleccionadas generalicen bien a nuevos datos

c) Para evitar fugas de datos

d) Para priorizar la eficiencia computacional

Preguntas

Este Quiz evaluará tu comprensión de las técnicas cubiertas en la Parte 3. Cada pregunta se enfoca en conceptos clave de limpieza avanzada de datos, manejo de series temporales y reducción de dimensionalidad.

1. ¿Cuál de los siguientes métodos es más efectivo para eliminar características con muy baja varianza?

a) Eliminación Recursiva de Características (RFE)

b) Umbral de Varianza

c) Análisis de Componentes Principales (PCA)

d) Regresión Lasso

2. Al trabajar con datos de series temporales, ¿qué técnica sería la más apropiada para manejar fechas faltantes y mantener la consistencia temporal del conjunto de datos?

a) Eliminar todas las filas con fechas faltantes

b) Rellenar fechas faltantes con la fecha promedio

c) Reindexar los datos a una frecuencia regular y usar rellenado hacia adelante o hacia atrás

d) Reemplazar las fechas faltantes con un valor de fecha constante

3. ¿Qué representa el ratio de varianza explicada en PCA?

a) La varianza del conjunto de datos capturada por cada característica original

b) El número de componentes seleccionados para alcanzar el 100% de varianza

c) La proporción de la varianza del conjunto de datos capturada por cada componente principal

d) La varianza total de los datos transformados

4. ¿En cuál de los siguientes escenarios sería más apropiado utilizar la codificación cíclica (transformación seno y coseno) para una característica?

a) Codificar cifras de ventas diarias

b) Codificar variables categóricas como categorías de productos

c) Codificar características con patrones cíclicos, como el día de la semana

d) Codificar identificaciones de usuarios en un conjunto de datos

5. ¿Cuál de las siguientes NO es una característica de los métodos de filtro en la selección de características?

a) Clasifican características independientemente de un modelo específico

b) Son computacionalmente eficientes

c) Se basan en el entrenamiento del modelo para determinar la importancia de las características

d) Usan métricas como la correlación y la varianza para la selección de características

6. ¿Qué técnica de reducción de dimensionalidad utiliza una transformación lineal para crear nuevos ejes que capturen la máxima varianza?

a) Análisis Discriminante Lineal (LDA)

b) Análisis de Componentes Principales (PCA)

c) Eliminación Recursiva de Características (RFE)

d) Regresión Lasso

7. Si dos características en un conjunto de datos tienen un coeficiente de correlación cercano a 1, ¿qué técnica ayudaría a reducir la redundancia sin perder información crítica?

a) Eliminación Recursiva de Características (RFE)

b) Umbral de Varianza

c) Umbral de Correlación

d) Regresión Lasso

8. ¿En qué situación los métodos de envoltura para la selección de características podrían ser más efectivos que los métodos de filtro?

a) Cuando la eficiencia computacional es la máxima prioridad

b) Al trabajar con un conjunto de datos con muchas características altamente correlacionadas

c) Cuando se necesita capturar efectos de interacción entre características

d) Al clasificar características basándose solo en propiedades estadísticas

9. ¿Cuál es una desventaja común de usar la regresión Lasso para la selección de características?

a) Puede no eliminar ninguna característica del modelo

b) No puede combinarse con otros métodos de reducción de dimensionalidad

c) Puede penalizar en exceso las características, lo que potencialmente lleva a un subajuste

d) No asigna un coeficiente de cero a características no importantes

10. ¿Por qué se recomienda usar validación cruzada al aplicar métodos de envoltura como la Eliminación Recursiva de Características (RFE) en conjuntos de datos pequeños?

a) Para maximizar las interacciones entre características

b) Para asegurarse de que las características seleccionadas generalicen bien a nuevos datos

c) Para evitar fugas de datos

d) Para priorizar la eficiencia computacional

Preguntas

Este Quiz evaluará tu comprensión de las técnicas cubiertas en la Parte 3. Cada pregunta se enfoca en conceptos clave de limpieza avanzada de datos, manejo de series temporales y reducción de dimensionalidad.

1. ¿Cuál de los siguientes métodos es más efectivo para eliminar características con muy baja varianza?

a) Eliminación Recursiva de Características (RFE)

b) Umbral de Varianza

c) Análisis de Componentes Principales (PCA)

d) Regresión Lasso

2. Al trabajar con datos de series temporales, ¿qué técnica sería la más apropiada para manejar fechas faltantes y mantener la consistencia temporal del conjunto de datos?

a) Eliminar todas las filas con fechas faltantes

b) Rellenar fechas faltantes con la fecha promedio

c) Reindexar los datos a una frecuencia regular y usar rellenado hacia adelante o hacia atrás

d) Reemplazar las fechas faltantes con un valor de fecha constante

3. ¿Qué representa el ratio de varianza explicada en PCA?

a) La varianza del conjunto de datos capturada por cada característica original

b) El número de componentes seleccionados para alcanzar el 100% de varianza

c) La proporción de la varianza del conjunto de datos capturada por cada componente principal

d) La varianza total de los datos transformados

4. ¿En cuál de los siguientes escenarios sería más apropiado utilizar la codificación cíclica (transformación seno y coseno) para una característica?

a) Codificar cifras de ventas diarias

b) Codificar variables categóricas como categorías de productos

c) Codificar características con patrones cíclicos, como el día de la semana

d) Codificar identificaciones de usuarios en un conjunto de datos

5. ¿Cuál de las siguientes NO es una característica de los métodos de filtro en la selección de características?

a) Clasifican características independientemente de un modelo específico

b) Son computacionalmente eficientes

c) Se basan en el entrenamiento del modelo para determinar la importancia de las características

d) Usan métricas como la correlación y la varianza para la selección de características

6. ¿Qué técnica de reducción de dimensionalidad utiliza una transformación lineal para crear nuevos ejes que capturen la máxima varianza?

a) Análisis Discriminante Lineal (LDA)

b) Análisis de Componentes Principales (PCA)

c) Eliminación Recursiva de Características (RFE)

d) Regresión Lasso

7. Si dos características en un conjunto de datos tienen un coeficiente de correlación cercano a 1, ¿qué técnica ayudaría a reducir la redundancia sin perder información crítica?

a) Eliminación Recursiva de Características (RFE)

b) Umbral de Varianza

c) Umbral de Correlación

d) Regresión Lasso

8. ¿En qué situación los métodos de envoltura para la selección de características podrían ser más efectivos que los métodos de filtro?

a) Cuando la eficiencia computacional es la máxima prioridad

b) Al trabajar con un conjunto de datos con muchas características altamente correlacionadas

c) Cuando se necesita capturar efectos de interacción entre características

d) Al clasificar características basándose solo en propiedades estadísticas

9. ¿Cuál es una desventaja común de usar la regresión Lasso para la selección de características?

a) Puede no eliminar ninguna característica del modelo

b) No puede combinarse con otros métodos de reducción de dimensionalidad

c) Puede penalizar en exceso las características, lo que potencialmente lleva a un subajuste

d) No asigna un coeficiente de cero a características no importantes

10. ¿Por qué se recomienda usar validación cruzada al aplicar métodos de envoltura como la Eliminación Recursiva de Características (RFE) en conjuntos de datos pequeños?

a) Para maximizar las interacciones entre características

b) Para asegurarse de que las características seleccionadas generalicen bien a nuevos datos

c) Para evitar fugas de datos

d) Para priorizar la eficiencia computacional