Menu iconMenu icon
Fundamentos de Ingeniería de Datos

Quiz Parte 2: Ingeniería de Características para Modelos Poderosos

Preguntas

Este quiz evaluará tu comprensión de los conceptos clave cubiertos en la Parte 2 del libro. Cada pregunta aborda un capítulo diferente y las ideas esenciales discutidas en esta sección. Tómate tu tiempo para responder cada pregunta y verifica tu comprensión de las técnicas de ingeniería de características.

Pregunta 1: (Capítulo 3 - El Rol de la Ingeniería de Características en el Machine Learning)

¿Por qué se considera que la ingeniería de características es uno de los aspectos más críticos en la construcción de modelos de machine learning?

a) Aumenta el número de características en el conjunto de datos.

b) Transforma datos sin procesar en entradas significativas que mejoran el rendimiento del modelo.

c) Ayuda a reducir el número de puntos de datos.

d) Elimina la necesidad de preprocesamiento de datos.

Pregunta 2: (Capítulo 4 - Técnicas para Manejar Datos Faltantes)

¿Cuál de los siguientes NO es un método para manejar datos faltantes?

a) Imputación por media

b) Eliminar filas con valores faltantes

c) Imputación aleatoria

d) Codificación por etiquetas

Pregunta 3: (Capítulo 4 - Técnicas para Manejar Datos Faltantes)

¿Qué técnica avanzada de imputación se debe utilizar cuando la relación entre las características es importante para completar los valores faltantes?

a) Imputación por mediana

b) Imputación por K-Nearest Neighbors (KNN)

c) Imputación por media

d) Imputación por moda

Pregunta 4: (Capítulo 5 - Transformación y Escalado de Características)

¿Qué técnica de transformación es adecuada para estabilizar la varianza y reducir la asimetría en datos con solo valores positivos?

a) Codificación One-Hot

b) Estandarización

c) Transformación logarítmica

d) Codificación ordinal

Pregunta 5: (Capítulo 5 - Transformación y Escalado de Características)

¿Cuál es la principal diferencia entre Escalado Min-Max y Estandarización?

a) El escalado Min-Max ajusta los valores a un rango fijo, mientras que la estandarización centra los datos en una media de cero y desviación estándar de uno.

b) El escalado Min-Max reduce el tamaño del conjunto de datos, mientras que la estandarización aumenta su dimensionalidad.

c) El escalado Min-Max solo se usa para características categóricas, mientras que la estandarización es para características numéricas.

d) El escalado Min-Max normaliza los valores atípicos, mientras que la estandarización ignora los valores atípicos.

Pregunta 6: (Capítulo 6 - Codificación de Variables Categóricas)

¿Cuál es una limitación clave del uso de Codificación One-Hot para variables categóricas con alta cardinalidad?

a) No se puede aplicar a variables numéricas.

b) Reduce el tamaño del conjunto de datos.

c) Puede crear una gran cantidad de columnas, lo que lleva a alta dimensionalidad.

d) Elimina las categorías raras del conjunto de datos.

Pregunta 7: (Capítulo 6 - Codificación de Variables Categóricas)

¿Qué método de codificación reemplaza cada categoría con la media de la variable objetivo para esa categoría?

a) Codificación One-Hot

b) Codificación de Frecuencia

c) Codificación de Objetivo

d) Codificación Ordinal

Pregunta 8: (Capítulo 7 - Creación de Características y Términos de Interacción)

¿Cuál es el propósito principal de crear términos de interacción entre características?

a) Reducir la complejidad del modelo.

b) Capturar el efecto combinado de múltiples características en la variable objetivo.

c) Eliminar características correlacionadas del conjunto de datos.

d) Aplicar transformaciones solo a datos categóricos.

Pregunta 9: (Capítulo 7 - Creación de Características y Términos de Interacción)

Al crear características polinomiales, ¿qué riesgo potencial debe considerarse?

a) Las características pueden introducir filtrado de datos.

b) Las características pueden causar multicolinealidad y sobreajuste.

c) Las características pueden convertirse en variables categóricas.

d) Las características pueden reducir el tamaño del conjunto de datos.

Pregunta 10: (General)

¿Qué técnica de ingeniería de características sería más apropiada cuando sospechas que existe una relación no lineal entre una característica numérica y la variable objetivo?

a) Imputación por media

b) Creación de características polinomiales

c) Codificación One-Hot

d) Escalado Min-Max

Pregunta Extra: (General)

¿Qué método de selección de características ayuda a identificar qué características contribuyen más al rendimiento del modelo, al tiempo que reduce el ruido de características irrelevantes?

a) Eliminación Recursiva de Características (RFE)

b) Imputación Aleatoria

c) Codificación Ordinal

d) Codificación por Etiquetas

Una vez que hayas completado el cuestionario, verifica tus respuestas para ver qué tan bien comprendiste los conceptos de la Parte 2: Ingeniería de Características para Modelos Potentes.

Preguntas

Este quiz evaluará tu comprensión de los conceptos clave cubiertos en la Parte 2 del libro. Cada pregunta aborda un capítulo diferente y las ideas esenciales discutidas en esta sección. Tómate tu tiempo para responder cada pregunta y verifica tu comprensión de las técnicas de ingeniería de características.

Pregunta 1: (Capítulo 3 - El Rol de la Ingeniería de Características en el Machine Learning)

¿Por qué se considera que la ingeniería de características es uno de los aspectos más críticos en la construcción de modelos de machine learning?

a) Aumenta el número de características en el conjunto de datos.

b) Transforma datos sin procesar en entradas significativas que mejoran el rendimiento del modelo.

c) Ayuda a reducir el número de puntos de datos.

d) Elimina la necesidad de preprocesamiento de datos.

Pregunta 2: (Capítulo 4 - Técnicas para Manejar Datos Faltantes)

¿Cuál de los siguientes NO es un método para manejar datos faltantes?

a) Imputación por media

b) Eliminar filas con valores faltantes

c) Imputación aleatoria

d) Codificación por etiquetas

Pregunta 3: (Capítulo 4 - Técnicas para Manejar Datos Faltantes)

¿Qué técnica avanzada de imputación se debe utilizar cuando la relación entre las características es importante para completar los valores faltantes?

a) Imputación por mediana

b) Imputación por K-Nearest Neighbors (KNN)

c) Imputación por media

d) Imputación por moda

Pregunta 4: (Capítulo 5 - Transformación y Escalado de Características)

¿Qué técnica de transformación es adecuada para estabilizar la varianza y reducir la asimetría en datos con solo valores positivos?

a) Codificación One-Hot

b) Estandarización

c) Transformación logarítmica

d) Codificación ordinal

Pregunta 5: (Capítulo 5 - Transformación y Escalado de Características)

¿Cuál es la principal diferencia entre Escalado Min-Max y Estandarización?

a) El escalado Min-Max ajusta los valores a un rango fijo, mientras que la estandarización centra los datos en una media de cero y desviación estándar de uno.

b) El escalado Min-Max reduce el tamaño del conjunto de datos, mientras que la estandarización aumenta su dimensionalidad.

c) El escalado Min-Max solo se usa para características categóricas, mientras que la estandarización es para características numéricas.

d) El escalado Min-Max normaliza los valores atípicos, mientras que la estandarización ignora los valores atípicos.

Pregunta 6: (Capítulo 6 - Codificación de Variables Categóricas)

¿Cuál es una limitación clave del uso de Codificación One-Hot para variables categóricas con alta cardinalidad?

a) No se puede aplicar a variables numéricas.

b) Reduce el tamaño del conjunto de datos.

c) Puede crear una gran cantidad de columnas, lo que lleva a alta dimensionalidad.

d) Elimina las categorías raras del conjunto de datos.

Pregunta 7: (Capítulo 6 - Codificación de Variables Categóricas)

¿Qué método de codificación reemplaza cada categoría con la media de la variable objetivo para esa categoría?

a) Codificación One-Hot

b) Codificación de Frecuencia

c) Codificación de Objetivo

d) Codificación Ordinal

Pregunta 8: (Capítulo 7 - Creación de Características y Términos de Interacción)

¿Cuál es el propósito principal de crear términos de interacción entre características?

a) Reducir la complejidad del modelo.

b) Capturar el efecto combinado de múltiples características en la variable objetivo.

c) Eliminar características correlacionadas del conjunto de datos.

d) Aplicar transformaciones solo a datos categóricos.

Pregunta 9: (Capítulo 7 - Creación de Características y Términos de Interacción)

Al crear características polinomiales, ¿qué riesgo potencial debe considerarse?

a) Las características pueden introducir filtrado de datos.

b) Las características pueden causar multicolinealidad y sobreajuste.

c) Las características pueden convertirse en variables categóricas.

d) Las características pueden reducir el tamaño del conjunto de datos.

Pregunta 10: (General)

¿Qué técnica de ingeniería de características sería más apropiada cuando sospechas que existe una relación no lineal entre una característica numérica y la variable objetivo?

a) Imputación por media

b) Creación de características polinomiales

c) Codificación One-Hot

d) Escalado Min-Max

Pregunta Extra: (General)

¿Qué método de selección de características ayuda a identificar qué características contribuyen más al rendimiento del modelo, al tiempo que reduce el ruido de características irrelevantes?

a) Eliminación Recursiva de Características (RFE)

b) Imputación Aleatoria

c) Codificación Ordinal

d) Codificación por Etiquetas

Una vez que hayas completado el cuestionario, verifica tus respuestas para ver qué tan bien comprendiste los conceptos de la Parte 2: Ingeniería de Características para Modelos Potentes.

Preguntas

Este quiz evaluará tu comprensión de los conceptos clave cubiertos en la Parte 2 del libro. Cada pregunta aborda un capítulo diferente y las ideas esenciales discutidas en esta sección. Tómate tu tiempo para responder cada pregunta y verifica tu comprensión de las técnicas de ingeniería de características.

Pregunta 1: (Capítulo 3 - El Rol de la Ingeniería de Características en el Machine Learning)

¿Por qué se considera que la ingeniería de características es uno de los aspectos más críticos en la construcción de modelos de machine learning?

a) Aumenta el número de características en el conjunto de datos.

b) Transforma datos sin procesar en entradas significativas que mejoran el rendimiento del modelo.

c) Ayuda a reducir el número de puntos de datos.

d) Elimina la necesidad de preprocesamiento de datos.

Pregunta 2: (Capítulo 4 - Técnicas para Manejar Datos Faltantes)

¿Cuál de los siguientes NO es un método para manejar datos faltantes?

a) Imputación por media

b) Eliminar filas con valores faltantes

c) Imputación aleatoria

d) Codificación por etiquetas

Pregunta 3: (Capítulo 4 - Técnicas para Manejar Datos Faltantes)

¿Qué técnica avanzada de imputación se debe utilizar cuando la relación entre las características es importante para completar los valores faltantes?

a) Imputación por mediana

b) Imputación por K-Nearest Neighbors (KNN)

c) Imputación por media

d) Imputación por moda

Pregunta 4: (Capítulo 5 - Transformación y Escalado de Características)

¿Qué técnica de transformación es adecuada para estabilizar la varianza y reducir la asimetría en datos con solo valores positivos?

a) Codificación One-Hot

b) Estandarización

c) Transformación logarítmica

d) Codificación ordinal

Pregunta 5: (Capítulo 5 - Transformación y Escalado de Características)

¿Cuál es la principal diferencia entre Escalado Min-Max y Estandarización?

a) El escalado Min-Max ajusta los valores a un rango fijo, mientras que la estandarización centra los datos en una media de cero y desviación estándar de uno.

b) El escalado Min-Max reduce el tamaño del conjunto de datos, mientras que la estandarización aumenta su dimensionalidad.

c) El escalado Min-Max solo se usa para características categóricas, mientras que la estandarización es para características numéricas.

d) El escalado Min-Max normaliza los valores atípicos, mientras que la estandarización ignora los valores atípicos.

Pregunta 6: (Capítulo 6 - Codificación de Variables Categóricas)

¿Cuál es una limitación clave del uso de Codificación One-Hot para variables categóricas con alta cardinalidad?

a) No se puede aplicar a variables numéricas.

b) Reduce el tamaño del conjunto de datos.

c) Puede crear una gran cantidad de columnas, lo que lleva a alta dimensionalidad.

d) Elimina las categorías raras del conjunto de datos.

Pregunta 7: (Capítulo 6 - Codificación de Variables Categóricas)

¿Qué método de codificación reemplaza cada categoría con la media de la variable objetivo para esa categoría?

a) Codificación One-Hot

b) Codificación de Frecuencia

c) Codificación de Objetivo

d) Codificación Ordinal

Pregunta 8: (Capítulo 7 - Creación de Características y Términos de Interacción)

¿Cuál es el propósito principal de crear términos de interacción entre características?

a) Reducir la complejidad del modelo.

b) Capturar el efecto combinado de múltiples características en la variable objetivo.

c) Eliminar características correlacionadas del conjunto de datos.

d) Aplicar transformaciones solo a datos categóricos.

Pregunta 9: (Capítulo 7 - Creación de Características y Términos de Interacción)

Al crear características polinomiales, ¿qué riesgo potencial debe considerarse?

a) Las características pueden introducir filtrado de datos.

b) Las características pueden causar multicolinealidad y sobreajuste.

c) Las características pueden convertirse en variables categóricas.

d) Las características pueden reducir el tamaño del conjunto de datos.

Pregunta 10: (General)

¿Qué técnica de ingeniería de características sería más apropiada cuando sospechas que existe una relación no lineal entre una característica numérica y la variable objetivo?

a) Imputación por media

b) Creación de características polinomiales

c) Codificación One-Hot

d) Escalado Min-Max

Pregunta Extra: (General)

¿Qué método de selección de características ayuda a identificar qué características contribuyen más al rendimiento del modelo, al tiempo que reduce el ruido de características irrelevantes?

a) Eliminación Recursiva de Características (RFE)

b) Imputación Aleatoria

c) Codificación Ordinal

d) Codificación por Etiquetas

Una vez que hayas completado el cuestionario, verifica tus respuestas para ver qué tan bien comprendiste los conceptos de la Parte 2: Ingeniería de Características para Modelos Potentes.

Preguntas

Este quiz evaluará tu comprensión de los conceptos clave cubiertos en la Parte 2 del libro. Cada pregunta aborda un capítulo diferente y las ideas esenciales discutidas en esta sección. Tómate tu tiempo para responder cada pregunta y verifica tu comprensión de las técnicas de ingeniería de características.

Pregunta 1: (Capítulo 3 - El Rol de la Ingeniería de Características en el Machine Learning)

¿Por qué se considera que la ingeniería de características es uno de los aspectos más críticos en la construcción de modelos de machine learning?

a) Aumenta el número de características en el conjunto de datos.

b) Transforma datos sin procesar en entradas significativas que mejoran el rendimiento del modelo.

c) Ayuda a reducir el número de puntos de datos.

d) Elimina la necesidad de preprocesamiento de datos.

Pregunta 2: (Capítulo 4 - Técnicas para Manejar Datos Faltantes)

¿Cuál de los siguientes NO es un método para manejar datos faltantes?

a) Imputación por media

b) Eliminar filas con valores faltantes

c) Imputación aleatoria

d) Codificación por etiquetas

Pregunta 3: (Capítulo 4 - Técnicas para Manejar Datos Faltantes)

¿Qué técnica avanzada de imputación se debe utilizar cuando la relación entre las características es importante para completar los valores faltantes?

a) Imputación por mediana

b) Imputación por K-Nearest Neighbors (KNN)

c) Imputación por media

d) Imputación por moda

Pregunta 4: (Capítulo 5 - Transformación y Escalado de Características)

¿Qué técnica de transformación es adecuada para estabilizar la varianza y reducir la asimetría en datos con solo valores positivos?

a) Codificación One-Hot

b) Estandarización

c) Transformación logarítmica

d) Codificación ordinal

Pregunta 5: (Capítulo 5 - Transformación y Escalado de Características)

¿Cuál es la principal diferencia entre Escalado Min-Max y Estandarización?

a) El escalado Min-Max ajusta los valores a un rango fijo, mientras que la estandarización centra los datos en una media de cero y desviación estándar de uno.

b) El escalado Min-Max reduce el tamaño del conjunto de datos, mientras que la estandarización aumenta su dimensionalidad.

c) El escalado Min-Max solo se usa para características categóricas, mientras que la estandarización es para características numéricas.

d) El escalado Min-Max normaliza los valores atípicos, mientras que la estandarización ignora los valores atípicos.

Pregunta 6: (Capítulo 6 - Codificación de Variables Categóricas)

¿Cuál es una limitación clave del uso de Codificación One-Hot para variables categóricas con alta cardinalidad?

a) No se puede aplicar a variables numéricas.

b) Reduce el tamaño del conjunto de datos.

c) Puede crear una gran cantidad de columnas, lo que lleva a alta dimensionalidad.

d) Elimina las categorías raras del conjunto de datos.

Pregunta 7: (Capítulo 6 - Codificación de Variables Categóricas)

¿Qué método de codificación reemplaza cada categoría con la media de la variable objetivo para esa categoría?

a) Codificación One-Hot

b) Codificación de Frecuencia

c) Codificación de Objetivo

d) Codificación Ordinal

Pregunta 8: (Capítulo 7 - Creación de Características y Términos de Interacción)

¿Cuál es el propósito principal de crear términos de interacción entre características?

a) Reducir la complejidad del modelo.

b) Capturar el efecto combinado de múltiples características en la variable objetivo.

c) Eliminar características correlacionadas del conjunto de datos.

d) Aplicar transformaciones solo a datos categóricos.

Pregunta 9: (Capítulo 7 - Creación de Características y Términos de Interacción)

Al crear características polinomiales, ¿qué riesgo potencial debe considerarse?

a) Las características pueden introducir filtrado de datos.

b) Las características pueden causar multicolinealidad y sobreajuste.

c) Las características pueden convertirse en variables categóricas.

d) Las características pueden reducir el tamaño del conjunto de datos.

Pregunta 10: (General)

¿Qué técnica de ingeniería de características sería más apropiada cuando sospechas que existe una relación no lineal entre una característica numérica y la variable objetivo?

a) Imputación por media

b) Creación de características polinomiales

c) Codificación One-Hot

d) Escalado Min-Max

Pregunta Extra: (General)

¿Qué método de selección de características ayuda a identificar qué características contribuyen más al rendimiento del modelo, al tiempo que reduce el ruido de características irrelevantes?

a) Eliminación Recursiva de Características (RFE)

b) Imputación Aleatoria

c) Codificación Ordinal

d) Codificación por Etiquetas

Una vez que hayas completado el cuestionario, verifica tus respuestas para ver qué tan bien comprendiste los conceptos de la Parte 2: Ingeniería de Características para Modelos Potentes.