Menu iconMenu icon
Fundamentos de Ingeniería de Datos

Cuestionario Parte 1: Estableciendo el Escenario para un Análisis Avanzado

Respuestas

Pregunta 1: Manipulación Avanzada de Datos con Pandas

Respuesta:

b) Pandas puede manejar conjuntos de datos más grandes de manera eficiente con datos tabulares.

Pregunta 2: Filtrado Eficiente con Pandas

Respuesta:

a) df[(df['SalesAmount'] > 200) & (df['Store'] == 'A')]

Pregunta 3: Rendimiento con NumPy

Respuesta:

c) Iterar sobre elementos individuales con un bucle en Python.

Pregunta 4: Broadcasting en NumPy

Respuesta:

b) El proceso por el cual NumPy aplica operaciones a arreglos de diferentes formas.

Pregunta 5: Agrupación y Agregación en Pandas

Respuesta:

a) df.groupby('Category').agg({'PurchaseAmount': ['sum', 'mean']})

Pregunta 6: Pipelines de Scikit-learn

Respuesta:

b) Permite encadenar múltiples pasos de preprocesamiento y entrenamiento de modelos en un solo flujo de trabajo.

Pregunta 7: Fuga de Datos en Pipelines de Aprendizaje Automático

Respuesta:

b) Ocurre cuando el modelo puede ver o aprender de los datos de prueba durante el entrenamiento, lo que lleva a resultados excesivamente optimistas.

Pregunta 8: Optimización de Memoria en Pandas

Respuesta:

b) Reduce el uso de memoria de grandes conjuntos de datos.

Pregunta 9: Creación de Características de Interacción

Respuesta:

b) df['Interaction'] = df['PurchaseAmount'] * df['Discount']

Pregunta 10: Remuestreo de Datos de Series Temporales

Respuesta:

a) df.resample('M').sum()

Respuestas

Pregunta 1: Manipulación Avanzada de Datos con Pandas

Respuesta:

b) Pandas puede manejar conjuntos de datos más grandes de manera eficiente con datos tabulares.

Pregunta 2: Filtrado Eficiente con Pandas

Respuesta:

a) df[(df['SalesAmount'] > 200) & (df['Store'] == 'A')]

Pregunta 3: Rendimiento con NumPy

Respuesta:

c) Iterar sobre elementos individuales con un bucle en Python.

Pregunta 4: Broadcasting en NumPy

Respuesta:

b) El proceso por el cual NumPy aplica operaciones a arreglos de diferentes formas.

Pregunta 5: Agrupación y Agregación en Pandas

Respuesta:

a) df.groupby('Category').agg({'PurchaseAmount': ['sum', 'mean']})

Pregunta 6: Pipelines de Scikit-learn

Respuesta:

b) Permite encadenar múltiples pasos de preprocesamiento y entrenamiento de modelos en un solo flujo de trabajo.

Pregunta 7: Fuga de Datos en Pipelines de Aprendizaje Automático

Respuesta:

b) Ocurre cuando el modelo puede ver o aprender de los datos de prueba durante el entrenamiento, lo que lleva a resultados excesivamente optimistas.

Pregunta 8: Optimización de Memoria en Pandas

Respuesta:

b) Reduce el uso de memoria de grandes conjuntos de datos.

Pregunta 9: Creación de Características de Interacción

Respuesta:

b) df['Interaction'] = df['PurchaseAmount'] * df['Discount']

Pregunta 10: Remuestreo de Datos de Series Temporales

Respuesta:

a) df.resample('M').sum()

Respuestas

Pregunta 1: Manipulación Avanzada de Datos con Pandas

Respuesta:

b) Pandas puede manejar conjuntos de datos más grandes de manera eficiente con datos tabulares.

Pregunta 2: Filtrado Eficiente con Pandas

Respuesta:

a) df[(df['SalesAmount'] > 200) & (df['Store'] == 'A')]

Pregunta 3: Rendimiento con NumPy

Respuesta:

c) Iterar sobre elementos individuales con un bucle en Python.

Pregunta 4: Broadcasting en NumPy

Respuesta:

b) El proceso por el cual NumPy aplica operaciones a arreglos de diferentes formas.

Pregunta 5: Agrupación y Agregación en Pandas

Respuesta:

a) df.groupby('Category').agg({'PurchaseAmount': ['sum', 'mean']})

Pregunta 6: Pipelines de Scikit-learn

Respuesta:

b) Permite encadenar múltiples pasos de preprocesamiento y entrenamiento de modelos en un solo flujo de trabajo.

Pregunta 7: Fuga de Datos en Pipelines de Aprendizaje Automático

Respuesta:

b) Ocurre cuando el modelo puede ver o aprender de los datos de prueba durante el entrenamiento, lo que lleva a resultados excesivamente optimistas.

Pregunta 8: Optimización de Memoria en Pandas

Respuesta:

b) Reduce el uso de memoria de grandes conjuntos de datos.

Pregunta 9: Creación de Características de Interacción

Respuesta:

b) df['Interaction'] = df['PurchaseAmount'] * df['Discount']

Pregunta 10: Remuestreo de Datos de Series Temporales

Respuesta:

a) df.resample('M').sum()

Respuestas

Pregunta 1: Manipulación Avanzada de Datos con Pandas

Respuesta:

b) Pandas puede manejar conjuntos de datos más grandes de manera eficiente con datos tabulares.

Pregunta 2: Filtrado Eficiente con Pandas

Respuesta:

a) df[(df['SalesAmount'] > 200) & (df['Store'] == 'A')]

Pregunta 3: Rendimiento con NumPy

Respuesta:

c) Iterar sobre elementos individuales con un bucle en Python.

Pregunta 4: Broadcasting en NumPy

Respuesta:

b) El proceso por el cual NumPy aplica operaciones a arreglos de diferentes formas.

Pregunta 5: Agrupación y Agregación en Pandas

Respuesta:

a) df.groupby('Category').agg({'PurchaseAmount': ['sum', 'mean']})

Pregunta 6: Pipelines de Scikit-learn

Respuesta:

b) Permite encadenar múltiples pasos de preprocesamiento y entrenamiento de modelos en un solo flujo de trabajo.

Pregunta 7: Fuga de Datos en Pipelines de Aprendizaje Automático

Respuesta:

b) Ocurre cuando el modelo puede ver o aprender de los datos de prueba durante el entrenamiento, lo que lleva a resultados excesivamente optimistas.

Pregunta 8: Optimización de Memoria en Pandas

Respuesta:

b) Reduce el uso de memoria de grandes conjuntos de datos.

Pregunta 9: Creación de Características de Interacción

Respuesta:

b) df['Interaction'] = df['PurchaseAmount'] * df['Discount']

Pregunta 10: Remuestreo de Datos de Series Temporales

Respuesta:

a) df.resample('M').sum()