Cuestionario Parte 1: Estableciendo el Escenario para un Análisis Avanzado
Respuestas
Pregunta 1: Manipulación Avanzada de Datos con Pandas
Respuesta:
b) Pandas puede manejar conjuntos de datos más grandes de manera eficiente con datos tabulares.
Pregunta 2: Filtrado Eficiente con Pandas
Respuesta:
a) df[(df['SalesAmount'] > 200) & (df['Store'] == 'A')]
Pregunta 3: Rendimiento con NumPy
Respuesta:
c) Iterar sobre elementos individuales con un bucle en Python.
Pregunta 4: Broadcasting en NumPy
Respuesta:
b) El proceso por el cual NumPy aplica operaciones a arreglos de diferentes formas.
Pregunta 5: Agrupación y Agregación en Pandas
Respuesta:
a) df.groupby('Category').agg({'PurchaseAmount': ['sum', 'mean']})
Pregunta 6: Pipelines de Scikit-learn
Respuesta:
b) Permite encadenar múltiples pasos de preprocesamiento y entrenamiento de modelos en un solo flujo de trabajo.
Pregunta 7: Fuga de Datos en Pipelines de Aprendizaje Automático
Respuesta:
b) Ocurre cuando el modelo puede ver o aprender de los datos de prueba durante el entrenamiento, lo que lleva a resultados excesivamente optimistas.
Pregunta 8: Optimización de Memoria en Pandas
Respuesta:
b) Reduce el uso de memoria de grandes conjuntos de datos.
Pregunta 9: Creación de Características de Interacción
Respuesta:
b) df['Interaction'] = df['PurchaseAmount'] * df['Discount']
Pregunta 10: Remuestreo de Datos de Series Temporales
Respuesta:
a) df.resample('M').sum()
Respuestas
Pregunta 1: Manipulación Avanzada de Datos con Pandas
Respuesta:
b) Pandas puede manejar conjuntos de datos más grandes de manera eficiente con datos tabulares.
Pregunta 2: Filtrado Eficiente con Pandas
Respuesta:
a) df[(df['SalesAmount'] > 200) & (df['Store'] == 'A')]
Pregunta 3: Rendimiento con NumPy
Respuesta:
c) Iterar sobre elementos individuales con un bucle en Python.
Pregunta 4: Broadcasting en NumPy
Respuesta:
b) El proceso por el cual NumPy aplica operaciones a arreglos de diferentes formas.
Pregunta 5: Agrupación y Agregación en Pandas
Respuesta:
a) df.groupby('Category').agg({'PurchaseAmount': ['sum', 'mean']})
Pregunta 6: Pipelines de Scikit-learn
Respuesta:
b) Permite encadenar múltiples pasos de preprocesamiento y entrenamiento de modelos en un solo flujo de trabajo.
Pregunta 7: Fuga de Datos en Pipelines de Aprendizaje Automático
Respuesta:
b) Ocurre cuando el modelo puede ver o aprender de los datos de prueba durante el entrenamiento, lo que lleva a resultados excesivamente optimistas.
Pregunta 8: Optimización de Memoria en Pandas
Respuesta:
b) Reduce el uso de memoria de grandes conjuntos de datos.
Pregunta 9: Creación de Características de Interacción
Respuesta:
b) df['Interaction'] = df['PurchaseAmount'] * df['Discount']
Pregunta 10: Remuestreo de Datos de Series Temporales
Respuesta:
a) df.resample('M').sum()
Respuestas
Pregunta 1: Manipulación Avanzada de Datos con Pandas
Respuesta:
b) Pandas puede manejar conjuntos de datos más grandes de manera eficiente con datos tabulares.
Pregunta 2: Filtrado Eficiente con Pandas
Respuesta:
a) df[(df['SalesAmount'] > 200) & (df['Store'] == 'A')]
Pregunta 3: Rendimiento con NumPy
Respuesta:
c) Iterar sobre elementos individuales con un bucle en Python.
Pregunta 4: Broadcasting en NumPy
Respuesta:
b) El proceso por el cual NumPy aplica operaciones a arreglos de diferentes formas.
Pregunta 5: Agrupación y Agregación en Pandas
Respuesta:
a) df.groupby('Category').agg({'PurchaseAmount': ['sum', 'mean']})
Pregunta 6: Pipelines de Scikit-learn
Respuesta:
b) Permite encadenar múltiples pasos de preprocesamiento y entrenamiento de modelos en un solo flujo de trabajo.
Pregunta 7: Fuga de Datos en Pipelines de Aprendizaje Automático
Respuesta:
b) Ocurre cuando el modelo puede ver o aprender de los datos de prueba durante el entrenamiento, lo que lleva a resultados excesivamente optimistas.
Pregunta 8: Optimización de Memoria en Pandas
Respuesta:
b) Reduce el uso de memoria de grandes conjuntos de datos.
Pregunta 9: Creación de Características de Interacción
Respuesta:
b) df['Interaction'] = df['PurchaseAmount'] * df['Discount']
Pregunta 10: Remuestreo de Datos de Series Temporales
Respuesta:
a) df.resample('M').sum()
Respuestas
Pregunta 1: Manipulación Avanzada de Datos con Pandas
Respuesta:
b) Pandas puede manejar conjuntos de datos más grandes de manera eficiente con datos tabulares.
Pregunta 2: Filtrado Eficiente con Pandas
Respuesta:
a) df[(df['SalesAmount'] > 200) & (df['Store'] == 'A')]
Pregunta 3: Rendimiento con NumPy
Respuesta:
c) Iterar sobre elementos individuales con un bucle en Python.
Pregunta 4: Broadcasting en NumPy
Respuesta:
b) El proceso por el cual NumPy aplica operaciones a arreglos de diferentes formas.
Pregunta 5: Agrupación y Agregación en Pandas
Respuesta:
a) df.groupby('Category').agg({'PurchaseAmount': ['sum', 'mean']})
Pregunta 6: Pipelines de Scikit-learn
Respuesta:
b) Permite encadenar múltiples pasos de preprocesamiento y entrenamiento de modelos en un solo flujo de trabajo.
Pregunta 7: Fuga de Datos en Pipelines de Aprendizaje Automático
Respuesta:
b) Ocurre cuando el modelo puede ver o aprender de los datos de prueba durante el entrenamiento, lo que lleva a resultados excesivamente optimistas.
Pregunta 8: Optimización de Memoria en Pandas
Respuesta:
b) Reduce el uso de memoria de grandes conjuntos de datos.
Pregunta 9: Creación de Características de Interacción
Respuesta:
b) df['Interaction'] = df['PurchaseAmount'] * df['Discount']
Pregunta 10: Remuestreo de Datos de Series Temporales
Respuesta:
a) df.resample('M').sum()