Capítulo 1: Introducción al Análisis de Datos y Python
1.4 Ejercicios Prácticos para el Capítulo 1
Ejercicio 1: Definir un Problema de Análisis de Datos
- Objetivo: Ejercitar su habilidad para formular un problema adecuado para el análisis de datos.
- Tarea: Escriba una declaración de problema o pregunta que le gustaría resolver utilizando el análisis de datos. Sea lo más específico posible.
- Consejo: Ejemplos de declaraciones de problemas podrían ser "¿Cuál es la edad promedio de los clientes que compraron un producto en particular?" o "¿Cómo afectan los cambios de temperatura al consumo de electricidad?"
Ejercicio 2: Recopilación de Datos con Python
- Objetivo: Familiarizarse con las capacidades de Python para la recopilación de datos.
- Tarea: Utilice la biblioteca
requests
de Python para obtener datos de una API abierta de su elección. - Consejo: Asegúrese de consultar la documentación de la API para conocer las pautas de uso.
# Starter Code
import requests
response = requests.get("<https://api.example.com/your_endpoint>")
print(response.json())
Ejercicio 3: Limpieza Básica de Datos con Pandas
- Objetivo: Limpiar un conjunto de datos simple utilizando la biblioteca Pandas de Python.
- Tarea: Importar un archivo CSV en un DataFrame de Pandas y reemplazar todos los valores NaN (nulos) con 0.
- Consejo: Utilice el método
fillna()
en Pandas.
# Starter Code
import pandas as pd
df = pd.read_csv("your_file.csv")
df.fillna(0, inplace=True)
Ejercicio 4: Crear un Gráfico Básico
- Objetivo: Practicar la creación de un gráfico básico utilizando Matplotlib.
- Tarea: Graficar un histograma de edades a partir del DataFrame que utilizaste en el Ejercicio 3.
- Consejo: Utiliza la función
hist()
de Matplotlib.
# Starter Code
import matplotlib.pyplot as plt
plt.hist(df['age'], bins=20)
plt.show()
Ejercicio 5: Evaluar un Modelo Simple
- Objetivo: Familiarizarse con la evaluación básica de modelos.
- Tarea: Utilizar la biblioteca Scikit-learn para ajustar un modelo de Regresión Lineal en cualquier par de variables del DataFrame que utilizaste en el Ejercicio 3. Evaluar el rendimiento del modelo utilizando la métrica del Error Cuadrático Medio (MSE).
- Consejo: Utiliza
LinearRegression
del módulolinear_model
de Scikit-learn ymean_squared_error
del módulometrics
.
# Starter Code
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
# Your code here
Al trabajar en estos ejercicios, solidificarás tu comprensión del proceso de análisis de datos y obtendrás experiencia práctica con las bibliotecas de análisis de datos de Python. Buena suerte y recuerda: la clave para dominar el análisis de datos es ¡practicar, practicar y practicar!
1.4 Ejercicios Prácticos para el Capítulo 1
Ejercicio 1: Definir un Problema de Análisis de Datos
- Objetivo: Ejercitar su habilidad para formular un problema adecuado para el análisis de datos.
- Tarea: Escriba una declaración de problema o pregunta que le gustaría resolver utilizando el análisis de datos. Sea lo más específico posible.
- Consejo: Ejemplos de declaraciones de problemas podrían ser "¿Cuál es la edad promedio de los clientes que compraron un producto en particular?" o "¿Cómo afectan los cambios de temperatura al consumo de electricidad?"
Ejercicio 2: Recopilación de Datos con Python
- Objetivo: Familiarizarse con las capacidades de Python para la recopilación de datos.
- Tarea: Utilice la biblioteca
requests
de Python para obtener datos de una API abierta de su elección. - Consejo: Asegúrese de consultar la documentación de la API para conocer las pautas de uso.
# Starter Code
import requests
response = requests.get("<https://api.example.com/your_endpoint>")
print(response.json())
Ejercicio 3: Limpieza Básica de Datos con Pandas
- Objetivo: Limpiar un conjunto de datos simple utilizando la biblioteca Pandas de Python.
- Tarea: Importar un archivo CSV en un DataFrame de Pandas y reemplazar todos los valores NaN (nulos) con 0.
- Consejo: Utilice el método
fillna()
en Pandas.
# Starter Code
import pandas as pd
df = pd.read_csv("your_file.csv")
df.fillna(0, inplace=True)
Ejercicio 4: Crear un Gráfico Básico
- Objetivo: Practicar la creación de un gráfico básico utilizando Matplotlib.
- Tarea: Graficar un histograma de edades a partir del DataFrame que utilizaste en el Ejercicio 3.
- Consejo: Utiliza la función
hist()
de Matplotlib.
# Starter Code
import matplotlib.pyplot as plt
plt.hist(df['age'], bins=20)
plt.show()
Ejercicio 5: Evaluar un Modelo Simple
- Objetivo: Familiarizarse con la evaluación básica de modelos.
- Tarea: Utilizar la biblioteca Scikit-learn para ajustar un modelo de Regresión Lineal en cualquier par de variables del DataFrame que utilizaste en el Ejercicio 3. Evaluar el rendimiento del modelo utilizando la métrica del Error Cuadrático Medio (MSE).
- Consejo: Utiliza
LinearRegression
del módulolinear_model
de Scikit-learn ymean_squared_error
del módulometrics
.
# Starter Code
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
# Your code here
Al trabajar en estos ejercicios, solidificarás tu comprensión del proceso de análisis de datos y obtendrás experiencia práctica con las bibliotecas de análisis de datos de Python. Buena suerte y recuerda: la clave para dominar el análisis de datos es ¡practicar, practicar y practicar!
1.4 Ejercicios Prácticos para el Capítulo 1
Ejercicio 1: Definir un Problema de Análisis de Datos
- Objetivo: Ejercitar su habilidad para formular un problema adecuado para el análisis de datos.
- Tarea: Escriba una declaración de problema o pregunta que le gustaría resolver utilizando el análisis de datos. Sea lo más específico posible.
- Consejo: Ejemplos de declaraciones de problemas podrían ser "¿Cuál es la edad promedio de los clientes que compraron un producto en particular?" o "¿Cómo afectan los cambios de temperatura al consumo de electricidad?"
Ejercicio 2: Recopilación de Datos con Python
- Objetivo: Familiarizarse con las capacidades de Python para la recopilación de datos.
- Tarea: Utilice la biblioteca
requests
de Python para obtener datos de una API abierta de su elección. - Consejo: Asegúrese de consultar la documentación de la API para conocer las pautas de uso.
# Starter Code
import requests
response = requests.get("<https://api.example.com/your_endpoint>")
print(response.json())
Ejercicio 3: Limpieza Básica de Datos con Pandas
- Objetivo: Limpiar un conjunto de datos simple utilizando la biblioteca Pandas de Python.
- Tarea: Importar un archivo CSV en un DataFrame de Pandas y reemplazar todos los valores NaN (nulos) con 0.
- Consejo: Utilice el método
fillna()
en Pandas.
# Starter Code
import pandas as pd
df = pd.read_csv("your_file.csv")
df.fillna(0, inplace=True)
Ejercicio 4: Crear un Gráfico Básico
- Objetivo: Practicar la creación de un gráfico básico utilizando Matplotlib.
- Tarea: Graficar un histograma de edades a partir del DataFrame que utilizaste en el Ejercicio 3.
- Consejo: Utiliza la función
hist()
de Matplotlib.
# Starter Code
import matplotlib.pyplot as plt
plt.hist(df['age'], bins=20)
plt.show()
Ejercicio 5: Evaluar un Modelo Simple
- Objetivo: Familiarizarse con la evaluación básica de modelos.
- Tarea: Utilizar la biblioteca Scikit-learn para ajustar un modelo de Regresión Lineal en cualquier par de variables del DataFrame que utilizaste en el Ejercicio 3. Evaluar el rendimiento del modelo utilizando la métrica del Error Cuadrático Medio (MSE).
- Consejo: Utiliza
LinearRegression
del módulolinear_model
de Scikit-learn ymean_squared_error
del módulometrics
.
# Starter Code
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
# Your code here
Al trabajar en estos ejercicios, solidificarás tu comprensión del proceso de análisis de datos y obtendrás experiencia práctica con las bibliotecas de análisis de datos de Python. Buena suerte y recuerda: la clave para dominar el análisis de datos es ¡practicar, practicar y practicar!
1.4 Ejercicios Prácticos para el Capítulo 1
Ejercicio 1: Definir un Problema de Análisis de Datos
- Objetivo: Ejercitar su habilidad para formular un problema adecuado para el análisis de datos.
- Tarea: Escriba una declaración de problema o pregunta que le gustaría resolver utilizando el análisis de datos. Sea lo más específico posible.
- Consejo: Ejemplos de declaraciones de problemas podrían ser "¿Cuál es la edad promedio de los clientes que compraron un producto en particular?" o "¿Cómo afectan los cambios de temperatura al consumo de electricidad?"
Ejercicio 2: Recopilación de Datos con Python
- Objetivo: Familiarizarse con las capacidades de Python para la recopilación de datos.
- Tarea: Utilice la biblioteca
requests
de Python para obtener datos de una API abierta de su elección. - Consejo: Asegúrese de consultar la documentación de la API para conocer las pautas de uso.
# Starter Code
import requests
response = requests.get("<https://api.example.com/your_endpoint>")
print(response.json())
Ejercicio 3: Limpieza Básica de Datos con Pandas
- Objetivo: Limpiar un conjunto de datos simple utilizando la biblioteca Pandas de Python.
- Tarea: Importar un archivo CSV en un DataFrame de Pandas y reemplazar todos los valores NaN (nulos) con 0.
- Consejo: Utilice el método
fillna()
en Pandas.
# Starter Code
import pandas as pd
df = pd.read_csv("your_file.csv")
df.fillna(0, inplace=True)
Ejercicio 4: Crear un Gráfico Básico
- Objetivo: Practicar la creación de un gráfico básico utilizando Matplotlib.
- Tarea: Graficar un histograma de edades a partir del DataFrame que utilizaste en el Ejercicio 3.
- Consejo: Utiliza la función
hist()
de Matplotlib.
# Starter Code
import matplotlib.pyplot as plt
plt.hist(df['age'], bins=20)
plt.show()
Ejercicio 5: Evaluar un Modelo Simple
- Objetivo: Familiarizarse con la evaluación básica de modelos.
- Tarea: Utilizar la biblioteca Scikit-learn para ajustar un modelo de Regresión Lineal en cualquier par de variables del DataFrame que utilizaste en el Ejercicio 3. Evaluar el rendimiento del modelo utilizando la métrica del Error Cuadrático Medio (MSE).
- Consejo: Utiliza
LinearRegression
del módulolinear_model
de Scikit-learn ymean_squared_error
del módulometrics
.
# Starter Code
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
# Your code here
Al trabajar en estos ejercicios, solidificarás tu comprensión del proceso de análisis de datos y obtendrás experiencia práctica con las bibliotecas de análisis de datos de Python. Buena suerte y recuerda: la clave para dominar el análisis de datos es ¡practicar, practicar y practicar!