Capítulo 10: Análisis Exploratorio de Datos Visuales
10.4 Ejercicios Prácticos Capítulo 10
Los ejercicios prácticos son una excelente manera de solidificar tu comprensión de los conceptos. Aquí tienes algunos ejercicios centrados en el análisis exploratorio de datos visual, junto con sus soluciones.
Ejercicio 1: Análisis Univariado con Histogramas
Tarea: Dado un conjunto de datos de puntuaciones de exámenes para estudiantes, traza un histograma para entender la distribución de las puntuaciones.
# Sample data: Exam scores of 50 students
exam_scores = [55, 80, 74, 61, 90, 85, 68, 95, 60, 66, 70, 99, 53, 79, 62, 89, 75, 69, 94, 71, 83, 88, 57, 45, 73, 91, 76, 84, 64, 58, 98, 63, 78, 92, 82, 77, 72, 65, 59, 86, 87, 67, 46, 93, 81, 97, 54, 50, 96, 100]
# Your code here
Solución
import matplotlib.pyplot as plt
plt.hist(exam_scores, bins=10, color='blue', edgecolor='black')
plt.xlabel('Exam Scores')
plt.ylabel('Frequency')
plt.title('Distribution of Exam Scores')
plt.show()
Ejercicio 2: Análisis Bivariado con Gráfico de Dispersión
Tarea: Crea un gráfico de dispersión para visualizar la relación entre las alturas y los pesos de un grupo de individuos.
# Sample data: Heights and weights of 10 individuals
heights = [160, 165, 170, 175, 180, 185, 190, 195, 200, 205]
weights = [55, 60, 65, 70, 75, 80, 85, 90, 95, 100]
# Your code here
Solución
plt.scatter(heights, weights, c='red', marker='o')
plt.xlabel('Heights (cm)')
plt.ylabel('Weights (kg)')
plt.title('Relationship between Heights and Weights')
plt.show()
Ejercicio 3: Análisis Multivariado usando un Mapa de Calor
Tarea: Dado un conjunto de datos con múltiples características, crea un mapa de calor para visualizar las correlaciones entre estas características.
# Sample data: Randomly generated for 4 features
import numpy as np
import pandas as pd
import seaborn as sns
np.random.seed(42)
data = {'Feature1': np.random.randn(100),
'Feature2': np.random.randn(100),
'Feature3': np.random.randn(100),
'Feature4': np.random.randn(100)}
df = pd.DataFrame(data)
# Your code here
Solución
corr = df.corr()
sns.heatmap(corr, annot=True, cmap='coolwarm')
plt.show()
10.4 Ejercicios Prácticos Capítulo 10
Los ejercicios prácticos son una excelente manera de solidificar tu comprensión de los conceptos. Aquí tienes algunos ejercicios centrados en el análisis exploratorio de datos visual, junto con sus soluciones.
Ejercicio 1: Análisis Univariado con Histogramas
Tarea: Dado un conjunto de datos de puntuaciones de exámenes para estudiantes, traza un histograma para entender la distribución de las puntuaciones.
# Sample data: Exam scores of 50 students
exam_scores = [55, 80, 74, 61, 90, 85, 68, 95, 60, 66, 70, 99, 53, 79, 62, 89, 75, 69, 94, 71, 83, 88, 57, 45, 73, 91, 76, 84, 64, 58, 98, 63, 78, 92, 82, 77, 72, 65, 59, 86, 87, 67, 46, 93, 81, 97, 54, 50, 96, 100]
# Your code here
Solución
import matplotlib.pyplot as plt
plt.hist(exam_scores, bins=10, color='blue', edgecolor='black')
plt.xlabel('Exam Scores')
plt.ylabel('Frequency')
plt.title('Distribution of Exam Scores')
plt.show()
Ejercicio 2: Análisis Bivariado con Gráfico de Dispersión
Tarea: Crea un gráfico de dispersión para visualizar la relación entre las alturas y los pesos de un grupo de individuos.
# Sample data: Heights and weights of 10 individuals
heights = [160, 165, 170, 175, 180, 185, 190, 195, 200, 205]
weights = [55, 60, 65, 70, 75, 80, 85, 90, 95, 100]
# Your code here
Solución
plt.scatter(heights, weights, c='red', marker='o')
plt.xlabel('Heights (cm)')
plt.ylabel('Weights (kg)')
plt.title('Relationship between Heights and Weights')
plt.show()
Ejercicio 3: Análisis Multivariado usando un Mapa de Calor
Tarea: Dado un conjunto de datos con múltiples características, crea un mapa de calor para visualizar las correlaciones entre estas características.
# Sample data: Randomly generated for 4 features
import numpy as np
import pandas as pd
import seaborn as sns
np.random.seed(42)
data = {'Feature1': np.random.randn(100),
'Feature2': np.random.randn(100),
'Feature3': np.random.randn(100),
'Feature4': np.random.randn(100)}
df = pd.DataFrame(data)
# Your code here
Solución
corr = df.corr()
sns.heatmap(corr, annot=True, cmap='coolwarm')
plt.show()
10.4 Ejercicios Prácticos Capítulo 10
Los ejercicios prácticos son una excelente manera de solidificar tu comprensión de los conceptos. Aquí tienes algunos ejercicios centrados en el análisis exploratorio de datos visual, junto con sus soluciones.
Ejercicio 1: Análisis Univariado con Histogramas
Tarea: Dado un conjunto de datos de puntuaciones de exámenes para estudiantes, traza un histograma para entender la distribución de las puntuaciones.
# Sample data: Exam scores of 50 students
exam_scores = [55, 80, 74, 61, 90, 85, 68, 95, 60, 66, 70, 99, 53, 79, 62, 89, 75, 69, 94, 71, 83, 88, 57, 45, 73, 91, 76, 84, 64, 58, 98, 63, 78, 92, 82, 77, 72, 65, 59, 86, 87, 67, 46, 93, 81, 97, 54, 50, 96, 100]
# Your code here
Solución
import matplotlib.pyplot as plt
plt.hist(exam_scores, bins=10, color='blue', edgecolor='black')
plt.xlabel('Exam Scores')
plt.ylabel('Frequency')
plt.title('Distribution of Exam Scores')
plt.show()
Ejercicio 2: Análisis Bivariado con Gráfico de Dispersión
Tarea: Crea un gráfico de dispersión para visualizar la relación entre las alturas y los pesos de un grupo de individuos.
# Sample data: Heights and weights of 10 individuals
heights = [160, 165, 170, 175, 180, 185, 190, 195, 200, 205]
weights = [55, 60, 65, 70, 75, 80, 85, 90, 95, 100]
# Your code here
Solución
plt.scatter(heights, weights, c='red', marker='o')
plt.xlabel('Heights (cm)')
plt.ylabel('Weights (kg)')
plt.title('Relationship between Heights and Weights')
plt.show()
Ejercicio 3: Análisis Multivariado usando un Mapa de Calor
Tarea: Dado un conjunto de datos con múltiples características, crea un mapa de calor para visualizar las correlaciones entre estas características.
# Sample data: Randomly generated for 4 features
import numpy as np
import pandas as pd
import seaborn as sns
np.random.seed(42)
data = {'Feature1': np.random.randn(100),
'Feature2': np.random.randn(100),
'Feature3': np.random.randn(100),
'Feature4': np.random.randn(100)}
df = pd.DataFrame(data)
# Your code here
Solución
corr = df.corr()
sns.heatmap(corr, annot=True, cmap='coolwarm')
plt.show()
10.4 Ejercicios Prácticos Capítulo 10
Los ejercicios prácticos son una excelente manera de solidificar tu comprensión de los conceptos. Aquí tienes algunos ejercicios centrados en el análisis exploratorio de datos visual, junto con sus soluciones.
Ejercicio 1: Análisis Univariado con Histogramas
Tarea: Dado un conjunto de datos de puntuaciones de exámenes para estudiantes, traza un histograma para entender la distribución de las puntuaciones.
# Sample data: Exam scores of 50 students
exam_scores = [55, 80, 74, 61, 90, 85, 68, 95, 60, 66, 70, 99, 53, 79, 62, 89, 75, 69, 94, 71, 83, 88, 57, 45, 73, 91, 76, 84, 64, 58, 98, 63, 78, 92, 82, 77, 72, 65, 59, 86, 87, 67, 46, 93, 81, 97, 54, 50, 96, 100]
# Your code here
Solución
import matplotlib.pyplot as plt
plt.hist(exam_scores, bins=10, color='blue', edgecolor='black')
plt.xlabel('Exam Scores')
plt.ylabel('Frequency')
plt.title('Distribution of Exam Scores')
plt.show()
Ejercicio 2: Análisis Bivariado con Gráfico de Dispersión
Tarea: Crea un gráfico de dispersión para visualizar la relación entre las alturas y los pesos de un grupo de individuos.
# Sample data: Heights and weights of 10 individuals
heights = [160, 165, 170, 175, 180, 185, 190, 195, 200, 205]
weights = [55, 60, 65, 70, 75, 80, 85, 90, 95, 100]
# Your code here
Solución
plt.scatter(heights, weights, c='red', marker='o')
plt.xlabel('Heights (cm)')
plt.ylabel('Weights (kg)')
plt.title('Relationship between Heights and Weights')
plt.show()
Ejercicio 3: Análisis Multivariado usando un Mapa de Calor
Tarea: Dado un conjunto de datos con múltiples características, crea un mapa de calor para visualizar las correlaciones entre estas características.
# Sample data: Randomly generated for 4 features
import numpy as np
import pandas as pd
import seaborn as sns
np.random.seed(42)
data = {'Feature1': np.random.randn(100),
'Feature2': np.random.randn(100),
'Feature3': np.random.randn(100),
'Feature4': np.random.randn(100)}
df = pd.DataFrame(data)
# Your code here
Solución
corr = df.corr()
sns.heatmap(corr, annot=True, cmap='coolwarm')
plt.show()