Capítulo 8: Entendiendo EDA
8.4 Ejercicios Prácticos para el Capítulo 8
Ejercicio 1: Comprender la Importancia del EDA
Carga un conjunto de datos de tu elección. Realiza exploraciones iniciales como .head()
, .info()
y .describe()
para entender los datos.
import pandas as pd
# Example Solution:
df = pd.read_csv('your_dataset.csv')
print(df.head())
print(df.info())
print(df.describe())
Ejercicio 2: Identificar Tipos de Datos
Identifica al menos dos columnas en tu conjunto de datos que contengan datos categóricos y dos que contengan datos numéricos.
# Example Solution:
# Categorical: 'Gender', 'Country'
# Numerical: 'Age', 'Income'
Ejercicio 3: Calcular Estadísticas Descriptivas
Calcula la media, mediana y desviación estándar de una columna numérica en tu conjunto de datos.
# Example Solution:
mean_age = df['Age'].mean()
median_age = df['Age'].median()
std_age = df['Age'].std()
print(f"Mean Age: {mean_age}")
print(f"Median Age: {median_age}")
print(f"Standard Deviation of Age: {std_age}")
Ejercicio 4: Comprender la Asimetría y la Kurtosis
Calcula la asimetría y la kurtosis para una columna numérica en tu conjunto de datos.
# Example Solution:
skewness = df['Income'].skew()
kurtosis = df['Income'].kurt()
print(f"Skewness of Income: {skewness}")
print(f"Kurtosis of Income: {kurtosis}")
8.4 Ejercicios Prácticos para el Capítulo 8
Ejercicio 1: Comprender la Importancia del EDA
Carga un conjunto de datos de tu elección. Realiza exploraciones iniciales como .head()
, .info()
y .describe()
para entender los datos.
import pandas as pd
# Example Solution:
df = pd.read_csv('your_dataset.csv')
print(df.head())
print(df.info())
print(df.describe())
Ejercicio 2: Identificar Tipos de Datos
Identifica al menos dos columnas en tu conjunto de datos que contengan datos categóricos y dos que contengan datos numéricos.
# Example Solution:
# Categorical: 'Gender', 'Country'
# Numerical: 'Age', 'Income'
Ejercicio 3: Calcular Estadísticas Descriptivas
Calcula la media, mediana y desviación estándar de una columna numérica en tu conjunto de datos.
# Example Solution:
mean_age = df['Age'].mean()
median_age = df['Age'].median()
std_age = df['Age'].std()
print(f"Mean Age: {mean_age}")
print(f"Median Age: {median_age}")
print(f"Standard Deviation of Age: {std_age}")
Ejercicio 4: Comprender la Asimetría y la Kurtosis
Calcula la asimetría y la kurtosis para una columna numérica en tu conjunto de datos.
# Example Solution:
skewness = df['Income'].skew()
kurtosis = df['Income'].kurt()
print(f"Skewness of Income: {skewness}")
print(f"Kurtosis of Income: {kurtosis}")
8.4 Ejercicios Prácticos para el Capítulo 8
Ejercicio 1: Comprender la Importancia del EDA
Carga un conjunto de datos de tu elección. Realiza exploraciones iniciales como .head()
, .info()
y .describe()
para entender los datos.
import pandas as pd
# Example Solution:
df = pd.read_csv('your_dataset.csv')
print(df.head())
print(df.info())
print(df.describe())
Ejercicio 2: Identificar Tipos de Datos
Identifica al menos dos columnas en tu conjunto de datos que contengan datos categóricos y dos que contengan datos numéricos.
# Example Solution:
# Categorical: 'Gender', 'Country'
# Numerical: 'Age', 'Income'
Ejercicio 3: Calcular Estadísticas Descriptivas
Calcula la media, mediana y desviación estándar de una columna numérica en tu conjunto de datos.
# Example Solution:
mean_age = df['Age'].mean()
median_age = df['Age'].median()
std_age = df['Age'].std()
print(f"Mean Age: {mean_age}")
print(f"Median Age: {median_age}")
print(f"Standard Deviation of Age: {std_age}")
Ejercicio 4: Comprender la Asimetría y la Kurtosis
Calcula la asimetría y la kurtosis para una columna numérica en tu conjunto de datos.
# Example Solution:
skewness = df['Income'].skew()
kurtosis = df['Income'].kurt()
print(f"Skewness of Income: {skewness}")
print(f"Kurtosis of Income: {kurtosis}")
8.4 Ejercicios Prácticos para el Capítulo 8
Ejercicio 1: Comprender la Importancia del EDA
Carga un conjunto de datos de tu elección. Realiza exploraciones iniciales como .head()
, .info()
y .describe()
para entender los datos.
import pandas as pd
# Example Solution:
df = pd.read_csv('your_dataset.csv')
print(df.head())
print(df.info())
print(df.describe())
Ejercicio 2: Identificar Tipos de Datos
Identifica al menos dos columnas en tu conjunto de datos que contengan datos categóricos y dos que contengan datos numéricos.
# Example Solution:
# Categorical: 'Gender', 'Country'
# Numerical: 'Age', 'Income'
Ejercicio 3: Calcular Estadísticas Descriptivas
Calcula la media, mediana y desviación estándar de una columna numérica en tu conjunto de datos.
# Example Solution:
mean_age = df['Age'].mean()
median_age = df['Age'].median()
std_age = df['Age'].std()
print(f"Mean Age: {mean_age}")
print(f"Median Age: {median_age}")
print(f"Standard Deviation of Age: {std_age}")
Ejercicio 4: Comprender la Asimetría y la Kurtosis
Calcula la asimetría y la kurtosis para una columna numérica en tu conjunto de datos.
# Example Solution:
skewness = df['Income'].skew()
kurtosis = df['Income'].kurt()
print(f"Skewness of Income: {skewness}")
print(f"Kurtosis of Income: {kurtosis}")