Menu iconMenu icon
Fundamentos del Análisis de Datos con Python

Proyecto 2: Predicción de precios de casas

Ingeniería de Características

Hasta ahora, has conseguido que tus datos luzcan ordenados y bien organizados, ¡pero adivina qué! Podemos mejorarlo aún más. ¿Cómo, preguntas? ¡A través de la magia de la Ingeniería de Características!

La ingeniería de características es esencialmente el arte de mejorar tu conjunto de datos con nuevas características que podrían ayudar a tu modelo a hacer mejores predicciones. Es como agregar especias a un plato para hacerlo aún más delicioso. ¡Vamos a través de este importante paso en nuestro proyecto de predicción de precios de casas!

Creación de Características Polinómicas

Una forma de mejorar nuestro conjunto de datos es mediante la creación de características polinómicas. Esto implica crear nuevas características que son potencias de las existentes. Por ejemplo, si tenemos una característica que representa el número de habitaciones, podríamos crear otra característica que sea el cuadrado del número de habitaciones.

# Creating a new feature 'Bedrooms_Squared'
df['Bedrooms_Squared'] = df['Bedrooms'] ** 2

Términos de Interacción

También puedes crear términos de interacción entre dos variables diferentes. Digamos que nuestro conjunto de datos tiene 'Pies Cuadrados' y 'Número de Habitaciones'; la interacción sería 'Pies Cuadrados por Habitación'.

# Creating a new feature 'Square_Footage_per_Bedroom'
df['Square_Footage_per_Bedroom'] = df['Square_Footage'] / df['Bedrooms']

Ingeniería de Características Categóricas

Si tienes características categóricas que no están capturando los matices en tus datos, puedes agregar más granularidad. Por ejemplo, en lugar de una categoría amplia como 'Vecindario', podrías tener 'Cerca_de_Escuela_en_Vecindario'.

# Engineering a new feature based on existing categorical features
df['Close_to_School_in_Neighborhood'] = df['Neighborhood'] + "_" + df['Close_to_School'].astype(str)

Características Temporales

Si tu conjunto de datos contiene variables de fecha, puedes extraer información valiosa de ellas. Por ejemplo, si tienes la 'Fecha de Venta', podrías extraer el 'Mes de Venta' o el 'Trimestre de Venta'.

# Converting 'Date_of_Sale' to datetime format
df['Date_of_Sale'] = pd.to_datetime(df['Date_of_Sale'])

# Extracting the quarter
df['Quarter_of_Sale'] = df['Date_of_Sale'].dt.quarter

Transformación de Características

A veces, un pequeño ajuste matemático puede ser de gran ayuda. Las transformaciones logarítmicas son bastante útiles para tratar con datos sesgados.

import numpy as np

# Applying log transformation
df['Log_Square_Footage'] = np.log(df['Square_Footage'])

¡Muy bien! Has creado con éxito algunas características increíblemente útiles para tu conjunto de datos. Puedes pensar en esto como un paso opcional, pero confía en nosotros, una buena ingeniería de características puede marcar la diferencia entre un modelo mediocre y uno fantástico.

En la próxima sección, nos aventuraremos en las emocionantes tierras de los modelos de aprendizaje automático, donde todo tu arduo trabajo hasta ahora comenzará a dar sus frutos. ¡No puedo esperar a verte allí!

Ingeniería de Características

Hasta ahora, has conseguido que tus datos luzcan ordenados y bien organizados, ¡pero adivina qué! Podemos mejorarlo aún más. ¿Cómo, preguntas? ¡A través de la magia de la Ingeniería de Características!

La ingeniería de características es esencialmente el arte de mejorar tu conjunto de datos con nuevas características que podrían ayudar a tu modelo a hacer mejores predicciones. Es como agregar especias a un plato para hacerlo aún más delicioso. ¡Vamos a través de este importante paso en nuestro proyecto de predicción de precios de casas!

Creación de Características Polinómicas

Una forma de mejorar nuestro conjunto de datos es mediante la creación de características polinómicas. Esto implica crear nuevas características que son potencias de las existentes. Por ejemplo, si tenemos una característica que representa el número de habitaciones, podríamos crear otra característica que sea el cuadrado del número de habitaciones.

# Creating a new feature 'Bedrooms_Squared'
df['Bedrooms_Squared'] = df['Bedrooms'] ** 2

Términos de Interacción

También puedes crear términos de interacción entre dos variables diferentes. Digamos que nuestro conjunto de datos tiene 'Pies Cuadrados' y 'Número de Habitaciones'; la interacción sería 'Pies Cuadrados por Habitación'.

# Creating a new feature 'Square_Footage_per_Bedroom'
df['Square_Footage_per_Bedroom'] = df['Square_Footage'] / df['Bedrooms']

Ingeniería de Características Categóricas

Si tienes características categóricas que no están capturando los matices en tus datos, puedes agregar más granularidad. Por ejemplo, en lugar de una categoría amplia como 'Vecindario', podrías tener 'Cerca_de_Escuela_en_Vecindario'.

# Engineering a new feature based on existing categorical features
df['Close_to_School_in_Neighborhood'] = df['Neighborhood'] + "_" + df['Close_to_School'].astype(str)

Características Temporales

Si tu conjunto de datos contiene variables de fecha, puedes extraer información valiosa de ellas. Por ejemplo, si tienes la 'Fecha de Venta', podrías extraer el 'Mes de Venta' o el 'Trimestre de Venta'.

# Converting 'Date_of_Sale' to datetime format
df['Date_of_Sale'] = pd.to_datetime(df['Date_of_Sale'])

# Extracting the quarter
df['Quarter_of_Sale'] = df['Date_of_Sale'].dt.quarter

Transformación de Características

A veces, un pequeño ajuste matemático puede ser de gran ayuda. Las transformaciones logarítmicas son bastante útiles para tratar con datos sesgados.

import numpy as np

# Applying log transformation
df['Log_Square_Footage'] = np.log(df['Square_Footage'])

¡Muy bien! Has creado con éxito algunas características increíblemente útiles para tu conjunto de datos. Puedes pensar en esto como un paso opcional, pero confía en nosotros, una buena ingeniería de características puede marcar la diferencia entre un modelo mediocre y uno fantástico.

En la próxima sección, nos aventuraremos en las emocionantes tierras de los modelos de aprendizaje automático, donde todo tu arduo trabajo hasta ahora comenzará a dar sus frutos. ¡No puedo esperar a verte allí!

Ingeniería de Características

Hasta ahora, has conseguido que tus datos luzcan ordenados y bien organizados, ¡pero adivina qué! Podemos mejorarlo aún más. ¿Cómo, preguntas? ¡A través de la magia de la Ingeniería de Características!

La ingeniería de características es esencialmente el arte de mejorar tu conjunto de datos con nuevas características que podrían ayudar a tu modelo a hacer mejores predicciones. Es como agregar especias a un plato para hacerlo aún más delicioso. ¡Vamos a través de este importante paso en nuestro proyecto de predicción de precios de casas!

Creación de Características Polinómicas

Una forma de mejorar nuestro conjunto de datos es mediante la creación de características polinómicas. Esto implica crear nuevas características que son potencias de las existentes. Por ejemplo, si tenemos una característica que representa el número de habitaciones, podríamos crear otra característica que sea el cuadrado del número de habitaciones.

# Creating a new feature 'Bedrooms_Squared'
df['Bedrooms_Squared'] = df['Bedrooms'] ** 2

Términos de Interacción

También puedes crear términos de interacción entre dos variables diferentes. Digamos que nuestro conjunto de datos tiene 'Pies Cuadrados' y 'Número de Habitaciones'; la interacción sería 'Pies Cuadrados por Habitación'.

# Creating a new feature 'Square_Footage_per_Bedroom'
df['Square_Footage_per_Bedroom'] = df['Square_Footage'] / df['Bedrooms']

Ingeniería de Características Categóricas

Si tienes características categóricas que no están capturando los matices en tus datos, puedes agregar más granularidad. Por ejemplo, en lugar de una categoría amplia como 'Vecindario', podrías tener 'Cerca_de_Escuela_en_Vecindario'.

# Engineering a new feature based on existing categorical features
df['Close_to_School_in_Neighborhood'] = df['Neighborhood'] + "_" + df['Close_to_School'].astype(str)

Características Temporales

Si tu conjunto de datos contiene variables de fecha, puedes extraer información valiosa de ellas. Por ejemplo, si tienes la 'Fecha de Venta', podrías extraer el 'Mes de Venta' o el 'Trimestre de Venta'.

# Converting 'Date_of_Sale' to datetime format
df['Date_of_Sale'] = pd.to_datetime(df['Date_of_Sale'])

# Extracting the quarter
df['Quarter_of_Sale'] = df['Date_of_Sale'].dt.quarter

Transformación de Características

A veces, un pequeño ajuste matemático puede ser de gran ayuda. Las transformaciones logarítmicas son bastante útiles para tratar con datos sesgados.

import numpy as np

# Applying log transformation
df['Log_Square_Footage'] = np.log(df['Square_Footage'])

¡Muy bien! Has creado con éxito algunas características increíblemente útiles para tu conjunto de datos. Puedes pensar en esto como un paso opcional, pero confía en nosotros, una buena ingeniería de características puede marcar la diferencia entre un modelo mediocre y uno fantástico.

En la próxima sección, nos aventuraremos en las emocionantes tierras de los modelos de aprendizaje automático, donde todo tu arduo trabajo hasta ahora comenzará a dar sus frutos. ¡No puedo esperar a verte allí!

Ingeniería de Características

Hasta ahora, has conseguido que tus datos luzcan ordenados y bien organizados, ¡pero adivina qué! Podemos mejorarlo aún más. ¿Cómo, preguntas? ¡A través de la magia de la Ingeniería de Características!

La ingeniería de características es esencialmente el arte de mejorar tu conjunto de datos con nuevas características que podrían ayudar a tu modelo a hacer mejores predicciones. Es como agregar especias a un plato para hacerlo aún más delicioso. ¡Vamos a través de este importante paso en nuestro proyecto de predicción de precios de casas!

Creación de Características Polinómicas

Una forma de mejorar nuestro conjunto de datos es mediante la creación de características polinómicas. Esto implica crear nuevas características que son potencias de las existentes. Por ejemplo, si tenemos una característica que representa el número de habitaciones, podríamos crear otra característica que sea el cuadrado del número de habitaciones.

# Creating a new feature 'Bedrooms_Squared'
df['Bedrooms_Squared'] = df['Bedrooms'] ** 2

Términos de Interacción

También puedes crear términos de interacción entre dos variables diferentes. Digamos que nuestro conjunto de datos tiene 'Pies Cuadrados' y 'Número de Habitaciones'; la interacción sería 'Pies Cuadrados por Habitación'.

# Creating a new feature 'Square_Footage_per_Bedroom'
df['Square_Footage_per_Bedroom'] = df['Square_Footage'] / df['Bedrooms']

Ingeniería de Características Categóricas

Si tienes características categóricas que no están capturando los matices en tus datos, puedes agregar más granularidad. Por ejemplo, en lugar de una categoría amplia como 'Vecindario', podrías tener 'Cerca_de_Escuela_en_Vecindario'.

# Engineering a new feature based on existing categorical features
df['Close_to_School_in_Neighborhood'] = df['Neighborhood'] + "_" + df['Close_to_School'].astype(str)

Características Temporales

Si tu conjunto de datos contiene variables de fecha, puedes extraer información valiosa de ellas. Por ejemplo, si tienes la 'Fecha de Venta', podrías extraer el 'Mes de Venta' o el 'Trimestre de Venta'.

# Converting 'Date_of_Sale' to datetime format
df['Date_of_Sale'] = pd.to_datetime(df['Date_of_Sale'])

# Extracting the quarter
df['Quarter_of_Sale'] = df['Date_of_Sale'].dt.quarter

Transformación de Características

A veces, un pequeño ajuste matemático puede ser de gran ayuda. Las transformaciones logarítmicas son bastante útiles para tratar con datos sesgados.

import numpy as np

# Applying log transformation
df['Log_Square_Footage'] = np.log(df['Square_Footage'])

¡Muy bien! Has creado con éxito algunas características increíblemente útiles para tu conjunto de datos. Puedes pensar en esto como un paso opcional, pero confía en nosotros, una buena ingeniería de características puede marcar la diferencia entre un modelo mediocre y uno fantástico.

En la próxima sección, nos aventuraremos en las emocionantes tierras de los modelos de aprendizaje automático, donde todo tu arduo trabajo hasta ahora comenzará a dar sus frutos. ¡No puedo esperar a verte allí!