Obtener Acceso
PARA mejora tus habilidades
Más de Más de 8.000 Libros vendidos
4.4 estrellas EN Amazon

Fundamentos de Ingeniería de Datos

Técnicas básicas para el análisis de datos con Pandas, NumPy y Scikit-Learn

Este libro proporciona una guía esencial sobre los componentes básicos de la ingeniería y el análisis de datos. Este libro presenta a los lectores las herramientas y técnicas fundamentales necesarias para manipular, procesar y analizar grandes conjuntos de datos de forma eficaz utilizando las bibliotecas más potentes de Python. Está diseñado para brindar a los profesionales una base sólida, cerrando la brecha entre el conocimiento teórico y la aplicación práctica en entornos del mundo real.

Mejora tus habilidades de programación

Lo Que Obtendrás de Este Libro

10 capítulos que abarcan más de 590 páginas

Más de 210 bloques explicativos de código

Más de 50 ejercicios prácticos

3 cuestionarios para poner a prueba tus conocimientos

2 proyectos prácticos del «mundo real»

Acerca de este libro

Dominar los pandas para la manipulación de datos

Pandas es una herramienta indispensable para la manipulación y el análisis de datos, y dominarla es esencial para cualquier aspirante a profesional de datos. «Data Engineering Foundations» ofrece una exploración en profundidad de Pandas, desde estructuras de datos básicas como series y DataFrames hasta operaciones de datos más complejas, esenciales para el análisis en tiempo real.

Esta sección cubre técnicas cruciales como la indexación de datos, el manejo de los datos faltantes, la fusión y la concatenación de conjuntos de datos y la rotación de tablas para una mejor agregación de datos. También profundiza en el análisis de series temporales y muestra cómo se pueden utilizar los Pandas para tratar los datos cronológicos de forma eficaz, algo esencial para sectores como el financiero y el logístico.

Más allá de la funcionalidad, el libro proporciona información sobre cómo optimizar el rendimiento cuando se trabaja con grandes conjuntos de datos, lo que garantiza que los lectores sepan cómo gestionar los datos de manera eficiente en Pandas. Los ejercicios prácticos y los ejemplos del mundo real que aparecen a lo largo del capítulo refuerzan el aprendizaje y demuestran la aplicación de cada técnica en una variedad de contextos empresariales.

Computación numérica con NumPy

NumPy es la base de la computación numérica en Python, y este libro garantiza que comprenda cómo aprovechar todo su potencial. «Fundamentos de la ingeniería de datos» explica los aspectos fundamentales de NumPy, incluida la creación de matrices, las operaciones matemáticas y el manejo de datos multidimensionales para cálculos complejos.

Obtenga información sobre la vectorización para la optimización del rendimiento, la transmisión para operaciones aritméticas eficientes y el uso de funciones universales para el procesamiento de matrices. En esta sección también se presentan las técnicas de análisis estadístico y álgebra lineal, que son fundamentales para el aprendizaje automático y la computación científica.

Con estudios de casos detallados y guías paso a paso, aprenderá no solo a realizar tareas numéricas, sino también a optimizar sus flujos de trabajo para obtener un mejor rendimiento y precisión. Este conocimiento es vital para cualquier profesional que trabaje con grandes cantidades y variedades de datos numéricos.

«Data Engineering Foundations» va más allá del ámbito de Pandas y NumPy, y ofrece una exploración en profundidad de Scikit-Learn para aplicaciones de aprendizaje automático. Esta completa sección del libro profundiza en las complejidades de las técnicas de preprocesamiento de datos y guía a los lectores a través del complejo proceso de selección y transformación de las funciones. Proporciona un examen exhaustivo de la diversa gama de algoritmos de Scikit-Learn, y proporciona a los lectores las herramientas necesarias para construir modelos predictivos sólidos.

El libro cierra meticulosamente la brecha entre la manipulación de datos, la computación numérica y el aprendizaje automático, y presenta una integración perfecta de estos componentes cruciales. De este modo, ofrece a los lectores una perspectiva panorámica del panorama de la ciencia y la ingeniería de datos, y aclara las interconexiones entre las diversas facetas del campo.

Este enfoque holístico permite a los lectores desarrollar una comprensión matizada de cómo los diferentes elementos de la ingeniería y el análisis de datos se unen para formar un todo coherente, lo que mejora su capacidad para abordar los desafíos complejos de datos del mundo real con confianza y experiencia.

Los datos son la base de la inteligencia artificial, el análisis y la toma de decisiones modernos, y las empresas confían cada vez más en canalizaciones de datos bien estructuradas para impulsar la información y la automatización. Data Engineering Foundations ofrece una introducción completa a la ingeniería de datos, que abarca herramientas esenciales como Pandas, NumPy y Scikit-Learn. Con el auge de los macrodatos, la computación en la nube y la analítica en tiempo real, dominar las habilidades de ingeniería de datos es crucial para crear aplicaciones basadas en datos escalables y eficientes.
Este libro le enseña cómo recopilar, procesar y transformar datos de manera eficiente para el análisis y el aprendizaje automático. Aprenderá a gestionar grandes conjuntos de datos, optimizar los flujos de trabajo de datos y aplicar técnicas de ingeniería de funciones para mejorar el rendimiento de los modelos. A través de ejercicios prácticos y proyectos del mundo real, adquirirá las habilidades necesarias para crear canalizaciones de datos sólidas y preparar conjuntos de datos de alta calidad para aplicaciones de inteligencia empresarial e inteligencia empresarial, lo que lo convertirá en un programador más capaz y versátil.
A diferencia de los libros de programación general, este libro se centra específicamente en los fundamentos de la ingeniería de datos, cerrando la brecha entre el desarrollo de software y la ciencia de datos. Proporciona un enfoque práctico para trabajar con datos estructurados y no estructurados, y ofrece una guía práctica sobre la limpieza, la transformación y la extracción de funciones de los datos. Los casos de uso reales y los tutoriales paso a paso garantizan que comprenda los conceptos y cómo aplicarlos de manera eficaz en los entornos de producción.
Se recomienda un conocimiento básico de Python, pero no se requiere experiencia previa en ingeniería de datos. El libro comienza con los conceptos básicos y se desarrolla gradualmente hasta incluir técnicas más avanzadas, por lo que es adecuado para principiantes y para aquellos que buscan fortalecer sus habilidades de procesamiento de datos e ingeniería de funciones.
Acceso al servicio de atención al cliente VIP de Cuantum Technologies, con un equipo dedicado de desarrolladores listos para responder a todas sus preguntas. Un repositorio de código con ejemplos completamente funcionales y código previamente probado y listo para producción. La plataforma de aprendizaje electrónico de Success University, donde puede acceder a recursos adicionales y contenido de vídeo gratuito para reforzar su aprendizaje. Actualizaciones periódicas y materiales adicionales para mantenerse al día con los nuevos avances en ingeniería de datos.

Tabla de contenido

Chapter 1: Introduction: Moving Beyond the Basics

1.1 Overview of Intermediate Data Analysis

1.2 How this Book Builds on Foundations

1.3 Tools: Pandas, NumPy, Scikit-learn in Action

1.4 Practical Exercises for Chapter 1: Introduction: Moving Beyond the Basics

1.5 What Could Go Wrong?

Chapter 2: Optimizing Data Workflows

2.1 Advanced Data Manipulation with Pandas

2.2 Enhancing Performance with NumPy Arrays

2.3 Combining Tools for Efficient Analysis

2.4 Practical Exercises for Chapter 2: Optimizing Data Workflows

2.5 What Could Go Wrong?

Quiz Part 1: Setting the Stage for Advanced Analysis

Questions

Answers

Project 1: House Price Prediction with Feature Engineering

1. Feature Exploration and Cleaning

2. Feature Engineering for House Price Prediction

3. Building and Evaluating the Predictive Model

4. Finalizing the House Price Prediction Project

Conclusion

Chapter 3: The Role of Feature Engineering in Machine Learning

3.1 Why Feature Engineering Matters

3.2 Examples of Impactful Feature Engineering

3.3 Practical Exercises for Chapter 3

3.4 What Could Go Wrong?

3.5 Chapter 3 Summary

Chapter 4: Techniques for Handling Missing Data

4.1 Advanced Imputation Techniques

4.2 Dealing with Missing Data in Large Datasets

4.3 Practical Exercises for Chapter 4

4.4 What Could Go Wrong?

4.5 Chapter 4 Summary

Chapter 5: Transforming and Scaling Features

5.1 Scaling and Normalization: Best Practices

5.2 Log, Square Root, and Other Non-linear Transformations

5.3 Practical Exercises for Chapter 5

5.4 What Could Go Wrong?

5.5 Chapter 5 Summary

Chapter 6: Encoding Categorical Variables

6.1 One-Hot Encoding Revisited: Tips and Tricks

6.2 Advanced Encoding Methods: Target, Frequency, and Ordinal Encoding

6.3 Practical Exercises for Chapter 6

6.4 What Could Go Wrong?

6.5 Chapter 6 Summary

Chapter 7: Feature Creation & Interaction Terms

7.1 Creating New Features from Existing Data

7.2 Feature Interactions: Polynomial, Cross-features, and More

7.3 Practical Exercises for Chapter 7

7.4 What Could Go Wrong?

7.5 Chapter 7 Summary

Quiz Part 2: Feature Engineering for Powerful Models

Questions

Answers

Project 2: Time Series Forecasting with Feature Engineering

1.1 Introduction to Time Series Forecasting with Feature Engineering

1.2 Rolling Window Features for Capturing Trends and Seasonality

1.3 Detrending and Dealing with Seasonality in Time Series

1.4 Applying Machine Learning Models for Time Series Forecasting

1.5 Hyperparameter Tuning for Time Series Models

Chapter 8: Advanced Data Cleaning Techniques

8.1 Identifying Outliers and Handling Extreme Values

8.2 Correcting Data Anomalies with Pandas

8.3 Practical Exercises for Chapter 8

8.4 What Could Go Wrong?

8.5 Chapter 8 Summary

Chapter 9: Time Series Data: Special Considerations

9.1 Working with Date/Time Features

9.2 Creating Lagged and Rolling Features

9.3 Practical Exercises for Chapter 9

9.4 What Could Go Wrong?

9.5 Chapter 9 Summary

Chapter 10: Dimensionality Reduction

10.1 Principal Component Analysis (PCA)

10.2 Feature Selection Techniques

10.3 Practical Exercises for Chapter 10

10.4 What Could Go Wrong?

10.5 Chapter 10 Summary

Quiz Part 3: Data Cleaning and Preprocessing

Questions

Answers

Reseñas

Lo que dicen nuestros lectores sobre este libro

¡Explore las reseñas para comprender por qué este libro es una excelente elección! Descubra cómo otros se han beneficiado del conocimiento y las ideas que proporciona. Pruebe el emocionante contenido que le espera y compruebe si este libro es el libro perfecto para su viaje.

Recomendado por decenas de personas
Reseña de Amazon

Claudia

El libro desglosa las técnicas complejas de manipulación y análisis de datos en segmentos digeribles y fáciles de entender. Los capítulos sobre Pandas y NumPy son particularmente esclarecedores, ya que ofrecen un tesoro de información sobre la indexación de datos, el manejo de los datos faltantes y la optimización del rendimiento, información que rara vez se aborda con tanta profundidad en otros textos. Los ejemplos del mundo real que se proporcionan son directamente aplicables a los desafíos a los que me enfrento a diario, lo que lo convierte en un recurso inestimable.

Reseña de Amazon

Leonard

Lo que distingue a este libro es su enfoque práctico: cada capítulo está repleto de ejemplos y ejercicios que cierran la brecha entre la teoría y la práctica. Desde manipular marcos de datos en Pandas hasta realizar cálculos numéricos complejos con NumPy y, finalmente, crear modelos predictivos con Scikit-Learn, este libro lo tiene todo. Está escrito de manera que tanto los principiantes como los profesionales experimentados puedan beneficiarse de él, haciendo que los conceptos complejos sean accesibles para todos. Este libro no solo ha aumentado mi confianza en el análisis de datos, sino que también ha enriquecido mi trabajo diario al mejorar la calidad y la eficiencia de mis resultados.

Comience su viaje de aprendizaje hoy

Desbloquear el acceso

Es su elección, libro de tapa blanda, libro electrónico o Pase de acceso completo a toda nuestra biblioteca de programación

Libro de tapa blanda en Amazon
49,90$
Cómpralo en Amazon
  • Libro de tapa blanda enviado desde Amazon
  • Acceso gratuito al repositorio de código
  • Atención al cliente de primera calidad
Acceso al libro
24,90$
  • Plataforma digital de aprendizaje electrónico
  • Contenido de vídeo adicional gratuito
  • Rentable
  • Atención al cliente de primera calidad
  • Recursos de código fáciles de copiar y pegar
  • Aprenda en cualquier lugar
Acceso ilimitado a toda la biblioteca
8,25$/mes
Conozca más
  • Todo, desde Book Access
  • Acceso ilimitado a la biblioteca de libros
  • 50% de descuento en libros de bolsillo
  • Acceso anticipado a nuevos lanzamientos
  • Contenido de vídeo exclusivo
  • Recomendaciones de libros mensuales
  • Actualizaciones de libros ilimitadas
  • Atención al cliente VIP 24/7
  • Desafíos de programación
Preguntas frecuentes

Encuentre respuestas a preguntas frecuentes sobre los formatos de libros, las opciones de compra y los detalles de la suscripción.

Nuestro plan de suscripción ofrece acceso ilimitado a toda nuestra biblioteca de libros de programación durante un año. Es una forma rentable de mejorar tu proceso de aprendizaje.
Para comprar libros, simplemente navegue por nuestra colección, seleccione los que desee y proceda al pago. Ofrecemos varias opciones de pago para su comodidad.
Nuestros libros están disponibles en formato digital e impreso. Puede elegir el formato que se adapte a sus preferencias y estilo de lectura.
Una vez que hayas comprado un libro, podrás acceder a él a través del panel de control de tu cuenta. Desde allí, puedes descargar la versión digital o ver tu historial de pedidos.
Para cancelar su suscripción fácilmente en su panel de control. Si necesita ayuda, póngase en contacto con nuestro equipo de soporte. Le ayudarán con el proceso de cancelación y con cualquier consulta relacionada.

Este libro forma parte de nuestra

Ingeniería de IA

Ruta de aprendizaje

Más libros sobre esta Ruta de aprendizaje

Machine Learning Héroe

Ver este libro

Natural Language Processing con Python Edición Actualizada

Ver este libro

Generative Deep Learning Edición Actualizada

Ver este libro

Fundamentos del Análisis de Datos con Python

Ver este libro
Cookie Consent

By clicking “Accept”, you agree to the storing of cookies on your device to enhance site navigation, analyze site usage, and assist in our marketing efforts. View our Privacy Policy for more information.