Resumen del Capítulo 4

En el Capítulo 4, profundizamos en PyTorch, uno de los marcos más utilizados para el aprendizaje profundo. La flexibilidad de PyTorch y su gráfico de computación dinámica lo han convertido en un favorito entre investigadores y profesionales. A lo largo de este capítulo, exploramos los conceptos clave de PyTorch, incluido cómo construir, entrenar e implementar modelos.

Comenzamos con una introducción al gráfico de computación dinámica de PyTorch, una característica clave que lo diferencia de otros marcos como TensorFlow (antes de la versión 2.x). A diferencia de los gráficos estáticos, el gráfico de PyTorch se crea en tiempo real a medida que se realizan las operaciones, lo que permite una mayor flexibilidad en la depuración y el diseño de modelos. Este enfoque define-by-run facilita el manejo de modelos con arquitecturas dinámicas, como los utilizados en tareas de aprendizaje por refuerzo y basadas en secuencias.

Luego cubrimos cómo construir y entrenar redes neuronales utilizando torch.nn. Definimos una red neuronal simple y repasamos los componentes esenciales de cualquier modelo de PyTorch: la pasada hacia adelante, la función de pérdida y el optimizador. Aprendiste cómo implementar un ciclo de entrenamiento, donde el modelo procesa los datos de entrada, calcula gradientes y actualiza sus parámetros a través de la retropropagación. La flexibilidad de los optimizadores de PyTorch, como SGD y Adam, permite una fácil personalización del proceso de entrenamiento.

A continuación, exploramos el aprendizaje por transferencia y el fine-tuning utilizando modelos preentrenados disponibles en el módulo torchvision.models. El aprendizaje por transferencia es una técnica altamente efectiva para aprovechar modelos entrenados en grandes conjuntos de datos como ImageNet y adaptarlos a tus propias tareas. Demostramos cómo cargar un modelo ResNet-18 preentrenado, congelar sus capas para la extracción de características y ajustar las capas profundas para nuevas tareas. Este enfoque reduce significativamente el tiempo de entrenamiento y mejora el rendimiento, especialmente al trabajar con conjuntos de datos más pequeños.

En las secciones siguientes, examinamos cómo guardar y cargar modelos en PyTorch. PyTorch proporciona flexibilidad en la persistencia del modelo mediante el guardado del modelo completo o solo del state_dict (los parámetros aprendidos). También discutimos cómo guardar puntos de control del modelo durante el entrenamiento, lo que te permite reanudar el entrenamiento en caso de interrupciones.

Finalmente, cubrimos cómo implementar modelos PyTorch utilizando TorchServe, una herramienta poderosa que te permite servir modelos como API REST en entornos de producción. TorchServe facilita la exposición de modelos PyTorch para predicciones en tiempo real, manejar inferencia por lotes y escalar las implementaciones. También introdujimos cómo crear controladores personalizados para modelos que requieren pasos especiales de preprocesamiento o posprocesamiento antes de hacer predicciones.

En resumen, este capítulo proporcionó una comprensión completa de PyTorch, desde el entrenamiento y guardado de modelos hasta su implementación en aplicaciones del mundo real. Al dominar las funciones de PyTorch y aprovechar sus herramientas, puedes construir, entrenar e implementar modelos de aprendizaje profundo de manera eficiente tanto en investigación como en entornos de producción.