6.3 Generar Nuevos Dígitos Escritos a Mano

Con nuestro modelo de Autoencoder Variacional (VAE) entrenado, ahora podemos usarlo para generar nuevos dígitos escritos a mano. Esta sección te guiará a través del proceso de muestreo desde el espacio latente y el uso del decodificador para generar nuevas imágenes. También discutiremos cómo visualizar estos dígitos generados e interpretar los resultados.

6.3.1 Muestreo desde el Espacio Latente

El espacio latente es un espacio de menor dimensión donde el VAE codifica los datos de entrada. Para generar nuevas imágenes, necesitamos muestrear puntos desde este espacio latente y pasarlos a través del decodificador para producir imágenes.

Dado que las variables latentes se modelan como distribuciones gaussianas, podemos muestrear desde una distribución normal estándar para generar nuevas variables latentes.

Ejemplo: Muestreo y Generación de Imágenes

import numpy as np
import matplotlib.pyplot as plt

# Function to generate new images from the latent space
def generate_images(decoder, latent_dim, n_samples=10):
    # Sample random latent vectors from a standard normal distribution
    random_latent_vectors = np.random.normal(size=(n_samples, latent_dim))
    # Generate images by decoding the latent vectors
    generated_images = decoder.predict(random_latent_vectors)
    # Reshape the generated images for visualization
    generated_images = generated_images.reshape((n_samples, 28, 28))

    # Plot the generated images
    plt.figure(figsize=(10, 2))
    for i in range(n_samples):
        plt.subplot(1, n_samples, i + 1)
        plt.imshow(generated_images[i], cmap='gray')
        plt.axis('off')
    plt.show()

# Generate and visualize new images
generate_images(decoder, latent_dim)

La función 'generate_images' toma como entrada un decodificador, la dimensión del espacio latente y el número de muestras a generar. Primero, muestrea vectores latentes aleatorios de una distribución normal estándar. Estos vectores se pasan al decodificador para generar nuevas imágenes. Las imágenes generadas se remodelan para visualizarlas y luego se trazan usando matplotlib.

6.3.2 Visualización del Espacio Latente

Visualizar el espacio latente puede proporcionar información sobre cómo el VAE ha aprendido a representar los datos. Al interpolar entre puntos en el espacio latente, podemos observar cómo cambian suavemente las imágenes generadas, lo que indica que el VAE ha aprendido una representación significativa de los datos.

Ejemplo: Interpolación en el Espacio Latente

# Function to perform latent space interpolation
def interpolate_latent_space(decoder, latent_dim, n_interpolations=10):
    # Sample two random latent vectors from a standard normal distribution
    start_point = np.random.normal(size=(1, latent_dim))
    end_point = np.random.normal(size=(1, latent_dim))
    # Linearly interpolate between the two points
    interpolation = np.linspace(start_point, end_point, n_interpolations)

    # Generate images by decoding the interpolated latent vectors
    generated_images = decoder.predict(interpolation)
    generated_images = generated_images.reshape((n_interpolations, 28, 28))

    # Plot the interpolated images
    plt.figure(figsize=(15, 2))
    for i in range(n_interpolations):
        plt.subplot(1, n_interpolations, i + 1)
        plt.imshow(generated_images[i], cmap='gray')
        plt.axis('off')
    plt.show()

# Interpolate and visualize the latent space
interpolate_latent_space(decoder, latent_dim)

El código de ejemplo define una función llamada interpolate_latent_space, que realiza una interpolación en el espacio latente.

La función funciona de la siguiente manera:

Muestra dos vectores aleatorios de una distribución normal estándar. Estos vectores representan puntos en el espacio latente (el punto de inicio y el punto final).
Luego, genera una serie de puntos entre estos dos puntos utilizando interpolación lineal. El número de puntos está definido por n_interpolations.
La función usa un decoder (una parte del modelo que transforma puntos en el espacio latente en puntos de datos) para generar nuevas imágenes a partir de estos puntos interpolados.
Estas imágenes se remodelan y se trazan para su visualización. Las imágenes representan la transformación gradual desde la representación de datos del punto de inicio hasta la del punto final en el espacio latente.

Finalmente, se llama a la función interpolate_latent_space con decoder y latent_dim como argumentos para realizar y visualizar la interpolación en el espacio latente.

6.3.3 Generación de Dígitos con Características Específicas

Al explorar diferentes regiones del espacio latente, podemos generar dígitos con características específicas. Por ejemplo, podríamos descubrir que ciertas áreas del espacio latente corresponden a dígitos con formas o trazos específicos. Esto puede ser útil para aplicaciones donde se necesiten tipos específicos de dígitos.

Ejemplo: Exploración de Características Latentes Específicas

# Function to explore specific latent features
def explore_latent_features(decoder, latent_dim, feature_vector, variation_range=(-3, 3), n_variations=10):
    # Create a set of latent vectors varying one feature
    feature_variations = np.linspace(variation_range[0], variation_range[1], n_variations)
    latent_vectors = np.zeros((n_variations, latent_dim))
    for i, variation in enumerate(feature_variations):
        latent_vectors[i] = feature_vector
        latent_vectors[i, 0] = variation  # Vary the first feature for demonstration

    # Generate images by decoding the latent vectors
    generated_images = decoder.predict(latent_vectors)
    generated_images = generated_images.reshape((n_variations, 28, 28))

    # Plot the generated images
    plt.figure(figsize=(15, 2))
    for i in range(n_variations):
        plt.subplot(1, n_variations, i + 1)
        plt.imshow(generated_images[i], cmap='gray')
        plt.axis('off')
    plt.show()

# Example feature vector
example_feature_vector = np.random.normal(size=(latent_dim,))

# Explore specific latent features
explore_latent_features(decoder, latent_dim, example_feature_vector)

Este código define una función llamada explore_latent_features. Esta función está diseñada para examinar características latentes específicas en el decodificador de una red neuronal.

La función toma como parámetros un decodificador, la dimensión del espacio latente, un vector de características y dos parámetros opcionales que definen el rango de variación y el número de variaciones.

Funciona creando un conjunto de vectores latentes que varían una característica a lo largo de un rango especificado por el usuario. Estos vectores latentes se pasan a través del decodificador para generar imágenes.

Las imágenes generadas se remodelan y se trazan para visualizar cómo la variación de la característica latente específica afecta el resultado. Luego, se llama a la función con un vector de características de ejemplo para demostrar su uso.

6.3.4 Generación de Dígitos Diversos

Para generar un conjunto diverso de dígitos, podemos muestrear múltiples puntos del espacio latente. Al asegurarnos de que el espacio latente esté bien estructurado y sea diverso, podemos generar una amplia variedad de dígitos que se asemejen a los datos de entrenamiento.

Ejemplo: Generación de un Conjunto Diverso de Dígitos

# Function to generate a diverse set of digits
def generate_diverse_digits(decoder, latent_dim, n_samples=100):
    # Sample random latent vectors from a standard normal distribution
    random_latent_vectors = np.random.normal(size=(n_samples, latent_dim))
    # Generate images by decoding the latent vectors
    generated_images = decoder.predict(random_latent_vectors)
    generated_images = generated_images.reshape((n_samples, 28, 28))

    # Plot a subset of the generated images
    n_display = 10
    plt.figure(figsize=(10, 2))
    for i in range(n_display):
        plt.subplot(1, n_display, i + 1)
        plt.imshow(generated_images[i], cmap='gray')
        plt.axis('off')
    plt.show()

# Generate and visualize a diverse set of digits
generate_diverse_digits(decoder, latent_dim)

Este script define y llama a una función llamada "generate_diverse_digits". El propósito de esta función es generar un conjunto diverso de imágenes de dígitos utilizando un modelo decodificador y una dimensión latente.

La función trabaja de la siguiente manera:

Muestra vectores latentes aleatorios de una distribución normal estándar. El número de muestras está determinado por el parámetro n_samples, y la dimensionalidad de cada vector está determinada por latent_dim.
Utiliza el modelo decodificador para generar imágenes a partir de los vectores latentes aleatorios. Las imágenes generadas se remodelan en una cuadrícula 2D de imágenes de 28x28 píxeles.
Dibuja un subconjunto de las imágenes generadas. El número de imágenes a mostrar está determinado por n_display. Para cada imagen generada, crea una subtrama, muestra la imagen en escala de grises y elimina el eje.

Finalmente, la función se llama con el modelo decodificador y la dimensión latente para generar y visualizar un conjunto diverso de dígitos.

Resumen

En esta sección, exploramos el proceso de generar nuevos dígitos manuscritos utilizando un Autoencoder Variacional (VAE) entrenado. Discutimos cómo muestrear del espacio latente y usar el decodificador para generar imágenes. También demostramos cómo visualizar el espacio latente mediante interpolación y explorar características latentes específicas. Al generar conjuntos diversos de dígitos, destacamos la capacidad del VAE para producir una amplia variedad de imágenes realistas.

Estas técnicas proporcionan valiosos conocimientos sobre las capacidades de los VAEs y su potencial aplicación en modelos generativos.