Click here to view the next lesson.

Proyecto 2: Resumen de Texto con T5

Paso 4: Ajuste de Hiperparámetros

La experimentación con hiperparámetros es crucial para optimizar los resultados de la resumición. Estos parámetros te permiten controlar con precisión varios aspectos del proceso de generación de resúmenes:

max_length y min_length: Estos parámetros definen los límites de la longitud de tu resumen. max_length establece un límite superior en el número de tokens en la salida, evitando resúmenes excesivamente verbosos, mientras que min_length asegura que el resumen contenga suficiente información para ser significativo. Por ejemplo, establecer max_length=100 y min_length=30 generaría resúmenes de entre 30 y 100 tokens de longitud.
num_beams: Este parámetro controla el algoritmo de búsqueda por haces, que explora múltiples secuencias posibles durante la generación de texto. Un número mayor de haces (por ejemplo, 4 o 6) permite al modelo considerar más frases alternativas y potencialmente producir mejores resúmenes, aunque aumenta el tiempo de cómputo. Por ejemplo, num_beams=4 significa que el modelo mantiene 4 diferentes versiones posibles del resumen en cada paso antes de seleccionar la mejor.
length_penalty: Este sofisticado parámetro influye en la preferencia del modelo por resúmenes más cortos o más largos. Valores mayores a 1.0 fomentan resúmenes más largos, mientras que valores menores a 1.0 favorecen los más cortos. Por ejemplo, establecer length_penalty=2.0 hará que el modelo sea más propenso a generar resúmenes detallados, mientras que length_penalty=0.5 producirá resúmenes más concisos.

Ejemplo con hiperparámetros personalizados:

# Generate a concise summary
summary_ids = model.generate(
    inputs.input_ids,
    max_length=30,
    min_length=10,
    length_penalty=1.5,
    num_beams=6,
    early_stopping=True
)
concise_summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)
print("Concise Summary:")
print(concise_summary)

Permíteme desglosar este ejemplo de código:

Llamada a la Función Principal:

El código utiliza model.generate() para crear un resumen con parámetros específicos

Parámetros Clave:

max_length=30: Establece la longitud máxima del resumen generado a 30 tokens
min_length=10: Asegura que el resumen no sea más corto de 10 tokens
length_penalty=1.5: Un valor superior a 1.0 que favorece ligeramente resúmenes más largos
num_beams=6: Utiliza búsqueda por haces con 6 caminos diferentes, lo que ayuda a producir resúmenes de mejor calidad al explorar más posibilidades
early_stopping=True: Permite que la generación se detenga cuando todas las hipótesis de haces alcancen el token de fin de secuencia

Procesamiento de Salida:

El resumen generado se decodifica a texto legible usando tokenizer.decode()
skip_special_tokens=True garantiza que los tokens específicos del modelo se eliminen de la salida final

Esta configuración está específicamente diseñada para generar resúmenes concisos pero informativos, equilibrando brevedad y calidad de contenido.

Paso 4: Ajuste de Hiperparámetros

max_length y min_length: Estos parámetros definen los límites de la longitud de tu resumen. max_length establece un límite superior en el número de tokens en la salida, evitando resúmenes excesivamente verbosos, mientras que min_length asegura que el resumen contenga suficiente información para ser significativo. Por ejemplo, establecer max_length=100 y min_length=30 generaría resúmenes de entre 30 y 100 tokens de longitud.
num_beams: Este parámetro controla el algoritmo de búsqueda por haces, que explora múltiples secuencias posibles durante la generación de texto. Un número mayor de haces (por ejemplo, 4 o 6) permite al modelo considerar más frases alternativas y potencialmente producir mejores resúmenes, aunque aumenta el tiempo de cómputo. Por ejemplo, num_beams=4 significa que el modelo mantiene 4 diferentes versiones posibles del resumen en cada paso antes de seleccionar la mejor.
length_penalty: Este sofisticado parámetro influye en la preferencia del modelo por resúmenes más cortos o más largos. Valores mayores a 1.0 fomentan resúmenes más largos, mientras que valores menores a 1.0 favorecen los más cortos. Por ejemplo, establecer length_penalty=2.0 hará que el modelo sea más propenso a generar resúmenes detallados, mientras que length_penalty=0.5 producirá resúmenes más concisos.

Ejemplo con hiperparámetros personalizados:

# Generate a concise summary
summary_ids = model.generate(
    inputs.input_ids,
    max_length=30,
    min_length=10,
    length_penalty=1.5,
    num_beams=6,
    early_stopping=True
)
concise_summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)
print("Concise Summary:")
print(concise_summary)

Permíteme desglosar este ejemplo de código:

Llamada a la Función Principal:

El código utiliza model.generate() para crear un resumen con parámetros específicos

Parámetros Clave:

max_length=30: Establece la longitud máxima del resumen generado a 30 tokens
min_length=10: Asegura que el resumen no sea más corto de 10 tokens
length_penalty=1.5: Un valor superior a 1.0 que favorece ligeramente resúmenes más largos
num_beams=6: Utiliza búsqueda por haces con 6 caminos diferentes, lo que ayuda a producir resúmenes de mejor calidad al explorar más posibilidades
early_stopping=True: Permite que la generación se detenga cuando todas las hipótesis de haces alcancen el token de fin de secuencia

Procesamiento de Salida:

El resumen generado se decodifica a texto legible usando tokenizer.decode()
skip_special_tokens=True garantiza que los tokens específicos del modelo se eliminen de la salida final

Esta configuración está específicamente diseñada para generar resúmenes concisos pero informativos, equilibrando brevedad y calidad de contenido.

Paso 4: Ajuste de Hiperparámetros

max_length y min_length: Estos parámetros definen los límites de la longitud de tu resumen. max_length establece un límite superior en el número de tokens en la salida, evitando resúmenes excesivamente verbosos, mientras que min_length asegura que el resumen contenga suficiente información para ser significativo. Por ejemplo, establecer max_length=100 y min_length=30 generaría resúmenes de entre 30 y 100 tokens de longitud.
num_beams: Este parámetro controla el algoritmo de búsqueda por haces, que explora múltiples secuencias posibles durante la generación de texto. Un número mayor de haces (por ejemplo, 4 o 6) permite al modelo considerar más frases alternativas y potencialmente producir mejores resúmenes, aunque aumenta el tiempo de cómputo. Por ejemplo, num_beams=4 significa que el modelo mantiene 4 diferentes versiones posibles del resumen en cada paso antes de seleccionar la mejor.
length_penalty: Este sofisticado parámetro influye en la preferencia del modelo por resúmenes más cortos o más largos. Valores mayores a 1.0 fomentan resúmenes más largos, mientras que valores menores a 1.0 favorecen los más cortos. Por ejemplo, establecer length_penalty=2.0 hará que el modelo sea más propenso a generar resúmenes detallados, mientras que length_penalty=0.5 producirá resúmenes más concisos.

Ejemplo con hiperparámetros personalizados:

# Generate a concise summary
summary_ids = model.generate(
    inputs.input_ids,
    max_length=30,
    min_length=10,
    length_penalty=1.5,
    num_beams=6,
    early_stopping=True
)
concise_summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)
print("Concise Summary:")
print(concise_summary)

Permíteme desglosar este ejemplo de código:

Llamada a la Función Principal:

El código utiliza model.generate() para crear un resumen con parámetros específicos

Parámetros Clave:

max_length=30: Establece la longitud máxima del resumen generado a 30 tokens
min_length=10: Asegura que el resumen no sea más corto de 10 tokens
length_penalty=1.5: Un valor superior a 1.0 que favorece ligeramente resúmenes más largos
num_beams=6: Utiliza búsqueda por haces con 6 caminos diferentes, lo que ayuda a producir resúmenes de mejor calidad al explorar más posibilidades
early_stopping=True: Permite que la generación se detenga cuando todas las hipótesis de haces alcancen el token de fin de secuencia

Procesamiento de Salida:

El resumen generado se decodifica a texto legible usando tokenizer.decode()
skip_special_tokens=True garantiza que los tokens específicos del modelo se eliminen de la salida final

Esta configuración está específicamente diseñada para generar resúmenes concisos pero informativos, equilibrando brevedad y calidad de contenido.

Paso 4: Ajuste de Hiperparámetros

max_length y min_length: Estos parámetros definen los límites de la longitud de tu resumen. max_length establece un límite superior en el número de tokens en la salida, evitando resúmenes excesivamente verbosos, mientras que min_length asegura que el resumen contenga suficiente información para ser significativo. Por ejemplo, establecer max_length=100 y min_length=30 generaría resúmenes de entre 30 y 100 tokens de longitud.
num_beams: Este parámetro controla el algoritmo de búsqueda por haces, que explora múltiples secuencias posibles durante la generación de texto. Un número mayor de haces (por ejemplo, 4 o 6) permite al modelo considerar más frases alternativas y potencialmente producir mejores resúmenes, aunque aumenta el tiempo de cómputo. Por ejemplo, num_beams=4 significa que el modelo mantiene 4 diferentes versiones posibles del resumen en cada paso antes de seleccionar la mejor.
length_penalty: Este sofisticado parámetro influye en la preferencia del modelo por resúmenes más cortos o más largos. Valores mayores a 1.0 fomentan resúmenes más largos, mientras que valores menores a 1.0 favorecen los más cortos. Por ejemplo, establecer length_penalty=2.0 hará que el modelo sea más propenso a generar resúmenes detallados, mientras que length_penalty=0.5 producirá resúmenes más concisos.

Ejemplo con hiperparámetros personalizados:

# Generate a concise summary
summary_ids = model.generate(
    inputs.input_ids,
    max_length=30,
    min_length=10,
    length_penalty=1.5,
    num_beams=6,
    early_stopping=True
)
concise_summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)
print("Concise Summary:")
print(concise_summary)

Permíteme desglosar este ejemplo de código:

Llamada a la Función Principal:

El código utiliza model.generate() para crear un resumen con parámetros específicos

Parámetros Clave:

max_length=30: Establece la longitud máxima del resumen generado a 30 tokens
min_length=10: Asegura que el resumen no sea más corto de 10 tokens
length_penalty=1.5: Un valor superior a 1.0 que favorece ligeramente resúmenes más largos
num_beams=6: Utiliza búsqueda por haces con 6 caminos diferentes, lo que ayuda a producir resúmenes de mejor calidad al explorar más posibilidades
early_stopping=True: Permite que la generación se detenga cuando todas las hipótesis de haces alcancen el token de fin de secuencia

Procesamiento de Salida:

El resumen generado se decodifica a texto legible usando tokenizer.decode()
skip_special_tokens=True garantiza que los tokens específicos del modelo se eliminen de la salida final

Esta configuración está específicamente diseñada para generar resúmenes concisos pero informativos, equilibrando brevedad y calidad de contenido.

Compra este libro