Click here to view the next lesson.

Parte I del cuestionario: Fundamentos del PLN

Preguntas

Capítulo 1: Introducción al PLN

¿Qué es el Procesamiento de Lenguaje Natural (PLN)?
a) Un campo de la inteligencia artificial enfocado en permitir que las máquinas entiendan e interpreten el lenguaje humano.
b) Un método para comprimir datos.
c) Un software para traducir idiomas.
d) Un lenguaje de programación.
¿Por qué es importante el PLN?
a) Ayuda a realizar cálculos matemáticos complejos.
b) Mejora la comunicación entre humanos y máquinas.
c) Simplifica la gestión de bases de datos.
d) Mejora el diseño gráfico.
¿Qué biblioteca de Python se usa comúnmente para tareas básicas de PLN como la tokenización y la eliminación de palabras vacías?
a) NumPy
b) Pandas
c) NLTK
d) Matplotlib

Capítulo 2: Procesamiento Básico de Texto

¿Qué es la tokenización en PLN?
a) Combinar múltiples palabras en un solo token.
b) Dividir el texto en unidades más pequeñas como palabras u oraciones.
c) Eliminar la puntuación del texto.
d) Codificar el texto en formato binario.
¿Cuál de las siguientes es una técnica utilizada para reducir las palabras a su forma base o raíz?
a) Tokenización
b) Eliminación de palabras vacías
c) Lematización
d) Vectorización
¿Qué son las palabras vacías (stop words)?
a) Palabras que se usan con frecuencia y a menudo se eliminan durante el preprocesamiento de texto.
b) Palabras que se usan rara vez en cualquier texto.
c) Palabras que son esenciales para el significado de una oración.
d) Palabras que aparecen al final de una oración.
¿Qué biblioteca de Python se puede usar para aplicar expresiones regulares en el procesamiento de texto?
a) re
b) numpy
c) pandas
d) matplotlib

Capítulo 3: Ingeniería de Características para el PLN

¿Qué significa TF-IDF?
a) Frecuencia de Términos - Frecuencia Inversa de Documentos
b) Frecuencia de Texto - Frecuencia Inversa de Datos
c) Frecuencia de Tokens - Frecuencia Indexada de Datos
d) Frecuencia de Términos - Frecuencia Indexada de Documentos
¿Qué modelo se basa en predecir palabras de contexto dado una palabra objetivo o en predecir una palabra objetivo dado palabras de contexto?
a) TF-IDF
b) Bolsa de Palabras
c) Word2Vec
d) BERT
¿Cuál es una ventaja clave de BERT sobre las incrustaciones de palabras tradicionales como Word2Vec y GloVe?
a) BERT es más sencillo de implementar.
b) BERT genera incrustaciones conscientes del contexto.
c) BERT se basa en recuentos de frecuencia.
d) BERT usa un modelo de menor tamaño.
¿Qué biblioteca se utiliza comúnmente para implementar incrustaciones BERT en Python?
- a) scikit-learn
- b) nltk
- c) transformers
- d) gensim

Aplicaciones Prácticas

¿Qué función de scikit-learn puedes usar para transformar datos de texto en una representación Bag of Words?
a) TfidfVectorizer
b) CountVectorizer
c) Word2Vec
d) BertTokenizer
¿Qué método de Gensim puedes usar para cargar incrustaciones GloVe preentrenadas?
a) gensim.load_glove()
b) api.load()
c) glove.load()
d) gensim.download_glove()
¿Cuál es el propósito principal de eliminar palabras vacías en el preprocesamiento de texto?
a) Aumentar la longitud de los datos de texto.
b) Eliminar palabras irrelevantes o menos informativas.
c) Convertir el texto a mayúsculas.
d) Añadir puntuación al texto.

Implementación de Código

¿Cuál de las siguientes es la forma correcta de inicializar un CountVectorizer en Python?
pythonCopiar código a) vectorizer = CountVectorizer(input='data') b) vectorizer = CountVectorizer() c) vectorizer = CountVectorizer(mode='text') d) vectorizer = CountVectorizer(transform=True)
¿Qué método se utiliza para obtener las palabras más similares a una palabra dada usando un modelo GloVe en Gensim?
a) model.get_similar()
b) model.similarity()
c) model.most_similar()
d) model.find_similar()

Comprensión Conceptual

¿Cuál es la principal diferencia entre las incrustaciones de palabras estáticas (como Word2Vec y GloVe) y las incrustaciones contextuales (como BERT)?
a) Las incrustaciones estáticas generan una sola representación para cada palabra, mientras que las incrustaciones contextuales generan diferentes representaciones basadas en el contexto.
b) Las incrustaciones estáticas siempre son más precisas.
c) Las incrustaciones contextuales usan más recursos computacionales que las incrustaciones estáticas.
d) Las incrustaciones contextuales ignoran el contexto de la palabra.

Comprensión Avanzada

En el contexto de BERT, ¿qué significa "bidireccional"?
a) BERT procesa texto solo de izquierda a derecha.
b) BERT procesa texto solo de derecha a izquierda.
c) BERT procesa texto en ambas direcciones, capturando el contexto de ambos lados de una palabra.
d) BERT procesa texto sin considerar la dirección.
¿Por qué es importante la afinación cuando se usan modelos BERT preentrenados para tareas específicas de PLN?
a) Reduce el tamaño del modelo.
b) Ajusta el modelo para que rinda mejor en tareas específicas entrenándolo en datos específicos de la tarea.
c) Simplifica la implementación.
d) Disminuye los requisitos computacionales.
¿Cuál es el principal beneficio de usar modelos preentrenados como BERT en PLN?
a) No requieren más entrenamiento.
b) Siempre son más pequeños en tamaño.
c) Ahorran tiempo y recursos al proporcionar un punto de partida sólido para tareas específicas.
d) Eliminan la necesidad de datos etiquetados.

Preguntas

Capítulo 1: Introducción al PLN

¿Qué es el Procesamiento de Lenguaje Natural (PLN)?
a) Un campo de la inteligencia artificial enfocado en permitir que las máquinas entiendan e interpreten el lenguaje humano.
b) Un método para comprimir datos.
c) Un software para traducir idiomas.
d) Un lenguaje de programación.
¿Por qué es importante el PLN?
a) Ayuda a realizar cálculos matemáticos complejos.
b) Mejora la comunicación entre humanos y máquinas.
c) Simplifica la gestión de bases de datos.
d) Mejora el diseño gráfico.
¿Qué biblioteca de Python se usa comúnmente para tareas básicas de PLN como la tokenización y la eliminación de palabras vacías?
a) NumPy
b) Pandas
c) NLTK
d) Matplotlib

Capítulo 2: Procesamiento Básico de Texto

¿Qué es la tokenización en PLN?
a) Combinar múltiples palabras en un solo token.
b) Dividir el texto en unidades más pequeñas como palabras u oraciones.
c) Eliminar la puntuación del texto.
d) Codificar el texto en formato binario.
¿Cuál de las siguientes es una técnica utilizada para reducir las palabras a su forma base o raíz?
a) Tokenización
b) Eliminación de palabras vacías
c) Lematización
d) Vectorización
¿Qué son las palabras vacías (stop words)?
a) Palabras que se usan con frecuencia y a menudo se eliminan durante el preprocesamiento de texto.
b) Palabras que se usan rara vez en cualquier texto.
c) Palabras que son esenciales para el significado de una oración.
d) Palabras que aparecen al final de una oración.
¿Qué biblioteca de Python se puede usar para aplicar expresiones regulares en el procesamiento de texto?
a) re
b) numpy
c) pandas
d) matplotlib

Capítulo 3: Ingeniería de Características para el PLN

¿Qué significa TF-IDF?
a) Frecuencia de Términos - Frecuencia Inversa de Documentos
b) Frecuencia de Texto - Frecuencia Inversa de Datos
c) Frecuencia de Tokens - Frecuencia Indexada de Datos
d) Frecuencia de Términos - Frecuencia Indexada de Documentos
¿Qué modelo se basa en predecir palabras de contexto dado una palabra objetivo o en predecir una palabra objetivo dado palabras de contexto?
a) TF-IDF
b) Bolsa de Palabras
c) Word2Vec
d) BERT
¿Cuál es una ventaja clave de BERT sobre las incrustaciones de palabras tradicionales como Word2Vec y GloVe?
a) BERT es más sencillo de implementar.
b) BERT genera incrustaciones conscientes del contexto.
c) BERT se basa en recuentos de frecuencia.
d) BERT usa un modelo de menor tamaño.
¿Qué biblioteca se utiliza comúnmente para implementar incrustaciones BERT en Python?
- a) scikit-learn
- b) nltk
- c) transformers
- d) gensim

Aplicaciones Prácticas

¿Qué función de scikit-learn puedes usar para transformar datos de texto en una representación Bag of Words?
a) TfidfVectorizer
b) CountVectorizer
c) Word2Vec
d) BertTokenizer
¿Qué método de Gensim puedes usar para cargar incrustaciones GloVe preentrenadas?
a) gensim.load_glove()
b) api.load()
c) glove.load()
d) gensim.download_glove()
¿Cuál es el propósito principal de eliminar palabras vacías en el preprocesamiento de texto?
a) Aumentar la longitud de los datos de texto.
b) Eliminar palabras irrelevantes o menos informativas.
c) Convertir el texto a mayúsculas.
d) Añadir puntuación al texto.

Implementación de Código

¿Cuál de las siguientes es la forma correcta de inicializar un CountVectorizer en Python?
pythonCopiar código a) vectorizer = CountVectorizer(input='data') b) vectorizer = CountVectorizer() c) vectorizer = CountVectorizer(mode='text') d) vectorizer = CountVectorizer(transform=True)
¿Qué método se utiliza para obtener las palabras más similares a una palabra dada usando un modelo GloVe en Gensim?
a) model.get_similar()
b) model.similarity()
c) model.most_similar()
d) model.find_similar()

Comprensión Conceptual

¿Cuál es la principal diferencia entre las incrustaciones de palabras estáticas (como Word2Vec y GloVe) y las incrustaciones contextuales (como BERT)?
a) Las incrustaciones estáticas generan una sola representación para cada palabra, mientras que las incrustaciones contextuales generan diferentes representaciones basadas en el contexto.
b) Las incrustaciones estáticas siempre son más precisas.
c) Las incrustaciones contextuales usan más recursos computacionales que las incrustaciones estáticas.
d) Las incrustaciones contextuales ignoran el contexto de la palabra.

Comprensión Avanzada

En el contexto de BERT, ¿qué significa "bidireccional"?
a) BERT procesa texto solo de izquierda a derecha.
b) BERT procesa texto solo de derecha a izquierda.
c) BERT procesa texto en ambas direcciones, capturando el contexto de ambos lados de una palabra.
d) BERT procesa texto sin considerar la dirección.
¿Por qué es importante la afinación cuando se usan modelos BERT preentrenados para tareas específicas de PLN?
a) Reduce el tamaño del modelo.
b) Ajusta el modelo para que rinda mejor en tareas específicas entrenándolo en datos específicos de la tarea.
c) Simplifica la implementación.
d) Disminuye los requisitos computacionales.
¿Cuál es el principal beneficio de usar modelos preentrenados como BERT en PLN?
a) No requieren más entrenamiento.
b) Siempre son más pequeños en tamaño.
c) Ahorran tiempo y recursos al proporcionar un punto de partida sólido para tareas específicas.
d) Eliminan la necesidad de datos etiquetados.

Preguntas

Capítulo 1: Introducción al PLN

¿Qué es el Procesamiento de Lenguaje Natural (PLN)?
a) Un campo de la inteligencia artificial enfocado en permitir que las máquinas entiendan e interpreten el lenguaje humano.
b) Un método para comprimir datos.
c) Un software para traducir idiomas.
d) Un lenguaje de programación.
¿Por qué es importante el PLN?
a) Ayuda a realizar cálculos matemáticos complejos.
b) Mejora la comunicación entre humanos y máquinas.
c) Simplifica la gestión de bases de datos.
d) Mejora el diseño gráfico.
¿Qué biblioteca de Python se usa comúnmente para tareas básicas de PLN como la tokenización y la eliminación de palabras vacías?
a) NumPy
b) Pandas
c) NLTK
d) Matplotlib

Capítulo 2: Procesamiento Básico de Texto

¿Qué es la tokenización en PLN?
a) Combinar múltiples palabras en un solo token.
b) Dividir el texto en unidades más pequeñas como palabras u oraciones.
c) Eliminar la puntuación del texto.
d) Codificar el texto en formato binario.
¿Cuál de las siguientes es una técnica utilizada para reducir las palabras a su forma base o raíz?
a) Tokenización
b) Eliminación de palabras vacías
c) Lematización
d) Vectorización
¿Qué son las palabras vacías (stop words)?
a) Palabras que se usan con frecuencia y a menudo se eliminan durante el preprocesamiento de texto.
b) Palabras que se usan rara vez en cualquier texto.
c) Palabras que son esenciales para el significado de una oración.
d) Palabras que aparecen al final de una oración.
¿Qué biblioteca de Python se puede usar para aplicar expresiones regulares en el procesamiento de texto?
a) re
b) numpy
c) pandas
d) matplotlib

Capítulo 3: Ingeniería de Características para el PLN

¿Qué significa TF-IDF?
a) Frecuencia de Términos - Frecuencia Inversa de Documentos
b) Frecuencia de Texto - Frecuencia Inversa de Datos
c) Frecuencia de Tokens - Frecuencia Indexada de Datos
d) Frecuencia de Términos - Frecuencia Indexada de Documentos
¿Qué modelo se basa en predecir palabras de contexto dado una palabra objetivo o en predecir una palabra objetivo dado palabras de contexto?
a) TF-IDF
b) Bolsa de Palabras
c) Word2Vec
d) BERT
¿Cuál es una ventaja clave de BERT sobre las incrustaciones de palabras tradicionales como Word2Vec y GloVe?
a) BERT es más sencillo de implementar.
b) BERT genera incrustaciones conscientes del contexto.
c) BERT se basa en recuentos de frecuencia.
d) BERT usa un modelo de menor tamaño.
¿Qué biblioteca se utiliza comúnmente para implementar incrustaciones BERT en Python?
- a) scikit-learn
- b) nltk
- c) transformers
- d) gensim

Aplicaciones Prácticas

¿Qué función de scikit-learn puedes usar para transformar datos de texto en una representación Bag of Words?
a) TfidfVectorizer
b) CountVectorizer
c) Word2Vec
d) BertTokenizer
¿Qué método de Gensim puedes usar para cargar incrustaciones GloVe preentrenadas?
a) gensim.load_glove()
b) api.load()
c) glove.load()
d) gensim.download_glove()
¿Cuál es el propósito principal de eliminar palabras vacías en el preprocesamiento de texto?
a) Aumentar la longitud de los datos de texto.
b) Eliminar palabras irrelevantes o menos informativas.
c) Convertir el texto a mayúsculas.
d) Añadir puntuación al texto.

Implementación de Código

¿Cuál de las siguientes es la forma correcta de inicializar un CountVectorizer en Python?
pythonCopiar código a) vectorizer = CountVectorizer(input='data') b) vectorizer = CountVectorizer() c) vectorizer = CountVectorizer(mode='text') d) vectorizer = CountVectorizer(transform=True)
¿Qué método se utiliza para obtener las palabras más similares a una palabra dada usando un modelo GloVe en Gensim?
a) model.get_similar()
b) model.similarity()
c) model.most_similar()
d) model.find_similar()

Comprensión Conceptual

¿Cuál es la principal diferencia entre las incrustaciones de palabras estáticas (como Word2Vec y GloVe) y las incrustaciones contextuales (como BERT)?
a) Las incrustaciones estáticas generan una sola representación para cada palabra, mientras que las incrustaciones contextuales generan diferentes representaciones basadas en el contexto.
b) Las incrustaciones estáticas siempre son más precisas.
c) Las incrustaciones contextuales usan más recursos computacionales que las incrustaciones estáticas.
d) Las incrustaciones contextuales ignoran el contexto de la palabra.

Comprensión Avanzada

En el contexto de BERT, ¿qué significa "bidireccional"?
a) BERT procesa texto solo de izquierda a derecha.
b) BERT procesa texto solo de derecha a izquierda.
c) BERT procesa texto en ambas direcciones, capturando el contexto de ambos lados de una palabra.
d) BERT procesa texto sin considerar la dirección.
¿Por qué es importante la afinación cuando se usan modelos BERT preentrenados para tareas específicas de PLN?
a) Reduce el tamaño del modelo.
b) Ajusta el modelo para que rinda mejor en tareas específicas entrenándolo en datos específicos de la tarea.
c) Simplifica la implementación.
d) Disminuye los requisitos computacionales.
¿Cuál es el principal beneficio de usar modelos preentrenados como BERT en PLN?
a) No requieren más entrenamiento.
b) Siempre son más pequeños en tamaño.
c) Ahorran tiempo y recursos al proporcionar un punto de partida sólido para tareas específicas.
d) Eliminan la necesidad de datos etiquetados.

Preguntas

Capítulo 1: Introducción al PLN

¿Qué es el Procesamiento de Lenguaje Natural (PLN)?
a) Un campo de la inteligencia artificial enfocado en permitir que las máquinas entiendan e interpreten el lenguaje humano.
b) Un método para comprimir datos.
c) Un software para traducir idiomas.
d) Un lenguaje de programación.
¿Por qué es importante el PLN?
a) Ayuda a realizar cálculos matemáticos complejos.
b) Mejora la comunicación entre humanos y máquinas.
c) Simplifica la gestión de bases de datos.
d) Mejora el diseño gráfico.
¿Qué biblioteca de Python se usa comúnmente para tareas básicas de PLN como la tokenización y la eliminación de palabras vacías?
a) NumPy
b) Pandas
c) NLTK
d) Matplotlib

Capítulo 2: Procesamiento Básico de Texto

¿Qué es la tokenización en PLN?
a) Combinar múltiples palabras en un solo token.
b) Dividir el texto en unidades más pequeñas como palabras u oraciones.
c) Eliminar la puntuación del texto.
d) Codificar el texto en formato binario.
¿Cuál de las siguientes es una técnica utilizada para reducir las palabras a su forma base o raíz?
a) Tokenización
b) Eliminación de palabras vacías
c) Lematización
d) Vectorización
¿Qué son las palabras vacías (stop words)?
a) Palabras que se usan con frecuencia y a menudo se eliminan durante el preprocesamiento de texto.
b) Palabras que se usan rara vez en cualquier texto.
c) Palabras que son esenciales para el significado de una oración.
d) Palabras que aparecen al final de una oración.
¿Qué biblioteca de Python se puede usar para aplicar expresiones regulares en el procesamiento de texto?
a) re
b) numpy
c) pandas
d) matplotlib

Capítulo 3: Ingeniería de Características para el PLN

¿Qué significa TF-IDF?
a) Frecuencia de Términos - Frecuencia Inversa de Documentos
b) Frecuencia de Texto - Frecuencia Inversa de Datos
c) Frecuencia de Tokens - Frecuencia Indexada de Datos
d) Frecuencia de Términos - Frecuencia Indexada de Documentos
¿Qué modelo se basa en predecir palabras de contexto dado una palabra objetivo o en predecir una palabra objetivo dado palabras de contexto?
a) TF-IDF
b) Bolsa de Palabras
c) Word2Vec
d) BERT
¿Cuál es una ventaja clave de BERT sobre las incrustaciones de palabras tradicionales como Word2Vec y GloVe?
a) BERT es más sencillo de implementar.
b) BERT genera incrustaciones conscientes del contexto.
c) BERT se basa en recuentos de frecuencia.
d) BERT usa un modelo de menor tamaño.
¿Qué biblioteca se utiliza comúnmente para implementar incrustaciones BERT en Python?
- a) scikit-learn
- b) nltk
- c) transformers
- d) gensim

Aplicaciones Prácticas

¿Qué función de scikit-learn puedes usar para transformar datos de texto en una representación Bag of Words?
a) TfidfVectorizer
b) CountVectorizer
c) Word2Vec
d) BertTokenizer
¿Qué método de Gensim puedes usar para cargar incrustaciones GloVe preentrenadas?
a) gensim.load_glove()
b) api.load()
c) glove.load()
d) gensim.download_glove()
¿Cuál es el propósito principal de eliminar palabras vacías en el preprocesamiento de texto?
a) Aumentar la longitud de los datos de texto.
b) Eliminar palabras irrelevantes o menos informativas.
c) Convertir el texto a mayúsculas.
d) Añadir puntuación al texto.

Implementación de Código

¿Cuál de las siguientes es la forma correcta de inicializar un CountVectorizer en Python?
pythonCopiar código a) vectorizer = CountVectorizer(input='data') b) vectorizer = CountVectorizer() c) vectorizer = CountVectorizer(mode='text') d) vectorizer = CountVectorizer(transform=True)
¿Qué método se utiliza para obtener las palabras más similares a una palabra dada usando un modelo GloVe en Gensim?
a) model.get_similar()
b) model.similarity()
c) model.most_similar()
d) model.find_similar()

Comprensión Conceptual

¿Cuál es la principal diferencia entre las incrustaciones de palabras estáticas (como Word2Vec y GloVe) y las incrustaciones contextuales (como BERT)?
a) Las incrustaciones estáticas generan una sola representación para cada palabra, mientras que las incrustaciones contextuales generan diferentes representaciones basadas en el contexto.
b) Las incrustaciones estáticas siempre son más precisas.
c) Las incrustaciones contextuales usan más recursos computacionales que las incrustaciones estáticas.
d) Las incrustaciones contextuales ignoran el contexto de la palabra.

Comprensión Avanzada

En el contexto de BERT, ¿qué significa "bidireccional"?
a) BERT procesa texto solo de izquierda a derecha.
b) BERT procesa texto solo de derecha a izquierda.
c) BERT procesa texto en ambas direcciones, capturando el contexto de ambos lados de una palabra.
d) BERT procesa texto sin considerar la dirección.
¿Por qué es importante la afinación cuando se usan modelos BERT preentrenados para tareas específicas de PLN?
a) Reduce el tamaño del modelo.
b) Ajusta el modelo para que rinda mejor en tareas específicas entrenándolo en datos específicos de la tarea.
c) Simplifica la implementación.
d) Disminuye los requisitos computacionales.
¿Cuál es el principal beneficio de usar modelos preentrenados como BERT en PLN?
a) No requieren más entrenamiento.
b) Siempre son más pequeños en tamaño.
c) Ahorran tiempo y recursos al proporcionar un punto de partida sólido para tareas específicas.
d) Eliminan la necesidad de datos etiquetados.

Compra este libro