GPT3

Ya está disponible el modelo de lenguaje GPT-3

Este 18 de noviembre de 2021 OpenAI ha abierto las puertas a todo el público de su modelo de lenguaje autorregresivo, GPT-3. Cuando hablamos de GPT-3 hablamos de un enorme modelo de inteligencia artificial (LLM – Large Languaje Model) capaz de generar lenguaje escrito a partir de una secuencia proporcionada. Este sistema se hizo muy popular cuando en el año 2020, OpenAI publicó sus resultados donde se mostraba el gran potencial y rendimiento que tenía este modelo para generar lenguaje natural (Probando GPT-3, Dot CSV).

GPT-3 es un modelo de lenguaje que principalmente ha sido entrenado con texto en inglés, pero esto no quita que su rendimiento sea mejor que en otros idiomas, ya que no se sabe si su capacidad de lenguaje trasciende al propio idioma, para luego comunicarse traduciendo en inglés. Hay que tener en cuenta que GPT3 no se basa en una realidad rigurosa. El texto generado solo busca que sea coherente en la forma, no en el fondo.

Desde el minuto cero, esta tecnología ha estado cerrada al público general, pero desde la semana pasada esto ha cambiado. Tras abrir el acceso de esta tecnología, cualquier persona puede utilizarla o incluso investigar cómo funciona. El acceso a GPT-3 es bastante sencillo, simplemente hay que registrarse en la (página web de OpenAI) y seleccionar el motivo por el cuál se quiere utilizar esta API. El uso de GPT3 no es gratuito, pero OpenAI proporciona un saldo inicial para todo usuario registrado que basta para estudiar el sistema.

En este punto, la forma más rápida de jugar con GPT-3 es a través del “Playground”, básicamente una ventana donde puedes escribir cualquier texto como input para que este modelo continúe con la generación.

A la derecha del “Playground” se pueden encontrar distintos parámetros para cambiar el comportamiento de GPT-3, como la temperatura (nos permite tener respuestas más creativas) o la longitud de la respuesta. De todos estos parámetros, el más importante es el “Engine”. GPT-3 no es una única inteligencia artificial, sino una familia de modelos con diferentes tamaños (cuanto mayor más potente pero más lento y caro). Los modelos “ada” serán más baratos y rápidos, destinados a resolver tareas sencillas. Lo importante de esta opción son los modelos “Base” y los modelos “Instruct”, pensados para plantearle al modelo instrucciones en lugar de ejemplos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *