Esto es lo que es ChatGPT y por qué puede ser la herramienta más importante desde los motores de búsqueda modernos.
OpenAI presentó un modelo de inteligencia artificial de preguntas y respuestas a largo plazo llamado ChatGPT que responde preguntas complejas de manera conversacional.
Es una tecnología revolucionaria porque se entrena para aprender lo que los humanos quieren decir cuando hacen una pregunta.
Muchos usuarios se asombran de su capacidad para proporcionar respuestas de calidad humana, inspirando la sensación de que eventualmente podría tener el poder de alterar la forma en que los humanos interactúan con las computadoras y cambiar cómo se obtiene la información.
¿Qué es ChatGPT?
ChatGPT es un chatbot de modelo de lenguaje grande desarrollado por OpenAI basado en GPT-3.5. Tiene la notable capacidad de interactuar en forma de diálogo conversacional y proporcionar respuestas que pueden parecer sorprendentemente humanas.
Los modelos de lenguaje grande realizan la tarea de predecir la próxima palabra en una serie de palabras.
El Aprendizaje por Refuerzo con Retroalimentación Humana (RLHF, por sus siglas en inglés) es una capa adicional de entrenamiento que utiliza la retroalimentación humana para ayudar a ChatGPT a aprender la capacidad de seguir instrucciones y generar respuestas satisfactorias para los humanos.
¿Quién construyó ChatGPT?
ChatGPT fue creado por OpenAI, una compañía de inteligencia artificial con sede en San Francisco. OpenAI Inc. es la empresa matriz sin fines de lucro de OpenAI LP con fines de lucro.
OpenAI es famoso por su conocido modelo de aprendizaje profundo llamado DALL·E, que genera imágenes a partir de instrucciones de texto llamadas indicaciones.
El CEO es Sam Altman, quien antes fue presidente de Y Combinator.
Microsoft es socio e inversor en la cantidad de 1 mil millones de dólares. Desarrollaron conjuntamente la plataforma de inteligencia artificial Azure.
Modelos de Lenguaje Grande
ChatGPT es un modelo de lenguaje grande (LLM, por sus siglas en inglés). Los Modelos de Lenguaje Grande (LLMs) se entrenan con grandes cantidades de datos para predecir con precisión qué palabra viene a continuación en una oración.
Se descubrió que aumentar la cantidad de datos aumenta la capacidad de los modelos de lenguaje para hacer más cosas.
Según la Universidad de Stanford:
GPT-3 tiene 175 mil millones de parámetros y se entrenó con 570 gigabytes de texto. En comparación, su predecesor, GPT-2, era más de 100 veces más pequeño con 1.5 mil millones de parámetros.
Este aumento en escala cambia drásticamente el comportamiento del modelo; GPT-3 es capaz de realizar tareas para las que no fue entrenado explícitamente, como traducir oraciones del inglés al francés, con pocos o ningún ejemplo de entrenamiento.
Este comportamiento estaba en su mayoría ausente en GPT-2. Además, para algunas tareas, GPT-3 supera a los modelos que fueron entrenados explícitamente para resolver esas tareas, aunque en otras tareas se queda corto.
Los LLMs predicen la próxima palabra en una serie de palabras en una oración y las siguientes oraciones, de alguna manera similar a la función de autocompletar, pero a una escala sorprendente.
Esta capacidad les permite escribir párrafos y páginas completas de contenido.
Pero los LLMs están limitados en el sentido de que no siempre entienden exactamente lo que un humano quiere.
Y ahí es donde ChatGPT mejora el estado del arte, con el mencionado entrenamiento de Aprendizaje por Refuerzo con Retroalimentación Humana (RLHF).
¿Es ChatGPT gratuito de usar?
El uso de ChatGPT es actualmente gratuito durante el «avance de investigación».
El chatbot está abierto actualmente para que los usuarios lo prueben y proporcionen comentarios sobre las respuestas para que la IA pueda mejorar para responder preguntas y aprender de sus errores. Para usar ChatGPT de forma gratuita, haz clic aquí.
El anuncio oficial afirma que OpenAI está ansioso por recibir comentarios sobre los errores:
Aunque hemos hecho esfuerzos para que el modelo rechace solicitudes inapropiadas, a veces responderá a instrucciones dañinas o presentará un comportamiento sesgado.
Estamos utilizando la API de moderación para advertir o bloquear ciertos tipos de contenido inseguro, pero esperamos que actualmente tenga algunos falsos negativos y positivos.
Estamos ansiosos por recopilar comentarios de los usuarios para ayudar en nuestro trabajo en curso para mejorar este sistema.
Actualmente hay un concurso con un premio de 500 dólares en créditos de ChatGPT para animar al público a calificar las respuestas.
Se alienta a los usuarios a proporcionar comentarios sobre salidas problemáticas del modelo a través de la interfaz, así como sobre falsos positivos/negativos del filtro de contenido externo que también forma parte de la interfaz.
Estamos especialmente interesados en comentarios relacionados con salidas dañinas que podrían ocurrir en condiciones del mundo real, no adversariales, así como comentarios que nos ayuden a descubrir y comprender riesgos novedosos y posibles mitigaciones.
Puedes optar por participar en el concurso de comentarios de ChatGPT para tener la oportunidad de ganar hasta 500 dólares en créditos de API.
Las inscripciones se pueden enviar a través del formulario de comentarios que está vinculado en la interfaz de ChatGPT.
¿Cuáles son las limitaciones de ChatGPT?
Limitaciones en las respuestas tóxicas
ChatGPT está específicamente programado para no proporcionar respuestas tóxicas o dañinas. Por lo tanto, evitará responder ese tipo de preguntas.
La calidad de las respuestas depende de la calidad de las instrucciones
Una limitación importante de ChatGPT es que la calidad de la salida depende de la calidad de la entrada. En otras palabras, las instrucciones expertas generan respuestas mejores.
Las respuestas no siempre son correctas
Otra limitación es que, debido a que se entrena para proporcionar respuestas que se sientan correctas para los humanos, las respuestas pueden engañar a los humanos haciéndoles creer que la salida es correcta.
Muchos usuarios descubrieron que ChatGPT puede proporcionar respuestas incorrectas, incluso algunas que están equivocadas de manera sorprendente.
Los moderadores del sitio web de preguntas y respuestas de programación Stack Overflow descubrieron una consecuencia no deseada de respuestas que se sienten correctas para los humanos.
Stack Overflow se vio inundado de respuestas generadas por ChatGPT que parecían ser correctas, pero muchas de ellas eran respuestas incorrectas.
Las miles de respuestas abrumaron al equipo de moderación voluntario, lo que llevó a los administradores a prohibir a los usuarios que envíen respuestas generadas por ChatGPT.
La avalancha de respuestas de ChatGPT resultó en una publicación titulada: Política temporal: ChatGPT está prohibido:
Esta es una política temporal destinada a frenar el flujo de respuestas y otros contenidos creados con ChatGPT.
…El problema principal es que, mientras que las respuestas que produce ChatGPT tienen una alta tasa de incorrectas, típicamente ‘parecen’ que ‘podrían’ ser buenas…
La experiencia de los moderadores de Stack Overflow con respuestas incorrectas de ChatGPT que parecen correctas es algo de lo que OpenAI, los creadores de ChatGPT, son conscientes y advierten en su anuncio sobre la nueva tecnología.
OpenAI explica las limitaciones de ChatGPT
El anuncio de OpenAI ofrece esta advertencia:
A veces, ChatGPT escribe respuestas que suenan plausibles pero son incorrectas o sin sentido.
Arreglar este problema es desafiante porque:
- durante el entrenamiento de RL, actualmente no hay una fuente de verdad;
- entrenar al modelo para ser más cauteloso hace que rechace preguntas que puede responder correctamente; y
- el entrenamiento supervisado engaña al modelo porque la respuesta ideal depende de lo que el modelo sabe, en lugar de lo que sabe el instructor humano.
¿Cómo se puede utilizar ChatGPT?
ChatGPT puede escribir código, poemas, canciones e incluso cuentos cortos al estilo de un autor específico.
La experiencia en seguir instrucciones eleva a ChatGPT de una fuente de información a una herramienta que se puede pedir para realizar una tarea.
Esto lo hace útil para escribir un ensayo sobre prácticamente cualquier tema.
ChatGPT puede funcionar como una herramienta para generar esquemas para artículos e incluso novelas completas.
Proporcionará una respuesta para prácticamente cualquier tarea que se pueda responder con texto escrito.
Conclusión
Como se mencionó anteriormente, se prevé que ChatGPT sea una herramienta por la cual el público deberá pagar en algún momento.
Más de un millón de usuarios se han registrado para usar ChatGPT en los primeros cinco días desde que se abrió al público.
Esta publicación también está disponible en: Português (Portugués, Brasil)