O que é o ChatGPT e como você pode usá-lo?

September 22, 2023

Isso é o que é o ChatGPT e por que ele pode ser a ferramenta mais importante desde os motores de busca modernos.

A OpenAI introduziu uma IA de perguntas e respostas de forma longa chamada ChatGPT que responde perguntas complexas de forma conversacional.

É uma tecnologia revolucionária porque é treinada para aprender o que os humanos querem dizer quando fazem uma pergunta.

Muitos usuários se impressionam com sua capacidade de fornecer respostas de qualidade humana, inspirando a sensação de que ele pode eventualmente ter o poder de mudar a forma como os humanos interagem com computadores e como as informações são obtidas.

Table of Contents

O que é o ChatGPT?

O ChatGPT é um chatbot de modelo de linguagem grande desenvolvido pela OpenAI com base no GPT-3.5. Ele tem a notável capacidade de interagir de forma conversacional e fornecer respostas que podem parecer surpreendentemente humanas.

Modelos de linguagem grandes executam a tarefa de prever a próxima palavra em uma série de palavras.

O Treinamento de Aprendizado por Reforço com Feedback Humano (RLHF) é uma camada adicional de treinamento que usa o feedback humano para ajudar o ChatGPT a aprender a seguir instruções e gerar respostas satisfatórias para os seres humanos.

Quem criou o ChatGPT?

O ChatGPT foi criado pela OpenAI, uma empresa de inteligência artificial sediada em San Francisco. A OpenAI Inc. é a empresa-mãe sem fins lucrativos da OpenAI LP com fins lucrativos.

A OpenAI é famosa por seu conhecido DALL·E, um modelo de aprendizado profundo que gera imagens a partir de instruções de texto chamadas prompts.

O CEO é Sam Altman, que anteriormente foi presidente da Y Combinator.

A Microsoft é uma parceira e investidora no valor de 1 bilhão de dólares. Eles desenvolveram em conjunto a Plataforma de IA Azure.

Modelos de Linguagem Grandes

O ChatGPT é um modelo de linguagem grande (LLM). Modelos de linguagem grandes (LLMs) são treinados com grandes quantidades de dados para prever com precisão qual palavra vem a seguir em uma frase.

Descobriu-se que aumentar a quantidade de dados aumentava a capacidade dos modelos de linguagem de fazer mais coisas.

De acordo com a Universidade de Stanford:

“O GPT-3 tem 175 bilhões de parâmetros e foi treinado com 570 gigabytes de texto. Para comparação, seu antecessor, o GPT-2, era mais de 100 vezes menor com 1,5 bilhão de parâmetros.

Esse aumento em escala muda drasticamente o comportamento do modelo — o GPT-3 é capaz de realizar tarefas para as quais não foi explicitamente treinado, como a tradução de frases do inglês para o francês, com poucos ou nenhum exemplo de treinamento.

Esse comportamento era principalmente ausente no GPT-2. Além disso, para algumas tarefas, o GPT-3 supera modelos que foram explicitamente treinados para resolver essas tarefas, embora em outras tarefas ele fique aquém.”

Os LLMs preveem a próxima palavra em uma série de palavras em uma frase e as próximas frases — algo semelhante a um autocompletar, mas em uma escala surpreendente.

Essa capacidade permite que eles escrevam parágrafos e páginas inteiras de conteúdo.

Mas os LLMs têm limitações, pois nem sempre entendem exatamente o que um humano deseja.

E é aí que o ChatGPT melhora o estado da arte, com o treinamento mencionado anteriormente, o Reinforcement Learning with Human Feedback (RLHF).

O ChatGPT é gratuito para uso?

O uso do ChatGPT é atualmente gratuito durante o período de “visualização de pesquisa”.

O chatbot está aberto para usuários experimentarem e fornecerem feedback sobre as respostas, para que a IA possa melhorar na resposta a perguntas e aprender com seus erros. Para usar o ChatGPT gratuitamente, clique aqui.

O anúncio oficial afirma que a OpenAI está ansiosa para receber feedback sobre os erros:

“Embora tenhamos feito esforços para fazer o modelo recusar solicitações inapropriadas, às vezes ele pode responder a instruções prejudiciais ou apresentar comportamento tendencioso.

Estamos usando a API de Moderação para alertar ou bloquear certos tipos de conteúdo inseguro, mas esperamos que haja alguns falsos positivos e negativos por enquanto.

Estamos ansiosos para receber o feedback dos usuários para ajudar nosso trabalho contínuo de melhorar esse sistema.”

Atualmente há um concurso com um prêmio de $500 em créditos do ChatGPT para incentivar o público a avaliar as respostas.

“Os usuários são incentivados a fornecer feedback sobre a saída problemática do modelo por meio da interface, assim como sobre quaisquer falsos positivos/negativos do filtro de conteúdo externo, que também faz parte da interface.

Estamos particularmente interessados em receber feedback sobre saídas prejudiciais que possam ocorrer em condições do mundo real, não adversariais, assim como feedback que nos ajude a identificar e compreender riscos e possíveis medidas de mitigação não convencionais.

Você pode escolher participar do Concurso de Feedback do ChatGPT3 para ter a chance de ganhar até $500 em créditos da API.

As inscrições podem ser enviadas por meio do formulário de feedback vinculado na interface do ChatGPT.”

Quais são as limitações do ChatGPT?

Limitações na resposta tóxica

O ChatGPT é especificamente programado para não fornecer respostas tóxicas ou prejudiciais. Portanto, evitará responder a esse tipo de pergunta.

Qualidade das respostas depende da qualidade das instruções

Uma limitação importante do ChatGPT é que a qualidade da resposta depende da qualidade da entrada. Em outras palavras, instruções especializadas (prompts) geram respostas melhores.

As respostas nem sempre estão corretas

Outra limitação é que, como ele é treinado para fornecer respostas que parecem corretas aos humanos, as respostas podem enganar os humanos, fazendo-os acreditar que a saída está correta.

Muitos usuários descobriram que o ChatGPT pode fornecer respostas incorretas, incluindo algumas que estão completamente erradas.

Os moderadores do site de perguntas e respostas de programação Stack Overflow podem ter descoberto uma consequência indesejada de respostas que parecem corretas aos humanos.

O Stack Overflow foi inundado com respostas geradas pelo ChatGPT que pareciam estar corretas, mas muitas delas estavam erradas.

As milhares de respostas sobrecarregaram a equipe de moderadores voluntários, levando os administradores a proibir o uso de respostas geradas pelo ChatGPT por parte dos usuários.

A inundação de respostas do ChatGPT resultou em um post intitulado: Política temporária: ChatGPT está banido:

“Esta é uma política temporária destinada a desacelerar o influxo de respostas e outros conteúdos criados com o ChatGPT.

…O problema principal é que, embora as respostas produzidas pelo ChatGPT tenham uma alta taxa de incorreção, elas geralmente ‘parecem’ que ‘podem’ estar corretas…”

A experiência dos moderadores do Stack Overflow com respostas erradas do ChatGPT que parecem corretas é algo do qual a OpenAI, criadora do ChatGPT, está ciente e alertou em seu anúncio sobre a nova tecnologia.

A OpenAI explica as limitações do ChatGPT

O anúncio da OpenAI ofereceu esta ressalva:

“O ChatGPT às vezes escreve respostas que parecem plausíveis, mas são incorretas ou sem sentido.

Corrigir esse problema é desafiador, pois:

durante o treinamento de RL, não há uma fonte de verdade atualmente;
treinar o modelo para ser mais cauteloso faz com que ele decline perguntas que poderia responder corretamente; e
o treinamento supervisionado engana o modelo porque a resposta ideal depende do que o modelo sabe, não do que o demonstrador humano sabe.”

Como o ChatGPT pode ser usado?

O ChatGPT pode escrever código, poemas, músicas e até histórias curtas no estilo de um autor específico.

A expertise em seguir instruções eleva o ChatGPT de uma fonte de informação para uma ferramenta que pode ser solicitada a realizar uma tarefa.

Isso o torna útil para escrever um ensaio sobre praticamente qualquer assunto.

O ChatGPT pode funcionar como uma ferramenta para gerar esboços de artigos ou até mesmo romances inteiros.

Ele fornecerá uma resposta para virtualmente qualquer tarefa que possa ser respondida com texto escrito.

Conclusão

Como mencionado anteriormente, o ChatGPT é concebido como uma ferramenta que o público eventualmente terá que pagar para usar.

Mais de um milhão de usuários se registraram para usar o ChatGPT nos primeiros cinco dias desde que foi aberto ao público.

This post is also available in: Español (Espanhol)