in

Anthropic lança Claude 2, o chatbot de IA de segunda geração, concorrente do ChatGPT

A plataforma está disponível em versão beta nos Estados Unidos e no Reino Unido

Foto: Anthropic

A Anthropic, startup de inteligência artificial, anunciou nesta terça-feira (11) o lançamento de  Claude 2, um novo modelo de IA de geração de texto. As informações são do TechCrunch.

O Claude 2 está disponível em versão beta nos Estados Unidos e no Reino Unido, tanto na web quanto por meio de uma API paga (em acesso limitado), que custa $ 0,04 (cerca de R$ 0,20) para gerar mil palavras.

“Acreditamos que é importante implantar esses sistemas no mercado e entender como as pessoas realmente os usam”, disse Sandy Banerjee, chefe de entrada no mercado da Anthropic, ao TechCrunch. “Monitoramos como eles são usados, como podemos melhorar o desempenho, bem como a capacidade – todas essas coisas.”

Sandy Banerjee, chefe de entrada no mercado da Anthropic. Foto: Reprodução/Twitter

Como a versão antiga, o Claude 2 pode pesquisar documentos, resumir, escrever, codificar e responder a perguntas sobre tópicos específicos. No entanto, a Anthropic afirma que a nova edição é superior em várias áreas.

O Claude 2 foi treinado com dados mais recentes – uma mistura de sites, conjuntos de dados licenciados de terceiros e de usuários fornecidos voluntariamente desde o início de 2023, cerca de 10% dos quais não são em inglês – do que o Claude 1.3, que provavelmente contribuiu para as melhorias.

Ao contrário do GPT-4 da OpenAI, o Claude 2 não pode pesquisar na web. Mas os modelos não são tão diferentes arquitetonicamente. A plataforma apresenta uma janela de contexto com o mesmo tamanho do Claude 1.3, ou seja, 100 mil tokens – o maior de qualquer modelo disponível comercialmente. 

A janela de contexto se refere ao texto que o modelo considera antes de gerar texto adicional, enquanto os tokens representam o texto bruto. Além disso, o Claude 2 pode analisar cerca de 75 mil palavras e gerar 4 mil tokens, ou cerca de 3.125 palavras. Teoricamente, a plataforma suportar uma janela de contexto ainda maior – 200 mil tokens – mas a Anthropic não planeja oferecer suporte a isso no lançamento.

Foto: Rawpixel

A Anthropic ainda diz que o Claude 2 é “2x melhor” em dar respostas “inofensivas” em comparação com o Claude 1.3. 

De forma reveladora, a Anthropic desaconselha o uso do Claude 2 para aplicações “onde a saúde e o bem-estar físico ou mental estão envolvidos” ou em “situações de alto risco em que uma resposta incorreta causaria danos”. 

“[Nossa] avaliação interna de equipes vermelhas classifica nossos modelos em um conjunto representativo muito grande de solicitações adversárias prejudiciais”, disse Banerjee quando pressionado para obter detalhes, “e fazemos isso com uma combinação de testes automatizados e verificações manuais”.

A Anthropic também não revelou quais prompts, testes e verificações usa para fins de benchmarking. O TechCrunch pontua que a empresa foi relativamente vaga no tópico de apresentação e análise de dados – incluindo texto de fontes protegidas por direitos autorais em alguns casos.

A IA constitucional, desenvolvido pela Anthropic, dá a um modelo um conjunto de princípios para fazer julgamentos sobre o texto que ele gera. Em um alto nível, esses princípios orientam o modelo a assumir o comportamento que descrevem, por exemplo, “não tóxico” e “útil”.

A Anthropic afirma que o comportamento de Claude 2 é mais fácil de entender e mais simples de ajustar conforme necessário em comparação com outros modelos. A empresa desenvolveu muitos dos princípios que orientam a plataforma por meio de um processo de “tentativa e erro” e teve que fazer ajustes repetidos para evitar que seus modelos sejam “irritantes”.

Ainda segundo o TechCrunch, a  Anthropic admite que, à medida que Claude se torna mais sofisticado, fica cada vez mais difícil prever o comportamento do modelo em todos os cenários.

Inteligência Artificial. Foto: Unsplash

Ainda de acordo com o TechCrunch, eventualmente, a Anthropic planeja explorar maneiras de tornar a constituição personalizável. No entanto, segundo o site especializado em tecnologia, a plataforma ainda não atingiu esse estágio do roteiro de desenvolvimento do produto.