Vazam as primeiras amostras do programa secreto de criação de imagens do ChatGPT

A OpenAI, empresa por trás do ChatGPT, tem testado uma nova iteração de seu modelo de geração de imagens de inteligência artificial (AI, no inglês) nos últimos meses, e as primeiras amostras — vazadas pelo YouTuber MattVidPro — mostram que ele parece estar à frente dos concorrentes.

“Extremamente empolgante — isso supera qualquer coisa que já vimos antes, é insano”, disse Matt em uma prévia que postou no YouTube. “O Midjourney não pode competir neste nível — nem acho que a versão seis do Midjourney seria capaz de competir neste nível.”

Não espere experimentá-lo tão cedo, no entanto. O acesso ao programa ainda é extremamente limitado.

O modelo não publicado provavelmente é uma atualização do DALL-E 2 e está sendo testado por meio de uma visualização somente para convidados dentro do ChatGPT-4. Matt disse que existem apenas cerca de 400 pessoas em todo o mundo com acesso a este novo gerador de imagens da OpenAI.

Embora limitadas, as amostras de imagens demonstram as habilidades avançadas da AI. Produziu imagens nítidas com iluminação e reflexos que imitam fotos reais. O modelo recriou pinturas detalhadas e até pinceladas visíveis. Ele também recriou perfeitamente nomes de marcas como “Snickers” e logotipos de marcas conhecidas como Subway em produtos gerados e alcançou uma ortografia razoavelmente boa em texto renderizado.

Um exemplo de uma imagem produzida pelo text-to-image do OpenAI. Fonte: MattVidPro

Enquanto os geradores de imagens atuais lutam para apresentar mãos coerentes, os exemplos mostraram mãos realistas e com proporções adequadas. Os fundos também pareciam mais convincentes do que os sistemas de AI concorrentes.

A OpenAI aparentemente removeu seus filtros de segurança para testar todo o potencial do modelo. Os usuários disseram ser possível gerar conteúdo violento e nudez sem hesitação. No entanto, conhecendo a posição da OpenAI em relação ao conteúdo “Non Safe For Work” (NSFW), é altamente improvável que uma versão pública oficial seja lançada sob tais padrões.

“É OpenAI, então você pode apostar que eles vão cuidar disso como fazem com tudo antes de lançá-lo”, observou Matt.

Alguns especialistas criticaram a OpenAI por “emburrecer” seus modelos para evitar possíveis controvérsias. Alguns estudos até sugerem que o OpenAI treinou o ChatGPT para ter um forte viés político em seus resultados.

No entanto, a qualidade consistente mostrada nas amostras é um salto à frente. Ele destaca os esforços contínuos da OpenAI para melhorar os recursos generativos de inteligência artificial.

A empresa pode revelar mais sobre seu progresso ainda este ano, especialmente se o campo de reconhecimento e geração de imagens ajudar a melhorar a robustez de seu produto estrela: um GPT-4 multimodal capaz de entender texto, imagens e rascunhos em um prompt.

Por enquanto, a tecnologia permanece confinada a testes fechados com um número minúsculo de usuários.

À medida que os modelos continuam melhorando, a linha entre o artificial e o real se confunde ainda mais. Embora isso anime muitos, as preocupações com o uso indevido persistirão. Construir essa tecnologia de forma responsável continua sendo um desafio urgente.

*Traduzido por Vini Barbosa com autorização do Decrypt.