ATENÇÃO! A partir de agora, imagens fortes para pessoas sensíveis… ou para os bem-humorados que adoram fazer piada de tudo.
A Stability AI apresentou ao mundo a Stable Diffusion 3 Medium, versão compacta do seu modelo de IA generativa de imagens, que prometeu ser mais acessível e funcional em computadores com GPUs compatíveis com a sua proposta.
Muito legal no papel, pois torna o recurso tangível para o grande público. Na prática, é mais uma ferramenta para criar versões monstruosas de humanos, onde apenas o Ryan Murphy poderia se aproveitar disso para apresentar novos personagens no American Horror Story.
Venha conhecer o novo mar de gastura em forma de desastre gráfico criado por uma Inteligência Artificial que ainda precisa aprender como se cria a imagem dos humanos.
O que a Stable Diffusion 3 Medium promete?
A quantidade menor de parâmetros (2 bilhões, contra 8 bilhões da versão Large) deixa a Stable Diffusion 3 Medium mais leve para funcionar em qualquer computador. Bom, quero dizer, qualquer computador compatível com a plataforma.
Você precisa ter uma GPU de, no mínimo, 5 GB de memória gráfica (16 GB recomendados) para o funcionamento local. A boa notícia é que a Stable Diffusion 3 Medium está disponível de graça.
Seria muito pior pra todo mundo ter que pagar para criar humanos monstruosos, não é mesmo?
A principal promessa da Stable Diffusion 3 Medium é entregar o fotorrealismo nas imagens geradas, combinando com um melhor suporte a topografias e compreensão de prompts mais complexos. A ideia aqui é criar imagens com maior riqueza de detalhes quando o usuário escrever comandos longos e mais descritivos.
Pena que está só na promessa por enquanto.
Onde a Stable Diffusion 3 Medium falhou?
Um dos maiores desafios para qualquer plataforma de Inteligência Artificial generativa é criar corpos humanos. Dedos ficam deformados, pés invertidos e áreas pubianas recebem a torre de Pisa ou o prédio do MASP.
Com a Stable Diffusion 3 Medium, não é muito diferente. Várias postagens no Reddit de usuários que estão testando a ferramenta compartilham os resultados vindos da aberração de uma IA que ainda não está pronta, com falhas evidentes em imagens que deveriam ser de boa qualidade.
Os problemas dessa versão Medium são os mesmos apresentados nas versões anteriores da tecnologia da Stability AI, o que mostra que a própria empresa está batendo cabeça com essa questão.
Neste aspecto, a Midjourney deve olhar para tudo isso, fazer algumas anotações e melhorar o DALL-E 3 nos pontos fracos da concorrência. O que salva a Stable Diffusion 3 Medium é que sua proprietária tende a ser mais ética na coleta de dados, uma vez que sua principal adversária se vale de práticas questionáveis para treinar a sua IA generativa.
Por outro lado, a Stable Diffusion pode estar sofrendo das consequências de uma decisão que, em teoria, seria positiva: a censura ao conteúdo adulto durante o treinamento do seu modelo.
Como os usuários são “muito criativos” (se é que você me entende), prompts de imagens de mulheres na praia usando biquini ou que revelam um pouco mais da anatomia humana ao natural não conseguem ser interpretados de forma adequada pela IA.
E o resultado é materializado nas imagens absurdas que ela está gerando.
Coloque nessa equação o fato de a Stability AI enfrentar problemas de desenvolvimento, principalmente após a saída do seu CEO e fundador, Emad Mostaque. Pelo menos 10% dos seus funcionários foram demitidos por conta de problemas financeiros que a empresa está enfrentando nesse momento.
Sem falar nos processos judiciais. A Getty Images moveu recentemente uma ação contra a Stability AI, e isso faz com que mais dinheiro saia do caixa para uma defesa eficiente.
Enquanto isso, vamos seguir brincando de criar monstros e pessoas horrorosas, e está tudo certo. Quem é que precisa de uma IA ultrarrealista gerando imagens falsas do Papa Francisco (vestindo uma roupa toda estilosa) ou do Donald Trump (preso), não é mesmo?