A porcaria das IAs que não respondem o que quero

E a geração da imagem feita por IA em diferentes serviços foi, literalmente, uma porcaria...

Para quem conhece as diferentes frentes das produções artísticas sabe que a maioria ou é passageira, devido ao momento vivo, ou é espontânea, devido os fatores inusitados aos quais estão interligadas. Independente de onde elas se encontram, o evento do Inktober mostra como as coisas podem seguir vias distintas.

Criado em 2009 por Jake Parker como um desafio particular para melhorar suas habilidades e desenvolver práticas positivas do hábito de desenhar, ganhou importância quando virou uma lista pública de temas para desenhar. O objetivo era simples: sair um pouco das tendências digitais de desenho e valorizar a espontaneidade dos desenhos manuais em papel e caneta.

Valorizar o traço à mão, dar vós a sua vontade de desenhar, dar vida ao seu caderno sem pautas parado no fundo da gaveta, e ver a arte, nascendo, por outros olhos, é algo fantástico. Simples assim.

O banco de imagens do Freepik me respondeu com essas opções, e outras, a busca amigos.

A partir de 2016, quando a primeira lista de temas foi divulgada (ela se encontra no site oficial), o evento ganhou fama, destaque, desafios e mostrou que é possível criar artes lindas e inesperadas apenas com caneta, papel, e um olhar artístico distinto mas existe um porém. É preciso dedicação, consistência e perseverança todos os dias pois cada dia tem uma arte de um tema diferente. Todo dia um trabalho distinto e é aí que se aprende a desenhar. Será mesmo?

O assunto do tema é IA Generativa de imagens e para tal fui ao do GPT e a alguns outros geradores. Pra minha surpresa, todos eles eram bem chatos. Quando escrevia o prompt de comando, uma das temáticas de um dos anos do Inktober, dois amigos improváveis, veio a pior resposta possível, uma lerdeza da geração da imagem, lentidão maior que fila do INSS e demora para dar qualquer resposta. Era tão lenta a demora que fiquei dormindo com a cabeça no teclado, mas sou brasileiro, e continuei tentando. Pedia novas ideias e o que a IA me devolvia? A mesma imagem mas com fundos diferentes. Parecia um photoshop automático onde o prograva fazia o recorte das mesmas fontes com um novo fundo que demorava horrores para aparecer.

Pra piorar, as imagens tinham nada haver com o que pedia. Em vez de me ajudar só conseguiam me fazer perder tempo e haja paciência com essas ferramentas. Depois de algum tempo esperando alguma resposta veio a surpresa: nenhuma mudança em relação a imagem pedida originalmente. Os geradores só repetiam as respostas. Na dúvida que pairava ou o Chato GPT ficou perdido no prompt de comando, ou o fator genérico do tema o deixou mais perdido que barata cega no tiroteio. Prefiro a segunda opção...

Pixabay me respondeu com essas opções a busca por amigos...

Para constar, a temática de 2015 eu encontrei por acaso mas também, descobri outras temáticas de outros artistas. Neste caso, o tema foi “dois amigos improváveis” e para minha surpresa, os geradores colocaram apenas pessoas nas imagens criadas. No melhor dos casos ou uma pessoa e um urso do lado, sentados num banco de praça. Isso faz sentido para artista? Nenhum! Até porque parece que foi num banco de imagens que a IA levantou sobre veterinária e pegou o animal mais inusitado para se colocar ao lado de um ser humano. Num banco de praça, com fundo floresta verde ou alaranjado e só. E se isso não fosse inusitado, em determinadas regiões do planeta, sim humanos convivem com ursos, mesmo que de forma semi harmoniosa.

Essa IA poderia ter feito uma infinidade de outras coisas? Sim! Inclusive usando animais distintos como respostas? Sim, mas acabou falhando. Entretanto o que deu errado? As respostas ou o prompt de comando? Isso é algo que analisarei depois.

No fundo o Inktober é um bom grupo de temas para se explorar nos desenhos, justamente por ter um conjunto temático genérico nos seus temas, como fator espontâneo. Por esse mesmo fator, espontâneo, artistas sempre criaram coisas, no mínimo, inusitadas. Mas o contrassenso das IAs usadas, foi um tapa na cara da minha realidade, pois elas não conseguiram entregar algo realmente decente e deixar a desejar na variedade de opções. O que buscava era uma certa variedade de ideias e não um generalismo eletrônico cotidiano. Complicado isso...

Improvaveis, tive o retorno dessas imagens, que fazem parte do seu banco.

Poderia ter melhorado o prompt? Sem dúvida, mas o que nós, humanos artistas, temos de nos esforçar pra sair da zona de conforto, para gerar uma arte espontânea e inusitada para um evento anual de arte, também mostra como algumas ferramentas ditas “da moda” são capengas e ainda muito capadas.

Voltando ao processo... Quando mudei de busca de improváveis para inesperados o Chato GPT me respondeu "que ideia genial, podeira melhorar a descrição?" e eu em meus pensamentos respondi para mim mesmo "Lógico que não! GPT." e me veio o complemento "Não quero perder tempo escrevendo, descrevendo, coisas que já deveria saber..." pois a ideia de usar IA, nesse trabalho, era gerar variedade mas fiquei na vontade.

Me esforçar para descrever o que quero para um gerador de imagem desenhar, pra mim, algo que eu quero, é perder a parte mais bacana das pesquisas: a verificação da diversidade de imagens que aparecem nas buscas. E quando me esforço para definir o que quero para um computador fazer o que desejo significa perder tanta energia quanto eu mesmo realizar os meus trabalhos. Na prática significa que o esforço despendido em máquinas é tão relevante quanto gastar neurônios para tirar do plano das ideias o resultado final desejado e com menos textos. Ao menos, foi essa a sensação mais evidente que tive enquanto usei as IAs.

E ao fazer a busca por mim mesmo a resposta veio do Instagram, quem diria. Uma imagem de natureza que me deu uma explosão de ideias, que irei desenvolver com o tempo, foi surpreendente. Adorei as referências.

E indo além dos resultados superficiais das IAs, a maioria dos seus usuários não irão usar a versão paga delas pois custam um certo valor que no fim do mês poderão fazer falta, ao menos no Brasil. E como existem algumas opções, e todas por quase o mesmo valor, esse custo não sairá barato. Some tudo e verá o rombo do cartão de crédito. É justo? Para não ter respostas? Acho que não...

Só o fator financeiro já será uma limitação impositiva das detentoras das IAs a outra é que os bancos de imagens, aos quais as IAs buscam referências, podem não ter o fator “inusitado” como recorte. Então, o que é inusitado / improvável para uma IA? É onde entra, de fato, o fator sensibilidade humana. E o repertório necessário para se criar a arte, que desejo e almejo, os bancos de imagens já o fazem sozinhos...

Enquanto realizava as buscas por Improváveis, o iStock me retornou essas imagens.

OBS: A quantidade de imagens que todos os bancos me forneceram era elevada mas esbarravam no fator genérico do tema, o que me levou a mesma dificuldade e limitações do GPT e outros geradores porém, por ter buscado em bancos específicos e conhecidos, os resultados deles foram melhores.

Ao tentar, de novo, uma segunda vez no Chato GPT free, este me mandou uma imagem de um cachorro com um gato do lado "Grande ideia GPT! Nossa, fiquei pasmo de tão bom que tu foi..." e pedi novas respostas e a imagem foi refeita sem qualquer alteração. Ao menos no urso e homem, mudaram o fundo. Infelizmente não salvei a imagem desse urssohomem. Desde quando, gato e cachorro, é amizade improvável GPT? Assim me veio a constatação: a falta de espontaneidade dos bancos de imagens, que essas IAs consultam, mostrou o quão limitadas essas IAs são. E no final, recorri ao meu cérebro mesmo, pois minha sensibilidade é melhor que os bancos visuais dessas IAs. Ao menos, nas consultas, consigo ver algo diferente no meio de tanta igualdade...

Continuando a busca, pois já tinha feito uma pré seleção de imagens que me servirão de referência, decidi delimitá-las aos fatores da frase original "dois amigos" e "improváveis". No 'Google Imagens' ao menos me mostraram fotos do filme francês "Intocáveis" que, realmente, conta uma história interessante além disso não foi lá uma grande quantidade de respostas aceitáveis...

Ao separar os 'fatores' e ao receber as respostas de “Amigos”, pela IA, ela definiu um deles como seres humanos num ponto da imagem pedida enquanto no “improvável” colocou ou algum animal ou outra pessoa como fator secundário. Esse animal, por ser um urso, descrito acima, foi a 'surpresa'. E foi só isso? Sim e não. Então pedi novas respostas e "para nossa alegria" nada melhorou "que agonia"... Sim, ela só mudou alguns detalhes e ficou por isso mesmo. O GPT pode fazer melhor mas sou eu que precisarei redefinir as palavras da busca o que levaria a inevitável mudança de tema.

Ao mudar a busca do GPT para os bancos de imagens do Freepik, iStock e Pixabay a coisa melhorou, um pouco, mas melhorou. Mesmo que o Google imagens tenha se saído melhor nas respostas que os geradores, realmente, as coisas melhoraram. "Que coisa, não?" Para todas as frases peculiares descritas entre aspas, se o seu cérebro não falou com as vozes originais, das referências citadas, acho que estou virando peça de museu.

Na melhor das respostas que tive, de um dos bancos consultados, a imagem acima, foi a que melhor se saiu e mesmo assim não deixou de ser feita por uma pessoa. Com sensibilidade visual e inusitadamente oportuna para colocar "dois amigos improváveis" numa única imagem. E assim, consegui encontrar algo inesperado, inusitado, improvável de ocorrer naturalmente...

Então deixo uma pergunta: o que seriam "dois amigos improváveis"?

Felizmente já havia feito algumas pesquisas de imagens e para minha surpresa a ideia base já estava definida, faltava variedade de soluções. Usei as IAs para chegar nessa variedade mas nem chegaram perto do que havia imaginado. Felizmente a mente humana é muito melhor que esses criadores eletrônicos Generativos pois deixaram a desejar.

Mas e no final, qual foi a imagem que pude fazer? Vou deixar para outra postagem.

O improvável final desse texto é o que garante a espontaneidade da arte que as pessoas podem gerar com o devido trabalho, pesquisa e estudo.

E a image que o Chato GPT me entregou foi essa, acima, genérica, sem vida, sem graça, que muitos irão acreditar que foi genial. Eu nao achei nada demais, só um 'mais do mesmo' e escura. A partir dessa experiência repenso o uso dessas ferramentas, todos as vezes que as uso, e continuo as achando ridiculamente estúpidas pois somos melhores, em muitos sentidos. A imagem foi gerada em 17/09/2025.

Assim que terminar postarei o resultado.

Até lá...

Ass.: Thiago Sardenberg.

Obs: alguns dias depois de publicar o texto original, verifiquei a ortografia e o posicionamento de algumas vírgulas pois estavam erradas e acrescentei algumas coisas novas para melhorar o entendimento do contexto que originou a postagem inicial.

Pesquisar este blog

Buscas por um mestrado

A porcaria das IAs que não respondem o que quero

Comentários

Postar um comentário

Postagens mais visitadas deste blog

Contato: um livro de tecnologias e relações humanas regado a fantasias do imaginário

A função 'muderna' das artes