Você já imaginou alguma plataforma que pudesse transformar qualquer ideia em uma montagem super realista, sem necessidade de usar o photoshop?
A “Imagen”, nova inteligência artificial que está sendo desenvolvida pela Google, promete criar imagens a partir de um texto utilizando computação gráfica. Por exemplo, se o usuário digitar: “um cérebro digitando um foguete em direção à lua”, o software criará imagens muito bem acabadas considerando o contexto descrito pelo indivíduo.
O modelo de difusão de texto para imagem com um grau de fotorrealismo, conhecido como Imagen, utiliza um codificador para criptografar o texto em embeddings, enquanto um modelo de de difusão condicional mapeia a incorporação do texto em uma imagem. O programa se assemelha ao DALL-E (inteligência artificial da OpenAI), mas promete uma melhor eficiência.
Portanto, a plataforma permitirá que as pessoas criem montagens e ilustrações sem precisar usar um programa de edição como o photoshop, além de economizar o tempo do usuário. Porém, a plataforma ainda não está 100% viabilizada ao público. O site mostra algumas imagens selecionadas já criadas pelo software que exemplificam a utilidade da plataforma, mas será que o software será capaz de interpretar qualquer tipo de texto? É o que esperamos, mas nada pode ser afirmado sobre o funcionamento da Imagen, por enquanto.
Alguns resultados do trabalho do algoritmo foram expostos no site oficial da Imagen. Esses protótipos foram feitos através de inteligência artificial, mas todas as imagens foram avaliadas por seres humanos, que aprovaram os resultados e criando grandes esperanças nos usuários que pretendem utilizar a plataforma.
Atualmente, este tipo de Inteligência Artificial pode oferecer riscos à nossa sociedade, visto que está cada vez mais comum o compartilhamento de fake news. Essa prática pode ser cada vez mais recorrente a partir da abertura da plataforma, já que a mesma facilitará a criação de imagens falsas/artificiais.
Além disso, o programa também poderá ser usado em comportamentos tóxicos como bullying, racismo, sexismo, assédio, etc. Por este motivo, prevê-se que a plataforma não será completamente adaptável a qualquer texto de entrada, mas que haverá um banco de dados único onde o usuário poderá selecionar algumas opções para criar sua imagem. Essa medida tem como finalidade combater o mau uso do software, além de facilitar o trabalho de programação do software. Porém, o futuro da IA do Google ainda é incerto.
Nos testes de funcionamento da plataforma, foi observado que na criação de imagens que incluíam seres humanos, todos eram representados de maneira racista e sexista. Por exemplo, quando era digitado “atendente de bordo”, as imagens contavam sempre com a presença de mulheres, e nunca de homens. Já em outro contexto, quando era ordenado “CEO ‘s”, por exemplo, a plataforma apresentava figuras de pessoas brancas, e nunca de pessoas pretas.
A resposta para este problema é a falta de diversidade no banco de dados do software, mas que está em fase de aprimoramento e ao que tudo indica, futuramente essas questões não serão mais uma pauta a ser discutida sobre a Imagen.