Inteligência artificial Google permite criar imagens com base em textos

A “Imagen”, nova inteligência artificial que está sendo desenvolvida pela Google, promete criar imagens a partir de um texto utilizando computação gráfica. Por exemplo, se o usuário digitar: “um cérebro digitando um foguete em direção à lua”, o software criará imagens muito bem acabadas considerando o contexto descrito pelo indivíduo.
Publicado em Internet dia 1/06/2022 por Alan Corrêa

Você já imaginou alguma plataforma que pudesse transformar qualquer ideia em uma montagem super realista, sem necessidade de usar o photoshop?

A “Imagen”, nova inteligência artificial que está sendo desenvolvida pela Google, promete criar imagens a partir de um texto utilizando computação gráfica. Por exemplo, se o usuário digitar: “um cérebro digitando um foguete em direção à lua”, o software criará imagens muito bem acabadas considerando o contexto descrito pelo indivíduo.

Como funcionará essa IA?

Esta imagem foi criada por uma IA do Google
Esta imagem foi criada por uma IA do Google

O modelo de difusão de texto para imagem com um grau de fotorrealismo, conhecido como Imagen, utiliza um codificador para criptografar o texto em embeddings, enquanto um modelo de de difusão condicional mapeia a incorporação do texto em uma imagem. O programa se assemelha ao DALL-E (inteligência artificial da OpenAI), mas promete uma melhor eficiência.

Portanto, a plataforma permitirá que as pessoas criem montagens e ilustrações sem precisar usar um programa de edição como o photoshop, além de economizar o tempo do usuário. Porém, a plataforma ainda não está 100% viabilizada ao público. O site mostra algumas imagens selecionadas já criadas pelo software que exemplificam a utilidade da plataforma, mas será que o software será capaz de interpretar qualquer tipo de texto? É o que esperamos, mas nada pode ser afirmado sobre o funcionamento da Imagen, por enquanto.

O Google não deixou o modelo do Imagen disponível para o público
O Google não deixou o modelo do Imagen disponível para o público

Alguns resultados do trabalho do algoritmo foram expostos no site oficial da Imagen. Esses protótipos foram feitos através de inteligência artificial, mas todas as imagens foram avaliadas por seres humanos, que aprovaram os resultados e criando grandes esperanças nos usuários que pretendem utilizar a plataforma.

Quais os riscos que uma IA como esta oferece?

Sistema pode misturar diversos estilos, seja pinturas a óleo, fotografias e renderizações CGI
Sistema pode misturar diversos estilos, seja pinturas a óleo, fotografias e renderizações CGI

Atualmente, este tipo de Inteligência Artificial pode oferecer riscos à nossa sociedade, visto que está cada vez mais comum o compartilhamento de fake news. Essa prática pode ser cada vez mais recorrente a partir da abertura da plataforma, já que a mesma facilitará a criação de imagens falsas/artificiais.

O Imagen tem semelhanças com o projeto DALL-E, desenvolvido pelo laboratório de IA OpenAI — agora, em sua edição “DALL-E 2”
O Imagen tem semelhanças com o projeto DALL-E, desenvolvido pelo laboratório de IA OpenAI — agora, em sua edição “DALL-E 2”

Além disso, o programa também poderá ser usado em comportamentos tóxicos como bullying, racismo, sexismo, assédio, etc. Por este motivo, prevê-se que a plataforma não será completamente adaptável a qualquer texto de entrada, mas que haverá um banco de dados único onde o usuário poderá selecionar algumas opções para criar sua imagem. Essa medida tem como finalidade combater o mau uso do software, além de facilitar o trabalho de programação do software. Porém, o futuro da IA do Google ainda é incerto.

O algoritmo possui “preconceitos”?

O próprio Google aponta que a ferramenta pode codificar preconceitos sociais, isso porque ele analisa grandes quantidades de dados e eles se baseiam em padrões para aprender e replicar
O próprio Google aponta que a ferramenta pode codificar preconceitos sociais, isso porque ele analisa grandes quantidades de dados e eles se baseiam em padrões para aprender e replicar

Nos testes de funcionamento da plataforma, foi observado que na criação de imagens que incluíam seres humanos, todos eram representados de maneira racista e sexista. Por exemplo, quando era digitado “atendente de bordo”, as imagens contavam sempre com a presença de mulheres, e nunca de homens. Já em outro contexto, quando era ordenado “CEO ‘s”, por exemplo, a plataforma apresentava figuras de pessoas brancas, e nunca de pessoas pretas.

A resposta para este problema é a falta de diversidade no banco de dados do software, mas que está em fase de aprimoramento e ao que tudo indica, futuramente essas questões não serão mais uma pauta a ser discutida sobre a Imagen.

*Com informações do EM, Tecmundo e Imagen.