Inteligência artificial Google permite criar imagens com base em textos

A “Imagen”, nova inteligência artificial que está sendo desenvolvida pela Google, promete criar imagens a partir de um texto utilizando computação gráfica. Por exemplo, se o usuário digitar: “um cérebro digitando um foguete em direção à lua”, o software criará imagens muito bem acabadas considerando o contexto descrito pelo indivíduo.

Publicado por Alan Correa em Internet dia 1/06/2022

Continue Lendo

Siga-nos no Google News

Você já imaginou alguma plataforma que pudesse transformar qualquer ideia em uma montagem super realista, sem necessidade de usar o photoshop?

A “Imagen”, nova inteligência artificial que está sendo desenvolvida pela Google, promete criar imagens a partir de um texto utilizando computação gráfica. Por exemplo, se o usuário digitar: “um cérebro digitando um foguete em direção à lua”, o software criará imagens muito bem acabadas considerando o contexto descrito pelo indivíduo.

Como funcionará essa IA?

Esta imagem foi criada por uma IA do Google

O modelo de difusão de texto para imagem com um grau de fotorrealismo, conhecido como Imagen, utiliza um codificador para criptografar o texto em embeddings, enquanto um modelo de de difusão condicional mapeia a incorporação do texto em uma imagem. O programa se assemelha ao DALL-E (inteligência artificial da OpenAI), mas promete uma melhor eficiência.

Portanto, a plataforma permitirá que as pessoas criem montagens e ilustrações sem precisar usar um programa de edição como o photoshop, além de economizar o tempo do usuário. Porém, a plataforma ainda não está 100% viabilizada ao público. O site mostra algumas imagens selecionadas já criadas pelo software que exemplificam a utilidade da plataforma, mas será que o software será capaz de interpretar qualquer tipo de texto? É o que esperamos, mas nada pode ser afirmado sobre o funcionamento da Imagen, por enquanto.

O Google não deixou o modelo do Imagen disponível para o público

Alguns resultados do trabalho do algoritmo foram expostos no site oficial da Imagen. Esses protótipos foram feitos através de inteligência artificial, mas todas as imagens foram avaliadas por seres humanos, que aprovaram os resultados e criando grandes esperanças nos usuários que pretendem utilizar a plataforma.

Quais os riscos que uma IA como esta oferece?

Sistema pode misturar diversos estilos, seja pinturas a óleo, fotografias e renderizações CGI

Atualmente, este tipo de Inteligência Artificial pode oferecer riscos à nossa sociedade, visto que está cada vez mais comum o compartilhamento de fake news. Essa prática pode ser cada vez mais recorrente a partir da abertura da plataforma, já que a mesma facilitará a criação de imagens falsas/artificiais.

O Imagen tem semelhanças com o projeto DALL-E, desenvolvido pelo laboratório de IA OpenAI — agora, em sua edição “DALL-E 2”

Além disso, o programa também poderá ser usado em comportamentos tóxicos como bullying, racismo, sexismo, assédio, etc. Por este motivo, prevê-se que a plataforma não será completamente adaptável a qualquer texto de entrada, mas que haverá um banco de dados único onde o usuário poderá selecionar algumas opções para criar sua imagem. Essa medida tem como finalidade combater o mau uso do software, além de facilitar o trabalho de programação do software. Porém, o futuro da IA do Google ainda é incerto.

O algoritmo possui “preconceitos”?

O próprio Google aponta que a ferramenta pode codificar preconceitos sociais, isso porque ele analisa grandes quantidades de dados e eles se baseiam em padrões para aprender e replicar

Nos testes de funcionamento da plataforma, foi observado que na criação de imagens que incluíam seres humanos, todos eram representados de maneira racista e sexista. Por exemplo, quando era digitado “atendente de bordo”, as imagens contavam sempre com a presença de mulheres, e nunca de homens. Já em outro contexto, quando era ordenado “CEO ‘s”, por exemplo, a plataforma apresentava figuras de pessoas brancas, e nunca de pessoas pretas.

A resposta para este problema é a falta de diversidade no banco de dados do software, mas que está em fase de aprimoramento e ao que tudo indica, futuramente essas questões não serão mais uma pauta a ser discutida sobre a Imagen.

*Com informações do EM, Tecmundo e Imagen.

Continue Lendo

Mandar no Whatsapp

Home | Sobre | Reportar Erro | Privacidade | Contato

BYD Atto 8 chega forte em 2026 com autonomia alta e foco real no uso brasileiro