Princípios importantes
- DALL·E é uma nova rede neural que pode desenhar imagens com base em texto.
- A rede é um de um número crescente de projetos de IA que podem imitar a produção criativa de seres humanos.
- Especialistas dizem que imagens desenhadas por IA não são criações originais.
Afaste-se, Picasso. Uma nova rede neural pode desenhar imagens com base em texto.
DALL·E, uma junção dos nomes do artista Salvador Dalí e WALL·E da Pixar, pode pegar qualquer texto e criar uma imagem a partir dele. O sistema usa uma rede neural treinada em bilhões de imagens e exemplos de texto. É um de um número crescente de projetos de IA que podem imitar, mas não replicar, a produção criativa de seres humanos.
"Como a linguagem natural está em constante evolução e depende muito de nuances contextuais, ensinar uma máquina a entender a linguagem o suficiente para desenhar uma imagem é uma conquista muito significativa ", Tamara Schwartz, professora de segurança cibernética da York College of Pennsylvania, disse em uma entrevista por e-mail. "Imagine um desenhista policial, que é um talento raro, tendo a capacidade de criar uma imagem com base na descrição de uma testemunha."
Usando Big Data para produzir imagens
DALL-E foi criado pela empresa de pesquisa de IA OpenAI e funciona acumulando grandes quantidades de dados da internet. Os dados são então processados por um modelo de linguagem natural e treinados para produzir imagens a partir de texto. O DALL-E funciona de forma semelhante ao GPT-3 lançado recentemente, um modelo de linguagem criado pela OpenAI que pode ser solicitado a gerar passagens de texto originais. O GPT-3 foi treinado usando meio trilhão de palavras de texto da Internet e pode produzir texto surpreendentemente realista.
Ensinar uma máquina a entender a linguagem o suficiente para fazer um desenho é uma conquista muito significativa.
Michael Yurushkin, fundador e CTO da BroutonLab, uma empresa de ciência de dados, disse em uma entrevista por e-mail que o DALL-E é "um dos poucos golpes bem-sucedidos da humanidade em emular nossa criatividade e imaginação". Ele acrescentou: "É mais fácil perceber como a IA prevê algo analisando dados relevantes, mas entender como ela é capaz de gerar desenhos a partir de coisas que nunca 'ouviu' antes é mais difícil."
Schwartz tem o cuidado de observar que a IA não está criando informações, mas sim pegando dados de linguagem e transformando-os em imagens.
"A criatividade inicial vem do ser humano que construiu a tarefa", disse Schwartz. "Existe alguma 'criatividade' por parte da IA, porque ela experimenta várias combinações de dados e depois seleciona uma série de saídas potenciais. No entanto, um humano está examinando as saídas e ensinando a IA como selecionar entre as muitas combinações."
Robot Detective Work?
Uma máquina pode experimentar essa combinação de dados e objetos muito mais rápido do que um artista humano. Schwartz observou que DALL-E poderia um dia fazer parceria com um detetive tentando reconstruir uma cena de crime por meio de um esboço, com base em depoimentos de testemunhas oculares.
"À medida que as testemunhas prestam suas declarações, o computador pode pegar essa informação falada em linguagem natural e criar um desenho da cena, ou muitos desenhos da cena", disse ela. "Essas visualizações podem ser integradas para criar uma imagem mais precisa das provas perdidas. Essa visualização pode ser enriquecida pela integração de imagens anteriores do local antes do crime."
Vários outros programas baseados em IA podem produzir arte. Por exemplo, Ai-Da usa um sistema de braço robótico e tecnologia de reconhecimento facial combinada com inteligência artificial para criar arte. O sistema pode analisar uma imagem colocada na frente da máquina, que alimenta um algoritmo para produzir os movimentos do braço do robô.
No entanto, os artistas humanos não devem se preocupar que os senhores robóticos os substituam, argumentou Ahmed Elgammal, diretor do Laboratório de Arte e Inteligência Artificial da Universidade Rutgers, no The New York Times no ano passado.
"Embora a definição de arte esteja em constante evolução, em sua essência, é uma forma de comunicação entre os humanos", escreveu ele. “Sem um artista humano por trás da máquina, a IA pode fazer pouco mais do que brincar com a forma, seja manipular pixels em uma tela ou notas em um livro musical. artista e público."
Depois de dar uma olhada no trabalho de DALL-E, entendo o ponto de Elgammal de que as imagens criadas por IA não são arte. Por outro lado, eles são melhores do que qualquer arte que eu poderia criar. Então, realmente, qual é a diferença?