Nova tecnologia da Meta transforma pequenos textos em vídeos curtos

SÃO PAULO, SP (FOLHAPRESS) - A Meta, antigo Facebook, lançou na quinta-feira (29) um sistema de inteligência artificial que gera vídeos curtos a partir de pequenos textos.

A ferramenta, chamada Make-A-Video, funciona assim: o usuário digita uma pequena frase, como "cachorro usando roupa de super-herói e capa vermelha voando pelos céus" e cria um vídeo de cinco segundos a partir disso.

No site oficial da ferramenta (makeavideo.studio), é possível assistir a pequenos vídeos gerados a partir de frases como "peixe-palhaço nadando por um coral de arrecife", "cavalo bebendo água" e "casal jovem andando na chuva forte".

A ferramenta nos oferece um spoiler do que deve estar vindo por aí quando se trata de generative artificial intelligence (inteligência artificial geradora, em tradução livre).

Esse tipo de inovação chega com desafios. Os modelos, por exemplo, precisam de computadores de altíssima performance. Além disso, para se gerar um vídeo curto são necessárias centenas de imagens.

Isso significa que só grandes empresas do setor de tecnologia seriam capazes de ter esse tipo de ferramenta num futuro próximo.

Tanmay Gupta, cientista e pesquisador no Allen Institute for Artificial Intelligence, disse à revista "MIT Technology Review" que os resultados da Meta são animadores. "Os vídeos mostram que o modelo é capaz de capturar formas em 3D conforme a câmera se move. Também têm alguma noção de profundidade e de iluminação", afirma.

Há, entretanto, bastante espaço para evoluir. É particularmente difícil, afirma ele, modelar interações complexas entre objetos.

"Eu adoraria ver esses modelos tendo sucesso e gerando uma sequência de interações, tipo ?O homem pega um livro da prateleira, coloca seus óculos e se senta para ler enquanto toma um copo de café?", disse Gupta à revista, exemplificando uma cena que demandaria interação de vários objetos.

Há receio de que, conforme a tecnologia se desenvolva, possa ser usada também como uma poderosa ferramenta para criar e disseminar informações falsas e deepfakes (vídeos falsos, mas extremamente realistas).

"Ao menos por ora, criar conteúdo falso que as pessoas talvez acreditem demanda algum esforço. No futuro, pode ser possível gerar esse tipo de conteúdo apenas apertando algumas teclas", disse o cientista.

Os pesquisadores que criaram o Make-A-Video proibiram imagens e palavras ofensivas no sistema, mas, com bancos de dados gigantes, é quase impossível remover todo o conteúdo potencialmente nocivo.

Um porta-voz da Meta afirma que o modelo, por enquanto, não deve ser disponibilizado ao público. "Como parte da pesquisa, continuaremos a explorar maneiras de mitigar potenciais riscos e aprimorar o modelo", afirmou a empresa.

Entre na comunidade de notícias clicando aqui no Portal Acessa.com e saiba de tudo que acontece na Cidade, Região, Brasil e Mundo!

CADERNOS

COLUNISTAS

ESPECIAIS

SERVIÇOS

Nova tecnologia da Meta transforma pequenos textos em vídeos curtos