21
Dom, Jul

Já ouviu falar de deepfake e os desafios que ele coloca?

Saber Mais
Tipografia

Nós estamos acostumados a falar do fakenews (notícias falsas) mas, agora, a sofisticação de tecnologias de manipulação de vídeo é que está a levantar preocupações. Sobretudo por causa do seu uso malicioso, especialmente na política.

 Já ouviu falar de deepfake e os desafios que ele coloca?

No início de junho, começou a circular no Instagram um vídeo em que o fundador do Facebook, Mark Zuckerberg, aparece a fazer um anúncio surpreendente. “Imagine isso por um segundo: um homem com controle total sobre os dados roubados de bilhões de pessoas, seus segredos, suas vidas, seu futuro. Eu devo isso à Spectre. Eles me mostraram que quem controla os dados controla o futuro.” 

Um observador mais atento perceberia que o timbre da voz era bastante diferente do timbre do executivo. E as palavras, que normalmente estão na boca de detratores da rede social, não de seu dono, evidentemente, nunca foram ditas por Zuckerberg. 

A peça é o que se chama de deepfake, ou fake profundo, termo que alude a uma fraude sofisticada, difícil de identificar à primeira vista e que facilmente poderia confundir espectadores mais desatentos ou desinformados.

Em cinco dias, o vídeo chegou a quase 60 mil visualizações. O Facebook, dono do Instagram, optou por não removê-lo. A reação da empresa era aguardada, pois em maio ela tinha decidido manter no ar um vídeo adulterado com a presidente do congresso americano, deputada Nancy Pelosi. Nas imagens manipuladas, a voz da congressista sai arrastada, como se estivesse embriagada ou doente. 

A peça com Mark Zuckerberg faz parte de um projeto dos artistas britânicos Bill Posters e Daniel Howe. Spectre é o nome de uma instalação da dupla, em cartaz em uma galeria em Sheffield, Inglaterra. Inclui deepfakes da celebridade Kim Kardashian, do cantor Freddie Mercury, do presidente americano Donald Trump e do artista plástico Marcel Duchamp, entre outros. 

Segundo o texto de apresentação, a mostra quer “revelar os segredos da Indústria da Influência Digital”. Sua proposta é se valer de tecnologias e técnicas utilizadas pelas companhias do Vale do Silício, empresas de publicidade e grupos políticos para expor “como nossos comportamentos são previstos e influenciados, tanto online como na cabine de votação”. 

A evolução da tecnologia 

A tecnologia utilizada no vídeo com Zuckerberg foi desenvolvida pela empresa israelita de inteligência artificial Canny AI. Em maio, ela divulgou um vídeo de demonstração do seu software, conhecido como VDR, sigla para Video Dialogue Replacement (substituição de diálogo de vídeo, em português). 

Esse vídeo começa com uma imagem de Donald Trump. Quando ele abre a boca, ouve-se o primeiro verso de “Imagine”, na voz de John Lennon. Em seguida, aparece o líder russo Vladimir Putin, que emenda o segundo verso da canção. Conforme o vídeo avança, aparecem outros governantes cantando.

Em 2018, quando falava-se em deepfake, o foco, geralmente, eram falsificações que transplantavam o rosto de um personagem para o corpo de outro. Com isso, era possível, por exemplo, fazer com que uma atriz famosa de Hollywood parecesse participando de um filme pornográfico. 

Outra linha em que pesquisadores e empresas vêm trabalhando é a inserção de movimentos faciais e labiais realizados por um ator oculto, captados pelo software e recriados no rosto do personagem-alvo. É o que faz a tecnologia do projeto Face2Face, desenvolvida pela Universidade de Stanford, nos Estados Unidos. O vídeo abaixo permite compreender a eficácia do método.

Para a dupla fundadora do Canny AI, ambos com experiência em áreas de tecnologia do exército israelita, o Face2Face “não era muito preciso em termos da sincronia labial”. Os desenvolvedores procuraram melhorar esse aspecto no seu produto. 

O software da empresa recebe dados de imagens e movimentos labiais do personagem a ser manipulado, incluindo tomadas de ângulos diferentes. Por exemplo, 60 frames de uma imagem lateral do presidente Trump foram suficientes para servir de base para a produção de outros movimentos com essa perspectiva. Nuances como perspectiva, iluminação e oscilação da luz são levados em conta. 

É um volume de informações que só é capaz de ser processado por meio de “deep learning”, método de inteligência artificial em que o computador é capaz de aprender e relacionar uma quantidade imensa de informações. 

São dois algoritmos em ação: um replica os dados e outro avalia o grau de sucesso da simulação. Chamada GAN, sigla em inglês para redes generativas adversariais, a abordagem foi criada por um pesquisador do Google. 

A escolha da Canny AI pelo vídeo de “Imagine” foi uma tentativa de ir contra a percepção negativa que existe a respeito desse tipo de tecnologia. “Queríamos fazer algo com uma forte mensagem unificadora e mostrar usos positivos”, relatou o cofundador Omer Ben-Ami ao site FX Guide. 

Segundo a empresa, sua invenção pode ser aplicada em trabalhos de dublagem, reutilização de imagens existentes e na tradução de vídeos de treinamento para diferentes idiomas. 

O uso na política 

Técnicas de manipulação tão sofisticadas têm um potencial de dano enorme se usadas maliciosamente. Os deepfakes em que um rosto é aplicado em outro corpo já são alvo de atenção do Departamento de Defesa dos Estados Unidos desde 2018.

O órgão criou um software de análise de vídeos que consegue detectar pistas subtis em imagens manipuladas. Um desses sinais é que as caras transplantadas raramente ou nunca piscam. Mesmo quando o fazem, o movimento não parece natural. 

Em abril de 2019, o BuzzFeed publicou um vídeo em que o ex-presidente Barack Obama aparece dizendo “coisas que nunca diria”. A voz é, na verdade, do ator Jordan Peele, o que é revelado a certa altura do filme. Segundo o site, a intenção foi soar um alerta sobre “nossa época perigosa”, em que é preciso se apoiar em fontes noticiosas confiáveis. 

Com o envolvimento de diversas empresas e usuários individuais no desenvolvimento de ferramentas desse tipo, tornando-as cada vez mais acessíveis e fáceis de usar, é razoável prever um aumento na sua utilização num futuro próximo. 

 

TN - Redação