![](https://files.tecnoblog.net/wp-content/uploads/2022/04/microsoft_capa-1_tb-1060x596.jpg)
A Microsoft revelou nessa quinta-feira (18) o VASA-1, IA generativa capaz de criar avatares hiper-realistas para videochamadas. Basicamente, a VASA-1 cria um deepfake do usuário e dispensa o uso de webcam durante reuniões. Para criar o avatar, o framework precisa de apenas uma imagem e um áudio de 1 minuto ou mais do usuário.
A VASA -1, como mostra a Microsoft sem anúncio do estrutura, permite que o usuário escolha vários presets para o vídeo que será exibido na videochamada. É possível, por exemplo, escolher a quantidade de zoom, a posição do rosto e as emoções. A Microsoft informou que não há previsão de lançamento do VASA-1.
Avatares para videochamadas sem webcam
O VASA-1 tem como função principal permitir a participação de videochamadas sem webcams. Porém, todo mundo que já participou de uma reunião online pode pensar que ela tem uma outra aplicação: exibir um deepfake do nosso rosto para aqueles dias que não estamos bem para abrir a câmera — seja por um dia de calor, estar embaixo das cobertas em um dia frio ou apenas por se sentir acabado.
Segundo a Microsoft, nos primeiros testes com o framework foi possível gerar vídeos de 45 fps em aplicações offline. Já em confirmação, o fps cai para 40 e a latência fica em 170 ms — testados realizados em um desktop com uma GPU RTX 4090. Os vídeos têm 512 x 512 pixels de tamanho.
Por mais que não haja previsão de lançamento do framework, é natural imaginar que ele deva estrear primeiro no Microsoft Teams — caso seja lançado um dia. Contudo, a Microsoft pode lucrar fornecendo a API do VASA-1 para outras empresas.
Nova ferramenta, problemas de sempre
O anúncio da Microsoft traz coleções de vídeos mostrando o uso do VASA-1 — e todas as pessoas na demonstração são imagens criadas por IA. Assistindo aos vídeos com mais atenção, você percebe os erros comuns das IAs de vídeos e deepfakes. Um dos exemplos conta com os dentes do personagem crescendo de tamanho durante alguns trechos.
![Dentes do avatar crescendo e mudando de tamanho no decorrer do vídeo (Imagem: Reprodução/Tecnoblog)](https://files.tecnoblog.net/wp-content/uploads/2024/04/dentes-crescendo-vesa-1.png)
No vídeo sobre o uso de diferentes emoções, podemos notar que a orelha direita do homem (esquerda de quem vê) é muito estranha e chega a mexer em alguns momentos — até com um pedaço da parte interna surgindo.
Com informações: MSPowerUser e Desenvolvedores XDA