Geek

Robô chamado Emo impressiona ao sincronizar lábios e expressões faciais como um humano

Pesquisadores da Universidade Columbia apresentaram um robô que chama atenção logo nos primeiros segundos. Batizado de Emo, ele permanece imóvel até ouvir um som. Assim que a fala começa, seus lábios se movem com precisão surpreendente, formando palavras e até acompanhando o ritmo de uma música. O estudo foi publicado recentemente na revista Science Robotics.

Emo é basicamente uma cabeça robótica coberta por uma pele de silicone flexível. Por baixo dessa superfície estão 26 pequenos motores capazes de empurrar e puxar com extrema precisão. Esse conjunto permite criar movimentos suaves e silenciosos, reproduzindo a forma como vogais, consoantes e até notas cantadas surgem no rosto humano.

O projeto foi liderado por Yuhang Hu durante seu doutorado no laboratório Creative Machines, comandado por Hod Lipson. Em vez de programar manualmente cada som e movimento, a equipe apostou em aprendizado por observação. O robô foi colocado diante de um espelho e passou a fazer milhares de expressões aleatórias. Ao observar seu próprio reflexo, Emo começou a entender como os comandos enviados aos motores se transformavam em movimentos reais do rosto.

Depois dessa fase, veio o contato com o mundo real. Emo passou horas assistindo a vídeos no YouTube com pessoas falando e cantando em diferentes idiomas. O sistema aprendeu a associar ondas sonoras aos formatos da boca em cada quadro do vídeo. Não houve tradução de palavras. O foco foi ligar som e movimento de forma direta. Isso permitiu que o robô reproduzisse falas em francês, árabe e chinês sem treinamento específico nesses idiomas.

Nos testes, Emo mostrou um desempenho sólido ao articular palavras de forma clara em diferentes situações. Ele também cantou uma faixa de um álbum gerado por inteligência artificial, acompanhando mudanças de ritmo e sustentando vogais com naturalidade. Alguns sons ainda são difíceis, como consoantes mais explosivas e movimentos de lábios arredondados, mas os resultados já impressionam.

A diferença para robôs tradicionais está na combinação de hardware e aprendizado. Rostos humanos usam dezenas de músculos ligados diretamente à voz. A maioria dos robôs tem poucos atuadores e segue padrões rígidos, o que gera expressões artificiais. Emo foge disso ao usar muitos motores, uma pele flexível e um método de aprendizado mais próximo da realidade.

Durante uma conversa, grande parte da nossa atenção vai para os lábios. Quando o movimento não combina com o som, a sensação é estranha. Emo reduz esse efeito de forma significativa. Integrado a modelos de linguagem, ele abre caminho para robôs que entendem melhor o tom, o ritmo e o contexto de uma conversa. É um passo importante para tornar a comunicação entre humanos e máquinas mais natural.

Veja mais sobre tecnologia!

Fagner Lopes

CEO Presidente e fundador da Obewise Entertainment Network, escritor, biomédico e amante de jogos eletronicos, mais precisamente DOTA 2. Redator do site e artista na Obewise Radio Network.

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Adblock detectado

Por favor, considere apoiar-nos, desativando o seu bloqueador de anúncios