O novo modelo de robótica Gemini da Google DeepMind, baseado no Gemini 2.0, é o mais avançado já criado, permitindo que uma variedade de robôs execute uma gama mais ampla de tarefas do mundo real do que nunca.
O Gemini Robotics utiliza a compreensão do mundo pelo modelo para se adaptar a situações novas e resolver uma grande variedade de tarefas imediatamente, incluindo aquelas que nunca foram treinadas antes.
Ele também consegue lidar com novos objetos, instruções diversas e ambientes desconhecidos, enquanto monitora constantemente seu entorno, detecta mudanças no ambiente ou nas instruções e ajusta suas ações de acordo.
A destreza foi significativamente aprimorada, o que significa que os robôs agora podem realizar tarefas complexas e de várias etapas que exigem manipulação precisa, como dobrar origamis ou colocar um lanche em uma bolsa com zíper.
Junto com o Gemini Robotics, estamos introduzindo um modelo avançado de visão e linguagem chamado Gemini Robotics-ER (abreviação de “embodied reasoning”, ou “raciocínio incorporado”).
Esse modelo melhora a compreensão do mundo pelo Gemini de maneiras essenciais para a robótica, com foco especial no raciocínio espacial, e permite que roboticistas o conectem a seus controladores de baixo nível existentes”, explicou Carolina Parada, Diretora Sênior e Chefe de Robótica da Google DeepMind.
Com essa inovação, a Google DeepMind está levando a inteligência artificial para um novo patamar, integrando-a de forma mais profunda e funcional ao mundo físico, com aplicações que podem revolucionar desde a indústria até o cotidiano.
Veja mais sobre tecnologia.