Há excelentes novidades atinentes à Gemini Robotics. A plataforma baseada no Gemini 2.0 da Google DeepMind, que agora acaba de apresentar dois modelos avançados de IA projetados para robótica.
Com efeito, os novos modelos estabelecem as bases para uma nova geração de robôs úteis. Na prática, utilizando as capacidades avançadas do Gemini para melhorar a generalidade, a interatividade e a destreza.
Há 4 grandes novidades do Gemini Robotics
Seguem-se os principais destaques:
- O primeiro, Gemini Robotics, é um modelo de visão-linguagem-ação que permite aos robôs realizar tarefas do mundo real com generalidade, interatividade e destreza. Adapta-se a novas situações, entende instruções em linguagem natural e pode manipular objetos com precisão. O Gemini Robotics destaca-se na resolução de novas tarefas, no manuseamento de novos objetos e na interação com ambientes dinâmicos. Este modelo também pode realizar tarefas complexas, como dobrar origami e embalar lanches. Além disso, é adaptável a várias plataformas robóticas, desde sistemas de dois braços até robôs humanoides como o Apollo da Apptronik, permitindo que conclua tarefas do mundo real de forma eficaz.
- O segundo, Gemini Robotics-ER, concentra-se no raciocínio espacial e aprimora a compreensão do mundo do Gemini para robótica, permitindo um melhor controlo e segurança nas ações robóticas. Gemini Robotics-ER é um modelo avançado de visão-linguagem projetado para melhorar o raciocínio espacial e melhorar a compreensão do Gemini para robótica. Melhora significativamente habilidades como a detecção 3D e apontamentos. O modelo pode compreender intuitivamente objetos, como agarrar numa caneca de café, e planear ações seguras. O Gemini Robotics-ER pode lidar com tarefas como percepção, estimativa de estado, compreensão espacial e geração de código com taxas de sucesso mais altas do que o Gemini 2.0. Este modelo também utiliza aprendizagem em contexto para resolver problemas quando a geração de código é insuficiente, aprendendo com algumas demonstrações humanas.
Investigação de segurança e robótica
- Parceiros e testadores confiáveis: A Google está a trabalhar em parceria com a Apptronik para avançar a próxima geração de robôs humanoides. Além disso, também a tornar o nosso modelo Gemini Robotics-ER disponível para testadores confiáveis, incluindo Agile Robots, Agility Robots, Boston Dynamics e Enchanted Tools.
- Para promover a investigação sobre segurança em robótica na academia e na indústria, estamos a lançar novos benchmarks e estruturas para a segurança semântica em IA e robótica. Estamos a adotar uma abordagem holística para a nossa investigação, combinando segurança física, de conteúdo e semântica.
A Google DeepMind enfatiza o desenvolvimento responsável e a segurança, garantindo que os robôs possam trabalhar com segurança ao lado dos humanos.
Por fim, podemos encontrar ainda mais novidades na publicação oficial da própria empresa, com mais detalhes técnicos.
Fica ainda mais conectado: