Google lança IA que usa sites e aplicativos sozinha
Modelo Gemini 2.5 executa cliques, digitação e preenchimento de formulários em navegadores e celulares, segundo o Google DeepMind
O Google DeepMind apresentou nesta terça, 7, o Gemini 2.5 Computer Use, um novo modelo de inteligência artificial capaz de usar sites e aplicativos de forma autônoma.
A tecnologia permite que a IA clique em botões, digite textos, preencha formulários e navegue por páginas da internet como uma pessoa faria. O recurso está disponível em prévia no Google AI Studio e no Vertex AI, plataformas de desenvolvimento do Google.
A ferramenta é uma extensão do modelo Gemini 2.5 Pro, com foco em entender imagens e raciocinar sobre o que aparece na tela. Ela funciona em um ciclo.
A cada etapa, a IA recebe um pedido do usuário, uma imagem da tela atual e o histórico do que já foi feito. Em seguida, decide a próxima ação, como clicar, rolar a página ou inserir um texto. Depois que a ação é executada, o sistema envia uma nova captura de tela para que o processo continue até a tarefa ser concluída.
O Google explica que o modelo foi criado para lidar com tarefas que ainda dependem de interação direta com a interface. Isso inclui, por exemplo, preencher cadastros, fazer login em sites e organizar informações em plataformas online.
Segundo a empresa, o objetivo é permitir que agentes de software realizem tarefas complexas em ambientes visuais, e não apenas em sistemas com comandos estruturados.
Nos testes divulgados pelo Google DeepMind, o Gemini 2.5 Computer Use teve desempenho melhor que modelos concorrentes em tarefas de controle de navegador e aplicativos móveis.
A empresa afirma que a ferramenta executa ações com menor tempo de resposta e maior precisão. A avaliação foi feita com apoio da Browserbase, que mede o desempenho de agentes automatizados.
A companhia também anunciou medidas de segurança. O modelo foi treinado para evitar ações indevidas, como tentar enganar sistemas de segurança ou acessar informações sigilosas.
Os desenvolvedores podem configurar confirmações obrigatórias em operações sensíveis e usar um serviço que analisa cada comando antes de executá-lo. O Google recomenda que todo agente criado com o modelo seja testado extensivamente antes de ser lançado.
O Gemini 2.5 Computer Use já é usado em projetos internos do Google, como o sistema de testes do Firebase e a área de pagamentos.
Empresas que participaram do programa de acesso antecipado relataram que a IA conseguiu realizar tarefas 50% mais rápido e com até 18% mais precisão em comparação com outras soluções.
O modelo está disponível em prévia pública e pode ser testado nas plataformas Google AI Studio e Vertex AI.
Os comentários não representam a opinião do site; a responsabilidade pelo conteúdo postado é do autor da mensagem.
Comentários (0)