Google lanzó Gemini 2.5 Computer Use, conozca sus novedosas características

¿Quieres operar este fin de semana? Los índices sintéticos siguen activos → Explorar opciones.

Espacio patrocinado

La carrera armamentista en el terreno de la inteligencia artificial (IA) se acelera con los recientes lanzamientos de OpenAi y Alphabet. Hace pocas horas, la matriz de Google lanzó la nueva versión de su modelo de IA, Gemini 2.5 Computer Use. Se trata de una iniciativa diseñada para competir directamente con los agentes de OpenAI.

Vale la pena mencionar que el lanzamiento de Google se produce apenas un día después de que OpenAI anunciara nuevas aplicaciones para sus agentes. Durante el Dev Day 2025, la popular startup liderada por Sam Altman anunció nuevas aplicaciones para su producto estrella ChatGPT, las cuales fortalecen las capacidades de los agentes de AI.

Sin embargo, Google no está dispuesta a darle ventajas a sus rivales en esta carrera frenética. Así, sin esperar a un evento u ocasión especial, la gigante tecnológica anunció la nueva versión de Gemini. Esta nueva herramienta de Google tiene la capacidad de usar los navegadores de la misma manera que lo hacen las personas.

Esto último incluye la capacidad de hacer scroll o escribir en los buscadores para encontrar sitios y cumplir tareas, remarca la presentación. Las características de este modelo le asemejan a las de sus rivales de OpenAI y Anthropic, pero también cuenta con algunas particularidades que le hacen diferente y que incluso le podrían dar ventajas.

Google publicó algunos videos demo en los que se muestra el funcionamiento de esta herramienta.

Características del Gemini 2.5 Computer Use que lanzó recientemente Google

El nuevo modelo de Gemini que lanzó Google hace pocas horas tienen las cualidades particulares de que solamente cuenta con acceso a navegadores.

A diferencia de sus rivales, este no profundiza en operaciones que tengan que ver con sistemas operativos o un ambiente más profundo de los computadores. Esto le convierte en una alternativa más ligera y menos comprometida con la seguridad y el intrincado conjunto de factores que esto implica. 

Considerando este último factor, se puede decir que el nuevo modelo de Gemini podría tener algunas ventajas. Entre las funciones particulares de ese modelo en los browsers, se cuenta una avanzada interacción con la Web a pedido de los usuarios. 

De acuerdo con la citada publicación, cuenta con avanzadas «capacidades de razonamiento y comprensión visual» para analizar las solicitudes de los usuarios y ejecutar una tarea. Entre estas tareas se incluyen algunas como rellenar y enviar un formulario, entre muchas otras.

Además, el modelo se puede utilizar para pruebas de UI o para navegar en interfaces creadas para personas que no tiene una API u otra conexión directa disponible. Este modelo de Gemini que lanzó Google está disponible para desarrolladores en Google AI Studio y Vertex AI. Asimismo cuenta con una demo en Browserbase donde se puede probar con algunas tareas básicas.

Alejandro Gil
Alejandro Gil
Alejandro es periodista especializado en la cobertura del mundo financiero.

Deja un comentario

Columnistas destacados

Comunicados de Prensa

Asia