Google presenta Gemini 2.5 “Computer Use”: inteligencia artificial que navega como usuario humano

El pasado 8 de octubre, Google reveló un nuevo modelo de inteligencia artificial bautizado Gemini 2.5 Computer Use que incorpora la capacidad de interactuar con páginas web y interfaces gráficas de usuario (UI) como lo haría una persona. Este modelo fue anunciado entre los avances de AI más recientes, y ya está disponible para desarrolladores a través de Google AI Studio y Vertex AI. The Verge


¿Qué ofrece este nuevo modelo?

  • Acciones automatizadas en navegador: Gemini 2.5 Computer Use puede abrir una página web, hacer clic, escribir, arrastrar elementos y otra serie de acciones predeterminadas (son 13 en total) para ejecutar tareas que normalmente requerirían intervención directa del usuario. The Verge
  • Flexibilidad para interfaces sin APIs: Una de las mayores ventajas es que puede funcionar en entornos donde no hay acceso directo mediante APIs. Por ejemplo, si un servicio web no ofrece endpoints claros o APIs bien documentadas, el modelo puede simular la interacción con la interfaz del usuario. The Verge
  • Aplicaciones prácticas diversas: Se prevé que esta capacidad será útil para pruebas automatizadas de interfaces, tareas administrativas repetitivas (como llenar formularios), navegación asistida en registros digitales, e incluso para facilitar la automatización en entornos corporativos donde acceder directamente al backend no siempre es posible. The Verge

Implicaciones y retos

  • Privacidad y seguridad: Permitir que una IA realice acciones en la interfaz de usuario implica riesgos si no hay una supervisión adecuada. Por ejemplo, podría interactuar con formularios engañosos o lidiar con sitios no seguros. Será crucial que Google y los desarrolladores aseguren modos seguros, permisos explícitos y revisiones de los comportamientos automatizados.
  • Experiencia del usuario: Aunque este tipo de automatización puede agilizar muchas tareas, hay riesgo de que errores en scripts de interacción generen frustraciones: clics inesperados, navegación indeseada o fallos si las interfaces cambian.
  • Despliegue escalable: En un entorno de uso masivo, el modelo tendrá que adaptarse a variaciones de diseño de páginas web, diferencias de idioma, interfaces móviles vs escritorio, versiones desactualizadas de sitios, etc. La robustez ante esos cambios será clave para su aceptación.

¿Qué significa para el ecosistema tecnológico?

El lanzamiento de Gemini 2.5 Computer Use representa un paso más hacia las IA agentes, con capacidades que van más allá de responder preguntas o generar contenido: se aproxima a hacer tareas prácticas en entornos digitales reales, como lo haría un usuario humano.

Empresas, herramientas de automatización, desarrolladores de pruebas de software y servicios digitales podrían beneficiarse de esta nueva capacidad. También plantea preguntas importantes sobre cómo regular interfaces automatizadas, cómo proteger datos y mantener la confianza del usuario.

admin

Un partido revolucionario, si en verdad está empeñado en hacer y dirigir la revolución no puede renunciar al legítimo derecho de ser o formar parte de la vanguardia histórica que en efecto haga y dirija la revolución socialista en nuestro país, es de hipócritas decir que se lucha sin aspirar a tomar el poder y mucho más aún si se pretende desarrollar lucha diciendo que no busca ser vanguardia cuando en los hechos se actúa en esa dirección.

Ver más
Relacionados
China acelera la carrera cuántica y enciende alertas en la comunidad científica internacional

La carrera por dominar la computación cuántica acaba de entrar en una nueva fase de tensión global. En las últimas …

Una luz nueva para la medicina: plataforma de resonancia magnética sin helio y con IA promete acelerar diagnósticos

Ayer 30 de noviembre de 2025 —y ratificado públicamente hoy— Philips anunció el lanzamiento de su nueva plataforma de resonancia …

Científicos logran teletransportar información cuántica mediante luz: un paso clave hacia el internet cuántico

Este 29 de noviembre de 2025 un equipo de investigadores anunció un avance decisivo en el campo de la comunicación …