El miércoles, Google presentó su primer agente de inteligencia artificial (IA) capaz de realizar acciones en la web, una propuesta innovadora desarrollada por su división DeepMind bajo el nombre de Project Mariner. Este prototipo, que utiliza la tecnología Gemini, tiene la capacidad de tomar control del navegador Chrome, mover el cursor por la pantalla, hacer clic en botones y completar formularios, emulando de manera sorprendente cómo un ser humano interactuaría con sitios web. Este avance marca un paso crucial en la evolución de la inteligencia artificial, permitiendo que los usuarios deleguen tareas complejas en la red a agentes virtuales, sin necesidad de intervención directa.
El cambio en la interacción con la web
El lanzamiento de Project Mariner es solo el comienzo de una serie de experimentos que Google está llevando a cabo con su tecnología Gemini para transformar la manera en que los usuarios interactúan con la web. La compañía planea mover a los usuarios de la interacción directa con los sitios web hacia la mediación de un sistema de IA generativa que se encargue de realizar todas las acciones necesarias. Este cambio, según los ejecutivos de Google, representa una “nueva era” en la experiencia del usuario (UX), en la que la IA toma las riendas de las tareas en línea. La implicación de este desarrollo podría ser profunda, afectando no solo a los usuarios individuales, sino también a millones de empresas, desde medios de comunicación hasta minoristas, que dependen de la interacción humana para atraer tráfico a sus sitios web.
En una demostración realizada con TechCrunch, la directora de Google Labs, Jaclyn Konzelmann, mostró cómo Project Mariner funciona. Tras instalar una extensión en el navegador Chrome, un cuadro de chat aparece en la parte derecha de la pantalla. El usuario puede dar instrucciones al agente, como por ejemplo “crear un carrito de compras basado en esta lista de productos”. En este caso, el agente se dirigió al sitio web de Safeway, una tienda de comestibles, y comenzó a buscar y agregar artículos a un carrito de compras virtual. Aunque la interacción fue clara, la respuesta del agente fue algo lenta, con un retraso de aproximadamente cinco segundos entre cada movimiento del cursor, y en ocasiones, el agente se detenía para solicitar aclaraciones sobre los productos seleccionados, como la cantidad exacta de zanahorias que se debían agregar.
Sin embargo, Project Mariner tiene algunas limitaciones evidentes. No puede completar el proceso de pago, ya que no está diseñado para introducir datos sensibles como números de tarjetas de crédito o información de facturación. Además, no acepta cookies ni firma acuerdos de términos de servicio, lo que asegura que los usuarios mantengan cierto control sobre su interacción con la web. Esta decisión de diseño tiene como objetivo proteger la privacidad y la seguridad del usuario.
Impacto en el futuro de la web
Este avance de Google también plantea preguntas sobre el futuro de los sitios web y su interacción con los usuarios. Dado que el agente de IA se utiliza directamente en la pantalla del ordenador del usuario, los propietarios de sitios web pueden sentirse tranquilos al saber que todavía se retiene la atención de los usuarios en sus páginas. Sin embargo, el hecho de que los agentes de IA asuman tareas que normalmente requerirían la acción humana podría significar una reducción del compromiso de los usuarios con los sitios que visitan. A largo plazo, esto podría transformar por completo el modelo de negocios de muchas empresas, que históricamente han dependido del tráfico web generado por visitas humanas.
Jaclyn Konzelmann destaca que este cambio representa un “paradigma completamente nuevo” en la experiencia del usuario, y Google aún está evaluando cómo debería evolucionar la interacción entre los usuarios, los agentes de IA y los creadores de contenido en la web. Este desafío no solo implica la reconfiguración de los sitios web, sino también la adaptación de los sistemas de IA para que puedan trabajar de manera más efectiva con los usuarios y las marcas.
Además de Project Mariner, Google presentó otros agentes de IA destinados a tareas más específicas. Uno de ellos, denominado Deep Research, está diseñado para ayudar a los usuarios a explorar temas complejos mediante la creación de planes de investigación multietapa. Este agente busca competir con herramientas similares, como o1 de OpenAI, que también realizan razonamientos multietapa. Sin embargo, el agente de Google no está destinado a resolver problemas matemáticos o lógicos complejos, ni a hacer análisis de datos. Otro agente, Jules, está dirigido a desarrolladores y permite integrar IA en flujos de trabajo en GitHub, lo que facilitaría la modificación directa del código en esa plataforma.
Google también está trabajando en un agente de IA para ayudar en la navegación de videojuegos, aprovechando su vasta experiencia en la creación de IA para juegos como Clash of Clans. Aunque aún no se ha anunciado una fecha de lanzamiento, este proyecto está siendo desarrollado en colaboración con empresas del sector de los videojuegos.
En resumen, el despliegue de Project Mariner y los agentes de IA asociados marcan un hito en la evolución de la tecnología, con implicaciones significativas para la forma en que los usuarios interactúan con la web y para las empresas que dependen de la interacción directa con los consumidores. Aunque todavía está en una fase temprana, el impacto de estos avances podría cambiar las reglas del juego en la industria digital en los próximos años.