Inteligencia Artificial

Anthropic lanza un nuevo modelo de Inteligencia Artificial capaz de controlar tu PC

Compartir
Compartir

La empresa de inteligencia artificial (IA) Anthropic ha dado un paso más hacia la automatización de tareas de oficina con el lanzamiento de una versión mejorada de su modelo Claude 3.5 Sonnet. Este avance supone una innovación significativa en el campo de los asistentes virtuales, ya que la nueva IA no solo es capaz de realizar investigaciones y responder correos electrónicos, sino que ahora también puede interactuar con cualquier aplicación de escritorio, imitando el comportamiento de un ser humano frente a un ordenador.

Este desarrollo ha estado en el horizonte de la empresa desde la primavera pasada, cuando presentó su visión a los inversores de construir una IA que pudiera automatizar gran parte de los trabajos administrativos y de soporte. Anthropic describió esta visión como un «algoritmo de próxima generación para el autoaprendizaje de IA», el cual, según sus proyecciones, podría transformar sectores enteros de la economía en un futuro no muy lejano.

Una IA que entiende y controla el ordenador

El martes, Anthropic anunció que su modelo Claude 3.5 Sonnet ha sido mejorado para poder entender y manejar cualquier aplicación de escritorio. Esta capacidad se implementa a través de una nueva API llamada «Computer Use», la cual ya se encuentra en beta abierta. Con esta herramienta, la IA puede emular movimientos de teclado, clics de botones y gestos del ratón, simulando así la interacción de una persona frente al ordenador.

Anthropic explicó en su blog que Claude puede observar lo que ocurre en la pantalla mediante capturas de imagen, y con esa información determina cuántos píxeles debe mover el cursor para hacer clic en el lugar correcto. El modelo está entrenado para «ver» lo que sucede en la pantalla y utilizar las herramientas de software disponibles para completar tareas. Los desarrolladores pueden comenzar a probar la API de «Computer Use» a través de las plataformas de Amazon Bedrock y Google Cloud Vertex AI.

Este modelo también incluye mejoras en el rendimiento en comparación con su versión anterior, lo que permitirá a las aplicaciones de Claude trabajar de manera más eficiente, aunque sin el uso de la nueva API.

Automatización de tareas: un mercado en crecimiento

Aunque la idea de automatizar tareas en un ordenador no es completamente nueva, el modelo de Anthropic aporta una nueva capa de sofisticación a este tipo de herramientas. Desde hace años, empresas de software de automatización de procesos robóticos (RPA) ofrecen soluciones similares, pero el auge de los llamados «agentes de IA» ha ampliado el alcance de esta tecnología. Estos agentes son sistemas de IA diseñados específicamente para automatizar tareas en software, y están ganando terreno rápidamente.

Según una encuesta de Capgemini, el 10% de las organizaciones ya están utilizando agentes de IA, y se espera que un 82% los integren en los próximos tres años. Empresas como Salesforce y Microsoft han anunciado herramientas para crear sus propios agentes de IA, mientras que OpenAI también está trabajando en su propia versión.

Lo que distingue a Claude 3.5 Sonnet es su capacidad para ejecutar comandos a nivel de escritorio. Esto significa que la IA puede usar cualquier sitio web y aplicación, todo bajo la supervisión humana que proporciona indicaciones específicas. Por ejemplo, un usuario podría pedirle a Claude que complete un formulario utilizando datos tanto del ordenador como de internet, y la IA convertiría estas indicaciones en comandos informáticos, como mover el cursor, hacer clic o escribir.

Empresas como Replit y Canva ya están explorando el potencial de este modelo. Replit ha utilizado una versión temprana del 3.5 Sonnet para crear un «verificador autónomo» capaz de evaluar aplicaciones mientras se desarrollan, mientras que Canva busca cómo podría integrar este modelo en sus procesos de diseño y edición.

Desafíos y riesgos de la IA con acceso al escritorio

Aunque las capacidades de Claude 3.5 Sonnet son impresionantes, aún presenta desafíos. En pruebas diseñadas para medir la capacidad de los agentes de IA para ayudar en tareas como la modificación de reservas de vuelos o la gestión de devoluciones de productos, el modelo tuvo un éxito parcial. En particular, falló en aproximadamente un tercio de las tareas y tuvo dificultades con acciones básicas como el desplazamiento o el zoom.

Estos problemas se deben, en parte, a la forma en que el modelo procesa las capturas de pantalla y las integra para comprender lo que ocurre en el ordenador. Anthropic admite que su sistema aún es lento y propenso a errores, por lo que anima a los desarrolladores a utilizarlo en tareas de bajo riesgo mientras continúan mejorando el modelo.

Además, surge la preocupación de si una IA con acceso a las aplicaciones de escritorio podría ser peligrosa. Investigaciones recientes han demostrado que los modelos de IA pueden ser engañados para realizar tareas dañinas, como adquirir un pasaporte falso en la dark web. Si una IA con acceso al escritorio se ve comprometida, podría abrir la puerta a ataques más sofisticados, como explotar vulnerabilidades de software para robar información personal.

Medidas de seguridad y el futuro de la IA en el entorno laboral

Anthropic es consciente de estos riesgos y ha implementado varias medidas de seguridad. Entre ellas, el modelo no está entrenado utilizando capturas de pantalla o indicaciones de los usuarios, y durante el entrenamiento no se le permite acceder a internet. Además, se han desarrollado mecanismos para «guiar» al modelo lejos de acciones consideradas de alto riesgo, como publicar en redes sociales o interactuar con sitios gubernamentales.

De cara al futuro, Anthropic se ha comprometido a continuar evaluando y mejorando sus medidas de seguridad para prevenir posibles abusos, especialmente a medida que se acerca la elección general en Estados Unidos, donde se temen intentos de manipulación electoral a través de IA.

Junto al lanzamiento del modelo Claude 3.5 Sonnet, Anthropic también anunció que una versión actualizada de su modelo Haiku, más económico y eficiente, estará disponible en las próximas semanas. Claude 3.5 Haiku igualará el rendimiento del modelo Claude 3 Opus en ciertos parámetros, pero a un menor coste y con mayor velocidad, lo que lo convierte en una opción atractiva para tareas que requieren grandes volúmenes de datos.

En definitiva, Anthropic está posicionando su tecnología para tener un impacto significativo en cómo las empresas y los desarrolladores interactúan con sus sistemas, abriendo la puerta a un futuro donde las tareas rutinarias puedan ser completamente automatizadas. Sin embargo, como toda nueva tecnología, el desafío está en encontrar un equilibrio entre el poder de la innovación y la seguridad de los usuarios.

Compartir

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *