Inteligencia Artificial

ChatGPT ahora puede leer aplicaciones de escritorio de tu Mac

Compartir
Compartir

El desarrollo continuo de la inteligencia artificial de OpenAI ha dado un paso importante al integrar ChatGPT con diversas aplicaciones en los dispositivos Mac. Esta nueva funcionalidad, anunciada el jueves, permite que la aplicación de escritorio de ChatGPT en macOS sea capaz de leer y entender fragmentos de código dentro de varias aplicaciones orientadas a desarrolladores, como VS Code, Xcode, TextEdit, Terminal e iTerm2. Esta integración supone un avance significativo para los programadores, quienes ya no tendrán que copiar y pegar manualmente su código en la interfaz de ChatGPT para recibir sugerencias o soluciones.

La nueva característica «Trabajar con aplicaciones»

Esta funcionalidad, llamada «Work with Apps», permite que ChatGPT reciba directamente las secciones de código en las que el usuario está trabajando, proporcionándole contexto adicional en tiempo real junto con el mensaje o solicitud que se le envía. Es un cambio fundamental para quienes desarrollan software, ya que facilita la interacción con la IA sin tener que interrumpir el flujo de trabajo. Aunque ChatGPT aún no tiene la capacidad de escribir código de manera autónoma dentro de las aplicaciones de desarrollo, como lo hacen herramientas especializadas como Cursor o GitHub Copilot, esta nueva opción marca el comienzo de un proceso hacia una mayor integración entre los sistemas de inteligencia artificial y las aplicaciones de escritorio.

A pesar de que esta nueva herramienta está lejos de representar un agente de inteligencia artificial completo que podría automatizar tareas dentro del entorno del usuario, OpenAI ve este paso como uno de los componentes clave para construir sistemas de IA más avanzados. Uno de los mayores desafíos para estos agentes es hacer que comprendan el contenido completo de la pantalla de la computadora del usuario, en lugar de limitarse solo a procesar solicitudes o respuestas predeterminadas.

El futuro de ChatGPT con otras aplicaciones

Por ahora, esta función está centrada en las aplicaciones de codificación, dado que los asistentes de programación basados en inteligencia artificial se han convertido en uno de los casos de uso más populares para los modelos de lenguaje como el que utiliza ChatGPT. La característica está disponible para los usuarios de ChatGPT Plus y Teams desde ahora, y OpenAI tiene previsto implementarla para los usuarios de Enterprise y Edu en las próximas semanas. En el futuro, OpenAI espera expandir esta capacidad para trabajar con otros tipos de aplicaciones, especialmente aquellas basadas en texto, como las utilizadas en tareas de escritura.

Durante una demostración con TechCrunch, un empleado de OpenAI mostró cómo ChatGPT interactuaba con un proyecto simple en Xcode que modelaba el sistema solar, aunque sin la presencia de la Tierra. Al seleccionar una pestaña de Xcode dentro de la aplicación de ChatGPT, el empleado indicó que la IA debía observar el proyecto y añadió una solicitud para que completara el código con el planeta faltante. La inteligencia artificial logró generar la línea de código necesaria para representar la Tierra de manera coherente con el resto del formato del proyecto. Sin embargo, el código generado por ChatGPT aún tuvo que ser copiado y pegado manualmente de vuelta en el entorno de desarrollo.

Este tipo de interacción resalta la naturaleza actual de esta herramienta como un asistente en lugar de un agente autónomo. OpenAI señala que, a pesar de las limitaciones, este tipo de colaboración entre el usuario y la IA es fundamental para avanzar en el desarrollo de agentes de inteligencia artificial capaces de interactuar de manera más profunda con el entorno digital del usuario.

Retos y perspectivas futuras

La implementación de esta funcionalidad en macOS se apoya en la API de accesibilidad de macOS, que permite a ChatGPT leer texto y traducirlo para su procesamiento. Aunque esta tecnología ha sido confiable durante casi dos décadas en aplicaciones comunes, no puede capturar elementos visuales como fotos o videos, lo que limita la capacidad de la IA para entender ciertos aspectos del contenido que no son estrictamente textuales. Para aplicaciones como VS Code, los usuarios deben instalar una extensión especial para que ChatGPT pueda acceder al contenido de manera eficiente.

La expansión futura de esta característica dependerá de cómo OpenAI logre superar las limitaciones de la API de accesibilidad y se adapte a aplicaciones que no son compatibles con esta tecnología. Competidores como Anthropic ya están explorando enfoques alternativos, como el análisis de capturas de pantalla para interpretar otros tipos de aplicaciones, aunque este método todavía presenta varios desafíos, como la lentitud y la imprecisión.

Con el inminente lanzamiento de herramientas como «Operator», un agente de propósito general de OpenAI previsto para principios de 2025, la compañía está abriendo el camino hacia sistemas de inteligencia artificial más completos y autónomos. Sin embargo, por ahora, la integración con aplicaciones de programación marca solo el inicio de lo que promete ser una transformación más amplia de cómo interactuamos con nuestras herramientas digitales a través de la inteligencia artificial.

Compartir

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *