Los chatbots actuales, como Gemini y ChatGPT, podrían ser solo el comienzo de una revolución en la inteligencia artificial (IA). Todo indica que el siguiente gran avance en esta industria vendrá con los agentes: programas especializados en controlar sistemas o aplicaciones para realizar diversas tareas. Google ha dado un paso significativo en esta dirección.
El gigante tecnológico de Mountain View ha presentado este miércoles Project Mariner, anteriormente conocido como Project Jarvis. Este agente de IA está diseñado para entender lo que aparece en el navegador y llevar a cabo acciones en nombre del usuario. Está basado en Gemini 2.0, la última versión de los modelos de lenguaje de la compañía.
Redefiniendo la interacción con el navegador
Google explica que Project Mariner puede interactuar con sitios web mediante una extensión experimental disponible en Chrome. Inicialmente, el sistema interpreta las instrucciones del usuario, sean escritas o por voz, y luego intenta cumplir con las solicitudes analizando los píxeles, el texto de las páginas, el código, las imágenes e incluso los formularios.
En un video de demostración, se muestra una ventana de Chrome con una hoja de cálculo que contiene nombres de varias compañías. Un miembro del equipo de Google DeepMind solicita al agente que recopile las páginas web de dichas empresas para extraer un correo electrónico de contacto. De inmediato, el agente cumple con la solicitud de manera precisa.
El agente busca cada empresa en Google, navega por sus sitios hasta encontrar la sección «Sobre nosotros» y extrae la información necesaria. Además, ofrece un informe visual del progreso en una barra lateral del navegador, lo que permite al usuario saber exactamente qué está haciendo el agente y la opción de detener su funcionamiento en cualquier momento.
Google afirma que este agente puede ser muy útil para automatizar tareas repetitivas, ahorrando tiempo a los usuarios. En caso de que una instrucción no sea clara, el agente solicitará más detalles al usuario, minimizando así los errores. Es importante destacar que esta versión experimental está disponible únicamente para un grupo selecto de “probadores de confianza” y es posible que aún cometa algunos errores.
En octubre de este año, conocimos a Computer Use de Anthropic, un sistema que también promete automatizar tareas dentro del sistema operativo. Aunque esta nueva herramienta de Anthropic aún es bastante limitada, evolucionará con el tiempo a pesar de los errores y la lentitud ocasionales en sus operaciones.
Imágenes | Google
Deja una respuesta