La inteligencia artificial sigue evolucionando, y hemos tenido la oportunidad de probar el último avance de OpenAI. No se trata simplemente de una versión más inteligente o más abierta, sino de una herramienta mucho más funcional. Nos referimos al innovador modo ‘Cámara en Directo’ de OpenAI, que recientemente ha llegado a los usuarios en Europa. Tras varios dÃas de uso, hemos constatado que es un salto impresionante hacia adelante.
Este nuevo modo ha sido descrito como el modo ‘Her’. ¿La razón? Ahora ChatGPT puede responder a nuestras preguntas basándose en lo que le mostramos a través de la cámara del móvil. Si apuntamos a una fruta, ChatGPT nos identificará que es una manzana. Del mismo modo, si enfocamos nuestra mascota, identificará que es un bonito gato blanco y negro.
Pero esa no es la única novedad. ChatGPT ha adquirido la capacidad de ver lo que se presenta en la pantalla de nuestro móvil. Y aquà es donde surge la mayor preocupación.
El modo ‘Cámara en Directo’ transforma a ChatGPT
Quienes tienen suscripción a ChatGPT Plus ya pueden disfrutar de esta nueva modalidad. Para activarla, sencillamente hay que pulsar sobre el micrófono para empezar una conversación por voz. La novedad se presenta en forma de varios botones adicionales.
El primero es el botón de la cámara. Al pulsarlo, podremos mostrarle cualquier objeto a ChatGPT y formularle preguntas al respecto. Lo hemos puesto a prueba en diversas situaciones y el reconocimiento de objetos por parte de GPT-4o es sumamente preciso.
ChatGPT no se limita a identificar el objeto, sino que responde también a preguntas detalladas sobre este. Por ejemplo, puede indicarnos en qué estado está una fruta o cuál es la marca de una moto que estamos viendo.
Esta caracterÃstica ofrece grandes posibilidades de interacción, permitiendo, por ejemplo, solicitarle a ChatGPT que nos diga cuántos dedos tenemos levantados o incluso jugar al Pictionary. Este uso es particularmente entretenido, ya que la IA proporciona opciones y es bastante intuitiva incluso cuando nuestras habilidades para dibujar no son las mejores.
Asimismo, es útil para resolver problemas matemáticos. Basta con enfocar una fórmula, y ChatGPT nos dará la respuesta. Lo probamos con ecuaciones sencillas y el éxito fue inmediato, también con fórmulas complejas donde la IA mostró la misma eficacia.
Las aplicaciones son numerosas y las posibilidades, vastas. El impacto es tan sorprendente como cuando ChatGPT irrumpió inicialmente en escena. Sin embargo, hay margen para mejorar, especialmente porque la interacción no es completamente fluida. Es necesario consultar con la IA cada vez para que analice la imagen capturada por la cámara.
Si bien es poco probable que esta función por sà sola haga que alguien se enamore de ChatGPT, sà representa un avance significativo hacia una experiencia más intuitiva, en la que la IA parece «comprender» lo que está frente a ella. Pasamos de una comunicación basada únicamente en texto a una que integra imagen y sonido, resultando en una experiencia más atractiva visualmente.
El Acceso de ChatGPT a Nuestra Pantalla: Una Cuestión Delicada
Con esta nueva funcionalidad, ChatGPT no solo puede acceder a la cámara, sino también a la pantalla de nuestro teléfono. Esto permite a la IA analizar el contenido de una captura o todo lo que se muestra en la pantalla, ya sea una aplicación especÃfica o en su totalidad.
En otras palabras, ChatGPT puede discernir si estamos viendo nuestro correo, usando WhatsApp, o qué vÃdeo estamos presenciando. Es como brindarle acceso directo a nuestra pantalla y, al activarla por primera vez, ChatGPT nos alerta que la información sensible podrÃa estar siendo observada.
Esta función evoca a Recall de Windows y la controversia en torno a la privacidad de los usuarios. OpenAI está, en esencia, observando todo lo que aparece en nuestro dispositivo, sin ningún tipo de filtro.
Se presentan diversas opciones, como permitir acceso a toda la pantalla o únicamente a una aplicación. El nivel de precisión es adecuado. Aunque no distingue detalles especÃficos como textos pequeños o detalles de carátulas, puede identificar el tÃtulo exacto de una conversación o vÃdeo. Además, reconoce lo que estamos escuchando si le mostramos Spotify.
Con la función ‘Cámara en Directo’, OpenAI prácticamente solicita acceso a nuestros dispositivos. Es ciertamente impresionante, pero el riesgo para nuestra privacidad es una consideración importante.
Este avance es solamente un vistazo a lo que se avecina. Meses atrás pude experimentar con Project Astra y parece que lo que viene será similar, pero con la intervención de Google.
Al parecer, los nuevos Samsung Galaxy S25 serán los primeros en implementar algo similar. En este 2025, los fabricantes de tecnologÃa desean que la IA «entienda» nuestro entorno, y también observar más de cerca lo que mostramos en nuestros dispositivos.
En Xataka Android | Probamos DeepSeek en móvil y PC: ventajas, inconvenientes y una gran diferencia
Deja una respuesta