La semana inicia con novedades en el ámbito de la inteligencia artificial. OpenAI ha revelado su nueva serie de modelos de lenguaje: GPT-4.1, GPT-4.1 mini y GPT-4.1 nano. Estas tres versiones están diseñadas para diversas necesidades, abarcando desde tareas complejas hasta las más sencillas, y están especialmente pensadas para ser integradas en aplicaciones.
Estas alternativas estarán, por el momento, disponibles exclusivamente a través de la API de OpenAI, lo que limita su uso al campo del desarrollo. En términos sencillos, no se podrán utilizar en ChatGPT para el público en general.
Características de los Nuevos Modelos de OpenAI
La introducción de estos modelos suscita una inevitable pregunta: ¿cómo se comparan con las otras propuestas de OpenAI? La empresa sostiene que sobrepasan a GPT-4o y GPT-4o mini, lanzados el año anterior “en casi todas las dimensiones”. Asimismo, aseguran que incluso superan a GPT-4.5 en ciertos aspectos, este último lanzado a principios de este año.
Uno de los puntos fuertes es su ventana de contexto que puede manejar hasta un millón de tokens, lo que significa que el modelo puede procesar una gran cantidad de texto de una vez para generar respuestas. Además, OpenAI ha actualizado la base de conocimiento del modelo hasta junio de 2024, lo que garantiza información más actualizada.
La empresa liderada por Sam Altman ha creado esta familia de modelos con el propósito de ser útiles en escenarios reales, priorizando los resultados y el rendimiento que pueden ofrecer. Este enfoque refleja un interés en ir más allá de los benchmarks, que no siempre indican el verdadero potencial de los modelos.
En cuanto a los benchmarks, GPT-4.1 sobresale en tres áreas:
- Programación. GPT-4.1 alcanza un 54,6% en SWE-bench Verified, mejorando 21,4 puntos respecto a GPT-4o y 26,6 puntos comparado con GPT-4.5.
- Capacidad de seguir instrucciones. En el benchmark MultiChallenge de Scale, que mide la habilidad para seguir instrucciones, GPT-4.1 logra un 38,3%, superando en 10,5 puntos a GPT-4o.
- Contexto largo. En Video-MME, un test para comprensión de contextos largos y multimodales, GPT-4.1 establece un nuevo récord con un 72,0% en la categoría “larga sin subtítulos”, superando a GPT-4o en 6,7 puntos.
En general, los modelos más grandes y potentes requieren más recursos, lo que incrementa su costo y ralentiza su funcionamiento. Aquí es donde los modelos “mini” son útiles, especialmente en tareas como el análisis rápido de texto o la atención al cliente por chat.
El costo de GPT-4.1 es de 2 dólares por cada millón de tokens de entrada y 8 dólares por cada millón de tokens generados. GPT-4.1 mini ofrece una alternativa más económica a 0,40 dólares por millón de tokens de entrada y 1,60 por millón de salida. GPT-4.1 nano, la opción más asequible, cuesta 0,10 dólares por millón de tokens de entrada y 0,40 por millón de salida.
GPT-4.1, GPT-4o y GPT-4o mini están disponibles para integración mediante la API de OpenAI. Cada modelo ofrece un balance diferente entre costo, velocidad e inteligencia, permitiendo a los desarrolladores elegir según sus necesidades y presupuesto.
Esta movida ocurre en un contexto donde la competencia para OpenAI es cada vez mayor. Google, por ejemplo, ha ajustado su enfoque para lanzar potentes productos de IA. OpenAI también planea realizar varios anuncios en los próximos meses.
Sam Altman ha indicado que este año se presentarán dos nuevos modelos: o3 y o4-mini. Originalmente, o3 no iba a ser un lanzamiento independiente, sino que sus capacidades se integrarían en modelos futuros. No obstante, este plan ha sido temporalmente postergado.
La confusión surge en el selector de modelos, donde no siempre es claro cuál es el más adecuado. Además, el lanzamiento de GPT-4.1 después de GPT-4.5, a pesar de sus superiores capacidades, no ayuda a clarificar.
Imágenes | OpenAI + Photoshop
Deja una respuesta