Cali, marzo 15 de 2026. Actualizado: viernes, marzo 13, 2026 23:41

El nuevo modelo llega a ChatGPT, la API y Codex (5 de marzo de 2026) y promete mejor razonamiento, manejo de hojas de cálculo y mayor integración con herramientas y navegadores

OpenAI lanza GPT‑5.4, un modelo pensado para trabajo profesional con agentes que pueden “usar” computadoras

OpenAI lanza GPT‑5.4, un modelo pensado para trabajo profesional con agentes que pueden “usar” computadoras
domingo 15 de marzo, 2026

OpenAI presentó el 5 de marzo de 2026 GPT‑5.4, su modelo de punta diseñado para tareas profesionales y disponible desde hoy en ChatGPT (como GPT‑5.4 Thinking), en la API (gpt-5.4) y en Codex. La compañía también puso en marcha una versión de mayor rendimiento, GPT‑5.4 Pro, dirigida a desarrolladores y a casos de uso más complejos.

Qué es GPT‑5.4 y qué cambia

GPT‑5.4 es un modelo de lenguaje grande (LLM, por sus siglas en inglés) que combina mejoras en razonamiento, programación y en la capacidad para trabajar con «agentes»: software que puede ejecutar flujos de trabajo en aplicaciones, navegar en páginas web y operar interfaces.

En términos sencillos, OpenAI describe al agente como una extensión del modelo que puede interactuar con herramientas externas —por ejemplo, abrir una hoja de cálculo, leer correos o hacer clic en una página— para completar tareas de varios pasos.

Entre las novedades técnicas destacan: contexto de hasta 1 millón de tokens (permitiendo trabajar en tareas largas), mejoras en eficiencia del razonamiento (usa menos tokens que GPT‑5.2) y capacidades nativas para «usar computadoras», como generar código con bibliotecas tipo Playwright y emitir comandos de ratón y teclado a partir de capturas de pantalla.

Rendimiento en tareas profesionales

OpenAI publica comparaciones con versiones anteriores y métricas de evaluación interna. En la prueba GDPval, que mide la capacidad de producir trabajo especializado en 44 ocupaciones, GPT‑5.4 igualó o superó a profesionales de la industria en 83.0% de las comparaciones (GPT‑5.2 obtuvo 70.9%).

En tareas de modelado de hojas de cálculo que realizaría un analista junior, GPT‑5.4 alcanzó 87.5% frente al 68.4% de GPT‑5.2. En evaluación de presentaciones, los evaluadores humanos prefirieron las de GPT‑5.4 el 68.0% de las veces sobre las de GPT‑5.2.

OpenAI también reporta mejoras en la precisión: en un conjunto de prompts anonimizados las afirmaciones individuales de GPT‑5.4 fueron 33% menos propensas a ser falsas y las respuestas completas 18% menos propensas a contener errores, comparado con GPT‑5.2.

Uso de la computadora, visión y agentes

GPT‑5.4 es, según OpenAI, el primer modelo de propósito general con capacidades nativas para operar computadoras y ejecutar flujos de trabajo en distintos entornos.

Esto incluye generación de scripts, interacción con interfaces a partir de capturas de pantalla y soporte para ajustar el comportamiento mediante mensajes de desarrollador y políticas de seguridad.

En pruebas de navegación y control de interfaz, GPT‑5.4 alcanzó 75.0% en OSWorld‑Verified (frente a 47.3% de GPT‑5.2) y superó el rendimiento humano reportado en esa evaluación (72.4%). En pruebas de uso de navegador también reportó mejoras (por ejemplo, Online‑Mind2Web 92.8% frente a 84.0% de un sistema anterior).

Además, la capacidad visual del modelo mejora la comprensión de imágenes densas y de alta resolución: la API ahora admite una fidelidad de entrada que, en el nivel “original”, permite hasta 10 millones de píxeles totales o una dimensión máxima de 6.000 píxeles.

Trabajo con herramientas y búsqueda de herramientas

Una mejora significativa es la «búsqueda de herramientas» en la API: en lugar de enviar al modelo la definición completa de decenas de miles de herramientas en cada solicitud, se le proporciona una lista ligera y una función para buscar la definición cuando la necesite.

OpenAI informa que, en una evaluación con 36 servidores MCP y 250 tareas, esto redujo el uso total de tokens un 47% manteniendo la precisión.

También se reportan mejoras en la llamada a herramientas por parte de agentes (es decir, decidir cuándo y cómo invocar APIs o conectores), con menor cantidad de turnos y mejor precisión en evaluaciones de flujos de trabajo reales.

Seguridad, disponibilidad y precios

OpenAI indica que despliega GPT‑5.4 con salvaguardas ampliadas: lo trata como de “alta capacidad cibernética” dentro de su marco de preparación, con controles de acceso, monitoreo y bloqueo o enrutamiento de solicitudes de mayor riesgo para ciertos clientes.

La empresa evaluó la posibilidad de que el modelo ofusque su razonamiento (Chain‑of‑Thought, CoT) y afirma que la «capacidad de controlabilidad de CoT» de GPT‑5.4 es baja, lo que consideran positivo para la supervisión.

En disponibilidad, GPT‑5.4 se implementa gradualmente en ChatGPT y Codex; en la API ya está como gpt-5.4 y gpt-5.4‑pro. En ChatGPT, la versión Thinking está disponible para suscriptores Plus, Team y Pro; Pro y Enterprise pueden acceder también a GPT‑5.4 Pro.

OpenAI publicó una tabla de precios por token para la API (por ejemplo, salida de gpt‑5.4: USD 15 / millón de tokens; gpt‑5.4‑pro: USD 180 / millón en salida).

Qué supone para las personas

Según la propia descripción de OpenAI, GPT‑5.4 apunta a mejorar tareas profesionales cotidianas —crear y editar documentos, hojas de cálculo, presentaciones y búsquedas web complejas— con respuestas más rápidas y menos iteraciones.

Para usuarios finales esto puede traducirse en asistentes más capaces al preparar informes, análisis sencillos o búsquedas profundas, siempre con las limitaciones y salvaguardas que OpenAI ha señalado.

Nota de Transparencia

Esta nota fue generada 100% con IA. La fuente fue aprobada por Diario Occidente y el contenido final fue revisado por un miembro del equipo de redacción.

OpenAI lanza GPT‑5.4, un modelo pensado para trabajo profesional con agentes que pueden “usar” computadoras

🔊 El Resumen de Noticias sobre Inteligencia Artificial e Innovación Tecnológica, aquí 👇🏻

OpenAI lanza GPT‑5.4, un modelo pensado para trabajo profesional con agentes que pueden “usar” computadoras

Curaduría editorial

La curaduría y revisión editorial de estas notas está a cargo de Rosa María Agudelo Ayerbe, comunicadora social y periodista, con maestría en Transformación Digital y especialización en Inteligencia Artificial.

Desde su rol como líder del equipo de innovación y transformación digital del Diario Occidente, y a través de la unidad estratégica DO Tech, realiza un seguimiento permanente a las principales novedades en tecnología e inteligencia artificial a nivel global.

Estas notas se apoyan en un agente de investigación basado en inteligencia artificial, diseñado para monitorear semanalmente avances, lanzamientos y debates clave del sector.

El contenido es posteriormente leído, analizado, contextualizado y validado editorialmente antes de su publicación.

Este proceso forma parte del mecanismo de actualización continua que permite interpretar los desarrollos tecnológicos desde una mirada periodística, crítica y comprensible para audiencias no especializadas.


OpenAI lanza GPT‑5.4, un modelo pensado para trabajo profesional con agentes que pueden “usar” computadoras

Comments

ads_top
Powered by Sindyk Content
Arriba