
Escucha este artículo
Audio generado con IA de Google
0:00
/
0:00
La empresa matriz de ChatGPT lanzó su nuevo y más grande modelo de lenguaje de inteligencia artificial GPT-4.5. La nueva presentación estará disponible en su versión vista previa para que los usuarios de ChatGPT Pro comiencen a probarlo.
Pero más grande no significa mejor. El modelo de IA no es tan bueno como sus modelos de razonamiento de IA en muchos puntos de medición, pero OpenAI afirma que GPT-4.5 es su mejor modelo para conversar.
En el informe inicial, la compañía advirtió que el nuevo modelo no se consideraba de “vanguardia” en comparación con los modelos de razonamiento como el o1 u o3-mini. Horas después actualizaron la publicación y eliminaron la afirmación.
“GPT-4.5 no es un modelo de vanguardia, pero es el modelo LLM más grande de OpenAI, que mejora la eficiencia computacional de GPT-4 en más de 10 veces”, dijo OpenAI en un documento que se filtró antes de su anuncio. “No introduce 7 nuevas capacidades de vanguardia netas en comparación con versiones anteriores de razonamiento, y su rendimiento es inferior al de o1, o3-mini y la investigación profunda en la mayoría de las evaluaciones de preparación”.
Le recomendamos leer: La IA de codificación de Gemini es gratis para usuarios individuales
El nuevo modelo de lenguaje IA tendrá mejores capacidades de escritura, un conocimiento mejorado del mundo y lo que OpenAI llamó una “personalidad refinada en comparación con los modelos anteriores”. La empresa aseguró que interactuar con GPT 4.5 se sentirá más “natural” y agrega que el modelo es mejor para reconocer patrones y establecer conexiones, lo que lo hace ideal para escribir, programar y “resolver problemas prácticos”.
Los suscriptores de ChatGPT Pro, el plan de 200 dólares al mes de OpenAI, obtendrán el acceso inicial a GPT-4.5. Los desarrolladores de niveles pagos de la API de OpenAI también podrán usar GPT-4.5 a partir de hoy. En cuanto a otros usuarios de ChatGPT, los clientes registrados en ChatGPT Plus y ChatGPT Team deberían recibir el modelo en los próximos días.
La compañía considera que el tamaño del modelo también puede ayudar a que alucine con menos frecuencia que las versiones anteriores. “Si sabes más cosas, no tienes que inventártelas”, afirmó Mia Glaese, que dirige el equipo de alineación y el equipo de datos humanos de OpenAI. El tamaño exacto de GPT-4.5 no está claro: OpenAI no compartió cifras concretas.
Ventajas de GPT-4.5
GPT-4.5 supera a GPT-4o y a otros modelos de OpenAI en tareas de precisión factual. En la tarea de medición SimpleQA de OpenAI, que evalúa la capacidad de los modelos para responder preguntas objetivas, GPT-4.5 obtuvo mejores resultados en términos de exactitud.
En el ámbito de la codificación, los resultados son mixtos. En la prueba SWE-Bench Verified, que mide el rendimiento en problemas de programación específicos, GPT-4.5 se desempeña de manera similar a GPT-4o y o3-mini, pero no alcanza el nivel de los modelos más avanzados como la investigación profunda de OpenAI o Claude 3.7 Sonnet de Anthropic. Sin embargo, en el examen SWE-Lancer, que evalúa la capacidad para desarrollar funciones de software completas, GPT-4.5 sí supera a GPT-4o y o3-mini.
Le podría interesar: Estos son los proyectos de ley que buscan regular la IA en Colombia
Limitaciones de GPT-4.5
A pesar de sus mejoras, GPT-4.5 no es el modelo más avanzado en todas las áreas. En tareas de razonamiento complejo y pruebas académicas difíciles, como AIME y GPQA, su rendimiento es inferior al de modelos como o3-mini, R1 de DeepSeek y Claude 3.7 Sonnet. Sin embargo, sigue igualando o superando a otros modelos sin capacidades avanzadas de razonamiento en esas mismas pruebas, lo que indica un buen desempeño en problemas matemáticos y científicos.
Otra limitación es que GPT-4.5, a diferencia de GPT-4o, no admite el modo de voz bidireccional realista de ChatGPT, aunque sí permite la carga de archivos e imágenes, además de la herramienta de lienzo.
GPT-4.5 ofrece mejoras significativas en precisión y reducción de alucinaciones en comparación con GPT-4o, además de un buen desempeño en ciertas pruebas de codificación. No obstante, sigue estando por detrás de los modelos más avanzados en razonamiento y pruebas académicas complejas.

👽👽👽 ¿Ya está enterado de las últimas noticias de tecnología? Lo invitamos a visitar nuestra sección en El Espectador.