| Tech

5 cosas que debes saber sobre el nuevo GPT-5.1 de OpenAI

Un usuario avanzado y antiguo probador beta de OpenAI ofrece su opinión.

5 cosas que debes saber sobre el nuevo GPT-5.1 de OpenAI [Foto: Jonathan Kemper /Unsplash]

Durante la semana pasada, los observadores de OpenAI informaron haber visto cosas extrañas.

Las referencias a GPT-5.1 seguían apareciendo en el código fuente de OpenAI, y un modelo “encubierto” con el nombre en clave Polaris Alpha, que se cree ampliamente que proviene de OpenAI, apareció aleatoriamente en OpenRouter, una plataforma que los entusiastas de la inteligencia artificial (IA) utilizan para probar nuevos sistemas.

Hoy nos enteramos de lo que pasaba. OpenAI anunció el lanzamiento de su nuevo modelo 5.1, una versión actualizada y renovada del modelo GPT-5 que la compañía presentó en agosto.

Como antiguo probador beta de OpenAI —y alguien que gasta millones de tokens GPT-5 cada mes— esto es lo que necesitas saber sobre GPT-5.1.

Un robot más inteligente y amigable

En las notas de lanzamiento del nuevo modelo, OpenAI destaca que GPT-5.1 es “más inteligente” y “más conversacional” que las versiones anteriores.

La compañía afirma que GPT-5.1 es “más cálido por defecto” y “a menudo sorprende a la gente por su carácter lúdico sin dejar de ser claro y útil”.

Si bien a algunas personas les gusta hablar con un chatbot como si fuera un amigo de toda la vida, a otras les resulta incómodo. OpenAI reconoce esto y afirma que “las preferencias sobre el estilo de chat varían de persona a persona e incluso de conversación a conversación”.

Por ese motivo, OpenAI afirma que los usuarios pueden personalizar el tono del nuevo modelo, eligiendo entre opciones predefinidas como “Profesional”, “Sincero” y “Original”.

También existe una opción “Nerd”, que en mis pruebas parece hacer que el modelo sea más pedante y provoque un uso excesivo de términos como “subir de nivel”.

En esencia, los nuevos cambios se perciben como un giro hacia el lado consumidor de la base de clientes de OpenAI. 

Es probable que los usuarios empresariales no quieran un modelo que ocasionalmente haga referencias a dragones y mazmorras. Sin embargo, como demuestra el revuelo causado por el modelo GPT-5 de OpenAI, inicialmente mudo, los usuarios comunes sí lo quieren.

Aún menos alucinaciones

El modelo GPT-5 de OpenAI se quedó corto en muchos aspectos, pero fue muy bueno a la hora de proporcionar respuestas precisas y prácticamente libres de alucinaciones.

Suelo usar los modelos de OpenAI para investigar. Con modelos anteriores como GPT-4o, descubrí que tenía que verificar minuciosamente lo que producía el modelo para asegurarme de que no estuviera imaginando alguna herramienta de software nueva que no existe, o engañándome sobre un sinfín de detalles importantes.

Con GPT-5, tuve que hacerlo mucho menos. El modelo no era perfecto, pero OpenAI había resuelto en gran medida el problema de las alucinaciones descontroladas. 

Según datos de la propia compañía, GPT-5 solo falla el 26% de las veces al resolver un problema de referencia complejo, frente al 75% de las veces con modelos anteriores. En el uso normal, esto se traduce en una tasa de fallos mucho menor en consultas cotidianas más sencillas que no están diseñadas para poner a prueba el modelo.

Según mis primeras pruebas, GPT-5.1 parece incluso menos propenso a las alucinaciones. Le pedí que hiciera una lista de los mejores restaurantes de mi ciudad natal, incluyendo direcciones, enlaces a sus sitios web y horarios de apertura.

Cuando le pedí a GPT-4 que realizara una tarea similar hace años, inventó restaurantes con nombres plausibles que no existen. GPT-5 lo hace mejor en este tipo de cosas, pero aún suele pasar por alto detalles, como el hecho de que un restaurante popular se mudó recientemente a la misma calle.

La lista de GPT-5.1, sin embargo, es impecable. Sus opciones son sólidas, todos son lugares reales y los horarios y ubicaciones son correctos en las diez selecciones.

La eficacia de OpenAI le resta creatividad

Sin embargo, esto tiene un precio. Los modelos que alucinan menos tienden a correr menos riesgos y, por lo tanto, pueden parecer menos creativos que aquellos sin restricciones y cargados de alucinaciones. 

En ese sentido, los restaurantes de la lista de GPT-5.1 no están mal, pero en su mayoría son opciones seguras: el tipo de lugares que han estado en la ciudad desde siempre y que cualquier lugareño habría visitado un millón de veces.

Un revisor humano real —o un modelo más audaz— podría haber destacado a un nuevo candidato prometedor, simplemente para mantener el interés y la novedad. GPT-5.1 se mantuvo fiel a los clásicos probados de hace una década.

Es probable que OpenAI intente analizar con detenimiento la relación entre precisión y creatividad en GPT-5.1 a medida que continúe su implementación. Si bien el modelo acierta con mayor frecuencia, aún no está claro si esto afectará su capacidad para generar ideas verdaderamente creativas e innovadoras.

Mejor escritura, más creativa

De manera similar, cuando OpenAI lanzó su modelo GPT-5, los usuarios rápidamente notaron que producía una prosa escrita aburrida y sin vida.

En aquel momento, predije que OpenAI le había practicado esencialmente una “lobotomía emocional” al modelo, eliminando su inteligencia emocional para frenar una preocupante tendencia del modelo a llevar a los usuarios a espirales psicóticas.

Resulta que tenía razón. En una publicación en X el mes pasado, Sam Altman admitió que “Hicimos que ChatGPT fuera bastante restrictivo para asegurarnos de tener cuidado con los problemas de salud mental”.

Pero Altman también dijo en la publicación: “ahora que hemos podido mitigar los graves problemas de salud mental y contamos con nuevas herramientas, podremos relajar las restricciones de manera segura en la mayoría de los casos”.

Ese proceso comenzó con la incorporación de nuevas personalidades con mayor inteligencia emocional al modelo GPT-5 existente. Pero continúa y se intensifica con GPT-5.1.

Una vez más, el modelo ya es más potente que su predecesor. Pero, como muestra la ficha técnica del nuevo modelo, el modelo Instantáneo de GPT-5.1 —el predeterminado en la popular versión gratuita de la aplicación ChatGPT— también es notablemente mejor a la hora de detectar conversaciones dañinas y proteger a los usuarios vulnerables.

Partes íntimas con OpenAI

Si te incomoda el contenido para adultos, quizás sea mejor que te tapes los oídos para esta parte. 

En la misma publicación de X, Altman dejó caer sutilmente una frase que causó revuelo en Internet: “A medida que implementemos completamente la restricción de edad y como parte de nuestro principio de ‘tratar a los usuarios adultos como adultos’, permitiremos aún más contenido, como el erótico para adultos verificados”.

La idea de que la principal empresa de IA de Estados Unidos produzca ingentes cantidades de erotismo generado por ordenador ya ha suscitado comentarios acalorados de fuentes tan variadas como políticoslíderes cristianosperiodistas especializados en tecnología y —a juzgar por el número de votos positivo—, la mayor parte de Reddit.

Por su parte, OpenAI parece bastante comprometida a seguir adelante con esta promesa. En un cálculo que sin duda tiene sentido en los peculiares círculos tecnolibertarios del mundo de la IA, la cuestión está íntimamente ligada a la libertad y la autonomía personales.

En un artículo reciente sobre el futuro de la inteligencia artificial, OpenAI reiteró una vez más que “creemos que los adultos deberían poder usar la IA en sus propios términos, dentro de los límites generales definidos por la sociedad”, situando el acceso pleno a la IA “al mismo nivel que la electricidad, el agua potable o los alimentos”.

Esto quiere decir que, muy pronto, es casi seguro que se eliminarán las restricciones que rodeaban las partes más subidas de tono de ChatGPT. 

Eso aún no ha ocurrido en el lanzamiento; el modelo sigue mostrándose reticente al hablar de temas explícitos. Pero, junto con las características más audaces de GPT-5.1, es casi seguro que llegará pronto.

Reflexiones más profundas

Además de eliminar la inteligencia emocional de GPT-5, OpenAI cometió otro error al lanzar GPT-5. 

La empresa intentó unificar las consultas dentro de un único modelo, dejando que ChatGPT eligiera si utilizar una versión más simple y con menor esfuerzo de GPT-5, o una más lenta y reflexiva.

La idea era noble; no hay mucha razón para usar un máster en Derecho increíblemente potente, lento y que consume muchos recursos para responder a una pregunta como “¿Sigue estando bueno el tahini después de un mes en la nevera?” —Respuesta: no—.

Pero en la práctica, la función fue un fracaso. ChatGPT no era eficaz para determinar el esfuerzo necesario para responder a una consulta determinada, lo que significaba que las personas que hacían preguntas complejas a menudo eran redirigidas a un modelo barato y deficiente que daba resultados pésimos.

OpenAI solucionó el problema en ChatGPT con una capa en la interfaz de usuario. Pero con GPT-5.1, OpenAI vuelve a dividir su modelo en una versión instantánea y otra pensada. 

El primero responde a consultas simples mucho más rápido que GPT-5, mientras que el segundo tarda más, procesa más tokens y ofrece mejores resultados en tareas complejas.

OpenAI afirma que el modelo de Pensamiento de GPT-5.1 también ofrece mayor precisión. A diferencia de GPT-5, el nuevo modelo puede ajustar su nivel de procesamiento para responder con precisión a preguntas complejas sin demoras excesivas, un problema común en la versión anterior.

OpenAI también ha insinuado que sus futuros modelos serán “capaces de realizar descubrimientos muy pequeños” en campos como la ciencia y la medicina el próximo año, y que los “sistemas que puedan realizar descubrimientos más significativos” llegarán ya en 2028. 

La mayor inteligencia y la capacidad de pensamiento mejorada del GPT-5.1 son un primer paso en ese camino.

Un intento de corregir el rumbo

En general, GPT-5.1 parece un intento de corregir muchos de los problemas evidentes de GPT-5, al tiempo que refuerza el enfoque de OpenAI hacia la IA conversacional, más orientado a la libertad, centrado en la precisión y basado en la voz.

El nuevo modelo puede pensar, escribir y comunicarse mejor que sus predecesores, y probablemente pronto también podrá “ligar” mejor.

Sin embargo , si logrará hacer esas cosas mejor que la creciente oferta de modelos competidores de Google, Anthropic y un sinfín de laboratorios chinos de IA, es algo que está por verse.

Author

  • Thomas Smith

    Thomas Smith es un experto en inteligencia artificial y periodista formado en la Universidad Johns Hopkins con 15 años de experiencia. El New York Times lo elogió como un "programador veterano" por su trabajo con inteligencia artificial con interacción humana, fue probador beta de IA abierta y dirigió la agencia de fotografía basada en IA Gado Images como cofundador y director ejecutivo durante 12 años.

    View all posts

Author

  • Thomas Smith

    Thomas Smith es un experto en inteligencia artificial y periodista formado en la Universidad Johns Hopkins con 15 años de experiencia. El New York Times lo elogió como un "programador veterano" por su trabajo con inteligencia artificial con interacción humana, fue probador beta de IA abierta y dirigió la agencia de fotografía basada en IA Gado Images como cofundador y director ejecutivo durante 12 años.

    View all posts

Sobre el autor

Thomas Smith es un experto en inteligencia artificial y periodista formado en la Universidad Johns Hopkins con 15 años de experiencia. El New York Times lo elogió como un "programador veterano" por su trabajo con inteligencia artificial con interacción humana, fue probador beta de IA abierta y dirigió la agencia de fotografía basada en IA Gado Images como cofundador y director ejecutivo durante 12 años.