OpenAI presentó el jueves OpenAI o1, una nueva serie de modelos de lenguaje grande (LLM) que, según la compañía, están diseñados para resolver problemas difíciles y tareas complejas.
Los modelos fueron entrenados para tardar más en realizar tareas que otros modelos de IA, pensando en los problemas de la misma manera que lo haría un humano. Pueden “refinar su proceso de pensamiento, probar diferentes estrategias y reconocer sus errores”, afirma OpenAI. Los modelos se desempeñan de manera similar a los estudiantes de doctorado cuando trabajan en problemas de física, química y biología.
Los modelos o1 obtuvieron una puntuación del 83% en un examen de clasificación para la Olimpiada Internacional de Matemáticas, afirma OpenAI. A comparación, GPT-4o resolvió correctamente sólo 13% de los problemas.
OpenAI proporcionó algunos ejemplos de casos de uso específicos. Los modelos o1 podrían ser utilizados por investigadores de la salud para anotar datos de secuenciación celular, por físicos para generar fórmulas matemáticas complicadas necesarias para la óptica cuántica y por desarrolladores para crear y ejecutar flujos de trabajo de varios pasos. También funcionan bien en matemáticas y codificación.
Dentro de OpenAI, los modelos o1 primero se denominaron en código “Q*” (pronunciado “Q-star”), luego “Strawberry”.
OpenAI dice que está adoptando un enfoque lento y cauteloso para lanzar los nuevos modelos. Está lanzando un par de “vistas preliminares” de dos de los modelos de la serie. Las personas con cuentas de ChatGPT Plus o Teams pueden acceder a “o1-preview” eligiéndolo en un menú desplegable dentro del chatbot. También pueden elegir “o1-mini”, que es más rápido y bueno para las preguntas STEM, dice OpenAI.
Los desarrolladores e investigadores pueden acceder a los modelos dentro de ChatGPT y a través de una interfaz de programación de aplicaciones.
OpenAI dice que los nuevos modelos inicialmente no podrán acceder a Internet. Los usuarios no podrán cargar imágenes o archivos a los modelos. OpenAI dice que ha reforzado las características de seguridad en torno a los modelos y ha informado a las autoridades federales sobre los modelos más capaces.