Los chatbots en línea, como ChatGPT de OpenAI y Gemini de Google, a menudo enfrentan dificultades al resolver problemas matemáticos sencillos y generan código informático con errores o incompleto.

Para superar estos desafíos, OpenAI ha lanzado un nuevo modelo que promete avances significativos en el razonamiento y la capacidad de abordar tareas complejas.

Este nuevo modelo, llamado “o1”, aún es reciente y no se ha evaluado ampliamente. Sin embargo, ha mostrado indicios de que podría representar un punto de inflexión en la evolución de la inteligencia artificial.

¿Qué es OpenAI o1?

o1 es un nuevo modelo de inteligencia artificial presentado el 12 de septiembre de 2024 por OpenAI, diseñado para mejorar las capacidades de razonamiento y resolución de problemas en tareas complejas.

A diferencia de sus predecesores, como GPT-4o, este modelo no se limita a responder de manera inmediata a las preguntas, sino que «reflexiona» sobre los problemas, descomponiéndolos en pasos más pequeños y buscando soluciones de forma más metódica.

Este enfoque representa un cambio importante en la dinámica tradicional de los modelos de IA, que hasta ahora han tenido dificultades en tareas que requieren un análisis lógico profundo, como la resolución de problemas matemáticos o la generación precisa de código

¿Cómo funciona OpenAI o1?

El núcleo de OpenAI o1 radica en un método de entrenamiento conocido como aprendizaje por refuerzo.

Este proceso permite que el modelo aprenda a través de prueba y error, perfeccionando sus habilidades a medida que repite y evalúa miles de problemas y situaciones diferentes.

En el contexto de las matemáticas, por ejemplo, el modelo trabaja en varios problemas complejos y prueba distintas soluciones, identificando patrones en los métodos que conducen a la respuesta correcta.

De esta manera, mejora su capacidad para resolver problemas matemáticos y científicos con una mayor precisión que las versiones anteriores de la IA.

El proceso de aprendizaje por refuerzo se lleva a cabo a lo largo de semanas o incluso meses. Durante este tiempo, el modelo se expone a una enorme cantidad de datos y problemas, y aprende de sus errores y aciertos.

Sin embargo, es importante señalar que, aunque OpenAI o1 puede ofrecer respuestas más acertadas que sus predecesores, sigue siendo susceptible a cometer errores y generar «alucinaciones», es decir, respuestas incorrectas o fabricadas.

Razonar a través de la cadena de pensamiento

Uno de los avances más destacados de OpenAI o1 es su capacidad para aplicar lo que se conoce como cadena de pensamiento (Chain of Thought, en inglés), una técnica que permite al modelo desglosar un problema en pasos más pequeños y legibles.

Este enfoque no solo mejora la precisión del modelo, sino que también lo hace más transparente. Al observar cómo el modelo llega a una conclusión, los usuarios pueden tener una mejor comprensión de su proceso de razonamiento.

Esta capacidad es particularmente útil en tareas de codificación y matemáticas, donde descomponer un problema en subproblemas más pequeños es crucial para llegar a la solución correcta.

OpenAI o1 ha demostrado esta habilidad en varias pruebas, incluida una en la que el modelo fue capaz de diagnosticar una enfermedad basándose en un informe detallado de los síntomas de un paciente, lo que resalta su potencial en aplicaciones médicas.

¿Cómo se compara o1 con otros modelos de IA?

Una de las principales dudas sobre OpenAI o1 es cómo se compara con otros modelos de IA existentes, tanto de OpenAI como de otras empresas tecnológicas.

En pruebas recientes compartidas por OpenAI, o1 superó a GPT-4 en la capacidad para resolver problemas matemáticos y generar código preciso, dos áreas en las que GPT-4 aún mostraba limitaciones.

Por ejemplo, en el examen de clasificación para la Olimpiada Internacional de Matemáticas (IMO), GPT-4 solo pudo obtener un 13% de aciertos, mientras que OpenAI o1 alcanzó un 83%.

Este salto considerable demuestra la capacidad de o1 para abordar problemas de una manera más lógica y metódica.

Generación de código con OpenAI o1

En cuanto a la codificación, OpenAI o1 ha demostrado también una mejora significativa.

Resolviendo los problemas de la Olimpiada Internacional de Informática (IOI) de 2024, el modelo obtuvo 213 puntos y se ubicó en el percentil 49, lo que lo coloca en la mitad de los competidores humanos.

Esto es notable, dado que los participantes en la IOI son algunos de los mejores programadores del mundo.

Además, cuando se relajaron las restricciones de la competencia, el modelo pudo mejorar aún más su rendimiento, obteniendo una puntuación superior al umbral para una medalla de oro.

Modelos como Gemini de Google y los desarrollos open-source de Meta (como Llama 3.1) también han realizado avances en la mejora del razonamiento en IA, como vimos recientemente con el modelo Reflection 70B.

Sin embargo, la ventaja de OpenAI o1 radica en su enfoque deliberado hacia la resolución de problemas y la integración de la cadena de pensamiento, lo que le otorga una ventaja en tareas complejas que requieren múltiples pasos de razonamiento.

¿Es peligroso tener una IA que pueda razonar?

Una IA con capacidad de razonamiento puede abordar problemas complejos en campos como la medicina, la ingeniería y la ciencia, ofreciendo soluciones innovadoras y eficientes.

Sin embargo, también es cierto que una IA avanzada podría ser utilizada de manera malintencionada si cae en las manos equivocadas. Por tanto es esencial implementar medidas de seguridad robustas para prevenir abusos.

Según OpenAI, un aspecto crucial en el desarrollo de o1 fue la seguridad. OpenAI ha implementado políticas de comportamiento en la cadena de pensamiento del modelo para asegurarse de que siga los valores y principios humanos en contextos potencialmente peligrosos.

Este enfoque ha mejorado la capacidad del modelo para rechazar de manera segura solicitudes inapropiadas, como el fomento de conductas violentas o ilegales.

En las pruebas más desafiantes, siempre según OpenAI, o1 logró una mejora sustancial en la identificación y manejo de situaciones delicadas en comparación con GPT-4.

Uno de los desafíos más intrigantes es cómo integrar esta cadena de pensamiento de manera que sea útil para la supervisión sin comprometer la experiencia del usuario.

OpenAI ha decidido no mostrar la cadena de pensamiento sin procesar a los usuarios, pero el modelo puede generar un resumen que explique cómo llegó a una respuesta. Esto permite un equilibrio entre transparencia y funcionalidad.

¿Cómo probar OpenAI o1?

OpenAI o1 ya está disponible para probar, pero su acceso es limitado. Los usuarios que tienen suscripciones a los servicios ChatGPT Plus y ChatGPT Teams pueden empezar a utilizar esta nueva tecnología.

Además, OpenAI también está ofreciendo o1 a empresas y desarrolladores de software que estén interesados en integrarlo en sus aplicaciones de inteligencia artificial.

Sin embargo, el acceso general al modelo o1 aún no está ampliamente disponible para todos los usuarios, ya que OpenAI está enfocándose inicialmente en ofrecerlo a suscriptores y socios comerciales.