Que OpenAI, la empresa detrás de ChatGPT, tenía en desarrollo un nuevo modelo de inteligencia artificial capaz de razonar para resolver problemas difíciles era un secreto a voces. Se esperaba que “Strawberry” fuera lanzado a finales de septiembre, pero la compañía ha dado a conocer antes de lo contemplado su producto más reciente: OpenAI o1.
Este es el primer modelo de la serie, capaz de razonar sobre tareas complejas y resolver tareas con un mayor nivel de dificultad que los modelos anteriores lanzados hasta ahora, principalmente en áreas de ciencia, programación y matemáticas.
Según OpenAI, estos nuevos modelos están entrenados para dedicar más tiempo a pensar en los problemas antes de responder, de manera similar a “como actuaría una persona“. Esto permite refinar su proceso de pensamiento, probar diferentes estrategias y hasta reconocer sus errores.
Como resultado, la compañía afirma que este modelo es capaz de comportarse de manera similar a estudiantes de doctorado en tareas desafiantes de física, química y biología, aunque también destaca en matemáticas y codificación.
De forma comparativa, OpenAI o1 logró obtener un 83% de puntuación en un examen de clasificación para la Olimpiada Internacional de Matemáticas (IMO), mientras que GPT-4o alcanzó solo un 13% de calificación.
Sin embargo, dado que se trata de un modelo preliminar, OpenAI o1 aún no cuenta con muchas de las funciones con las que ya dispone ChatGPT, como la navegación por la web, la búsqueda de información o la carga de archivos e imágenes. Por lo tanto, GPT-4o será más capaz de momento.
A pesar de esto, para resolver tareas complejas de razonamiento, el modelo representa un “avance significativo“. Por ello, se decidió “reiniciar el contador a 1” y denominar a esta nueva categoría de modelos como OpenAI o1.
La empresa señala que su nuevo modelo está diseñado principalmente para quienes necesitan abordar problemas complejos en ciencia, codificación, matemáticas y campos similares.
Específicamente, la compañía menciona que algunas de sus posibles aplicaciones son por investigadores del sector sanitario para anotar datos de secuenciación celular, físicos que generan fórmulas matemáticas complejas para la óptica cuántica, y desarrolladores de todos los campos para crear y ejecutar nuevos flujos de trabajo.
Entre sus características, este modelo cuenta con un nivel avanzado de seguridad, gracias a un enfoque distinto de entrenamiento que aprovecha sus capacidades de razonamiento para seguir los lineamientos establecidos de forma más eficiente.
Por ejemplo, OpenAI indica que se probó la efectividad de su seguridad cuando un usuario intentaba eludir las normas en un proceso conocido como “jailbreaking“. En una escala de 0 a 100, GPT-4o obtuvo una puntuación de 22, mientras que la versión preliminar de o1 alcanzó 84.
Además, cuenta con más herramientas de seguridad, como una gobernanza interna y la colaboración con los gobiernos de Estados Unidos y el Reino Unido.
Junto con la versión mayor de la serie o1, OpenAI también lanzó OpenAI o1-mini, un modelo pensado para desarrolladores que ofrece un razonamiento más rápido y económico (hasta un 80% más que el modelo completo). Este es especialmente eficaz en tareas de codificación, lo que lo convierte, dice la empresa, en una opción “potente y rentable” para aplicaciones que requieren razonamiento, pero no necesitan un amplio conocimiento del mundo.
Tanto los usuarios de ChatGPT Plus como los de Team podrán acceder a los modelos o1 en ChatGPT a partir del 12 de septiembre de 2024, ya que ambos se pueden seleccionar manualmente en el selector de la página, con límites semanales de 30 mensajes para o1-preview y 50 para o1-mini, aunque se espera que estos aumenten en el futuro. Eventualmente, se permitirá que ChatGPT escoja automáticamente la variante correcta para cada mensaje.