OpenAI nació en diciembre de 2015 en San Francisco como una organización sin fines de lucro de investigación y desarrollo de IA, para «garantizar que la inteligencia artificial general beneficie a toda la humanidad«: ¿qué ha cambiado desde su fundación, cuáles son sus últimos proyectos, cómo funcionan DALL-E2, GPT-3, GPT-4, hasta el último GPT-4o?
El término «OpenAI», desde 2019, designa tanto la empresa con fines de lucro limitados, OpenAI LP, como la casa matriz sin fines de lucro, OpenAI Inc.
¿Qué es OpenAI?
El primer billón de dólares para su fundación fue financiado, entre otros, por: el CEO de Tesla Motors y SpaceX, Elon Musk; el cofundador de Paypal Peter Thiel; el presidente de la aceleradora de startups Y Combinator Sam Altman; la plataforma de servicios en la nube Amazon Web Services; la empresa india de consultoría tecnológica Infosys.
En febrero de 2018, Musk renunció al consejo de administración de OpenAI por un posible conflicto de intereses con la IA de Tesla y siguió siendo donante.
En 2019 se fundó OpenAI LP, una empresa «con fines de lucro limitados», para aumentar las inversiones en computación en la nube, personal e implementación de supercomputadoras basadas en IA, y al mismo tiempo poner un límite negociado a las posibles ganancias económicas para los inversores y empleados.
«Queremos aumentar nuestra capacidad de recaudar capital sin dejar de cumplir nuestra misión, y ninguna estructura legal preexistente que conozcamos alcanza el equilibrio adecuado»
Greg Brockman (Presidente y CTO) e Ilya Sutskever (Científico Jefe) en el blog.
En julio del mismo año, OpenAI LP anunció una inversión de mil millones de dólares por parte de Microsoft y la creación de una asociación de investigación, con la empresa fundada por Gates como proveedor exclusivo de la nube.
OpenAI LP es una subsidiaria de la organización sin fines de lucro Open AI Inc., que absorbe las ganancias económicas por encima del límite acordado.
¿Cómo Funciona OpenAI?
OpenAI LP, se lee en el sitio web oficial, emplea a un centenar de personas en tres áreas principales: capacidad, para hacer evolucionar los sistemas de IA; seguridad, para garantizar que estos sistemas sean éticos, y política, para asegurar una gobernanza adecuada de estos sistemas.
OpenAI LP es entonces el «brazo operativo», la subsidiaria de la organización sin fines de lucro OpenAI Inc, que gestiona los programas de divulgación y formación como OpenAI Residency, la iniciativa que absorbió los anteriores OpenAI Scholars y OpenAI Fellows.
Para la primera ronda, el «límite» del ROI se limitó a 100 veces el valor de cada inversión, y se anunció que el múltiplo disminuiría para las rondas futuras frente a un menor riesgo.
¿De qué se ocupa OpenAI?
La misión de Open AI, se lee en el sitio web oficial, es «garantizar que la inteligencia artificial general (AGI), con la que entendemos sistemas altamente autónomos que superan a los humanos en la mayoría de los trabajos económicamente válidos, beneficie a toda la humanidad».
En 2016, OpenAI lanzó tanto «OpenAI Gym«, plataforma dedicada al aprendizaje por refuerzo, como «Universe«, plataforma para medir y entrenar una IA a través de juegos y aplicaciones.
Le siguieron:
- Los «RoboSumo«, robots humanoides que aprenden de forma agonística;
- El «Debate Game«, un juego que enseña a las máquinas a discutir sus decisiones y ha planteado el tema de la IA explicable;
- «OpenAI Five«, cinco bots que en un videojuego aprenden a jugar contra humanos por prueba y error;
- «Dactyl«, IA que entrena a un robot con el mismo algoritmo de aprendizaje por refuerzo que los cinco bots.
Pero la fama de OpenAI está ligada a GPT-2, la inteligencia artificial lingüística, entrenada para predecir la siguiente palabra en una frase y, por lo tanto, poder traducir o generar automáticamente textos y/o respuestas en las conversaciones.
En febrero de 2019 se publicó la versión «reducida» de GPT-2 por preocupaciones sobre el uso de la tecnología: generar automáticamente texto es un excelente método para producir noticias falsas verosímiles. Pero, a pesar de estas preocupaciones, la versión completa llegó de todos modos en noviembre del mismo año.
La siguiente versión, GPT-3, se anunció en 2020: el código fuente nunca se publicó y el acceso se proporcionó exclusivamente a través de una API de Microsoft.
Aquí puedes leer la Historia de ChatGPT: Una Infografía para Comprender en Minutos.
En enero de 2021, OpenAI lanzó DALL-E, una versión de GPT-3 entrenada para generar imágenes a partir de descripciones de texto: dada una leyenda, la red neuronal artificial desarrolla la imagen correspondiente. En abril de 2022 se anunció DALL-E 2, capaz de producir imágenes con una resolución cuatro veces mayor que la anterior.
Cómo Funcionan GPT-3 y DALL-E 2
GPT-3, y su versión para imágenes DALL-E 2, se basan en una red neuronal artificial, construida según el modelo transformer, o transformador.
El modelo de aprendizaje profundo transformer se basa a su vez en el aprendizaje por auto-atención (self-attention): el algoritmo elige el «peso» que se le dará a las entradas, selecciona las más relevantes y sobre estas construye la salida.
Si consideramos, para simplificar, cada palabra de una frase como entrada, el modelo transformer decidirá qué palabras son las más importantes y a partir de estas generará el texto, la imagen o dará la respuesta en una conversación.
A diferencia de las redes neuronales recurrentes o convolucionales, el modelo transformer permite procesar todas las entradas secuenciales de una vez: la frase completa o el período completo, en lugar de una sola palabra. Una característica que lo hace preferible en las tareas de procesamiento del lenguaje natural (NLP).
Pero claramente esto presupone un salto de una IA sintáctica, capaz de generar salidas en base a la posición de las entradas, a una IA semántica, capaz de interpretar el significado de las entradas según el contexto. Capaz, por lo tanto, de reconstruir el contexto a partir de unas pocas entradas significativas. Un salto más fácil de decir que de hacer.
Pero en el éxito de este salto se basará el paso definitivo a la Inteligencia Artificial General – Artificial General Intelligence. OpenAI está en la frontera.
GPT-4, el Modelo más Potente
Desde el 14 de marzo de 2023, OpenAI ha lanzado GPT-4, presentándolo al mundo entero. Desde entonces, la startup ha puesto a disposición el acceso a GPT-4, permitiendo a otras empresas y desarrolladores de software aprovechar su potencial para crear sus propias aplicaciones personalizadas.
GPT-4 es mejor que GPT-3: es más preciso y es capaz, por ejemplo, de aprobar el examen de habilitación para el ejercicio de la profesión jurídica, de calcular instantáneamente los impuestos de una persona física y de proporcionar descripciones detalladas de imágenes.
GPT-4o, Dos Veces más Rápido que GPT-4 Turbo
GPT-4o, el nuevo modelo de inteligencia artificial de OpenAI, debutó el 13 de mayo de 2024: es un enorme paso adelante, especialmente en términos de accesibilidad y experiencia de usuario.
Lo presentó en el evento Spring Updates Mira Murati, directora de tecnología de OpenAI. La «o» significa omni, en el sentido de que el modelo es nativamente multimodal: acepta entradas y da salidas en texto, imágenes y visuales con fluidez.