GPT-4 | |||||
---|---|---|---|---|---|
Parte de OpenAI API | |||||
Información general | |||||
Tipo de programa | LLM | ||||
Lanzamiento inicial | 14 de marzo de 2023 | ||||
Información técnica | |||||
Programado en | Python | ||||
Serie OpenAI API | |||||
| |||||
Enlaces | |||||
GPT-4 (del inglés: Generative Pre-trained Transformer 4) es un modelo de lenguaje grande (LLM) creado por OpenAI. Se lanzó el 14 de marzo de 2023[1] y está disponible a través de la API y para los usuarios de ChatGPT Plus.[2][3][4]
Como modelo basado en transformer, GPT-4 fue preentrenado para predecir el siguiente token (utilizando tanto datos públicos como «datos con licencia de proveedores de terceros»), y luego fue ajustado mediante aprendizaje por refuerzo a partir de retroalimentación humana e inteligencia artificial (IA), para lograr una alineación con el ser humano y cumplir con las políticas.[5]
Resumiendo rumores de otros sitios, la revista técnica Vox informó de que GPT-4 era «a todas luces» superior a los modelos GPT-3 y GPT-3.5 de OpenAI lanzados anteriormente.[6][7][8] The Verge también citó rumores de que aumentaría sustancialmente el número de parámetros de GPT-3 de 175.000 millones a 100 billones, algo que el director ejecutivo de OpenAI, Sam Altman, describió como «una completa idiotez».[9] Los representantes estadounidenses Don Beyer y Ted Lieu confirmaron al New York Times que Altman visitó el Congreso en enero de 2023 para hacer una demostración de GPT-4 y sus «controles de seguridad» mejorados en comparación con otros modelos de IA.[10]
La organización produjo tres versiones de GPT-4 con contexto de 8, 32 y 128 mil tokens, una mejora significativa sobre GPT-3.5 y GPT-3, que estaban limitados a 4 y 2 mil tokens respectivamente.[11] A diferencia de su predecesor, GPT-4 puede tomar imágenes además de texto como entradas.[12]
<ref>
no válida; no se ha definido el contenido de las referencias llamadas gpt4_tech_report