تعمل OpenAI على إطلاق جيلها التالي من نموذج اللغة الكبيرة المتعدد الوسائط (LLM)، GPT-Vision، قبل ظهور نموذج Gemini من Google.
يمكن لنماذج LLM المتعددة الوسائط معالجة أشكال متعددة من البيانات مثل النصوص والصور، مما يجعلها متعددة الاستخدامات لتطبيقات مختلفة بما في ذلك فهم اللغة الطبيعية وتفسير الصور.