OpenAI работает над запуском своей нового поколения мультимодельной модели большого языкового объема (LLM), GPT-Vision, до дебюта модели Gemini от Google.
Мультимодельные LLM могут обрабатывать несколько форм данных, таких как текст и изображения, что делает их универсальными для различных приложений, включая понимание естественного языка и интерпретацию изображений.