Разработчик Чарли Хольц использовал GPT-4 Vision и технологию клонирования голоса ElevenLabs для создания неавторизованной версии Дэвида Аттенборо, озвучивающей каждое движение Хольца на камере, что получило более 21 000 лайков.
Искусственный интеллект использует скрипт на Python для обработки изображений и создания текста в стиле озвучки Аттенборо, который затем преобразуется в аудио с использованием голосового профиля, обученного на речи Аттенборо.