Компания OpenAI представила новую модель GPT-4o, которая станет доступна для всех пользователей в течение следующих нескольких недель. Она предлагает премиальные функции GPT-4 вместе с обновлённым веб-интерфейсом. Во время презентации технический директор OpenAI Мира Мурати продемонстрировала некоторые возможности новой языковой модели.
По словам компании, GPT-4o делает «шаг к гораздо более естественному взаимодействию между человеком и компьютером». Новая модель может обрабатывать текст, изображения и аудио, а также помогать пользователям на основе этой информации. Голосовой режим теперь работает более плавно, обеспечивая более быстрые ответы и улучшенное понимание. Ранее голосовой режим использовал три разные модели для транскрипции, обработки и преобразования текста в речь, что приводило к задержкам в ответах. GPT-4o, напротив, выполняет все эти задачи самостоятельно.
Теперь вы можете поделиться информацией с моделью с помощью камеры телефона и задавать вопросы голосом. Сообщается, что новая модель может отвечать на голосовые запросы за 232 миллисекунды, что сопоставимо со временем реакции человека. Модель также может отвечать разными тонами в соответствии с предпочтениями пользователя. По сравнению с GPT-4 Turbo, новая модель лучше и быстрее понимает иностранные языки (в видеоролике продемонстрирован перевод с итальянского на английский).
Важно отметить, что GPT-4o также будет доступен через API, что позволит разработчикам создавать и совершенствовать ИИ-приложения с использованием возможностей новой модели.
В то время как новая модель предлагает базовые функции бесплатно, премиум-пользователи смогут использовать в пять раз больше ресурсов по сравнению с бесплатной версией.
Компания также выпустила приложение ChatGPT для настольных компьютеров на базе macOS от Apple. Приложение для macOS предлагает более глубокую интеграцию с платформой. OpenAI хочет упростить пользователям интеграцию инструмента в их рабочие процессы.