Компания OpenAI обладает явным преимуществом в гонке ИИ, что может оказаться непреодолимым для конкурентов. У ChatGPT больше еженедельных пользователей, чем у Meta или Google за месяц. Быть первым приносит преимущества, которые OpenAI успешно использует.
Однако со временем конкуренты догнали — по крайней мере, на функциональном уровне. Модели ИИ от Google, DeepSeek, Claude и xAI занимали первые пять мест в рейтинге LMArena, что указывает на то, что гонка от базовых больших языковых моделей (LLM) к искусственному общему интеллекту (AGI) далека от завершения. На протяжении месяцев считалось, что Gemini 2.5 Pro — более совершенная и универсальная модель мышления, чем любая разработка OpenAI.
OpenAI стремится изменить это мнение с выпуском GPT-5, который стал доступен всем 7 августа. Это не одна модель, а набор моделей, способных автоматически выбирать наиболее подходящую для конкретного запроса. На данный момент она лидирует в рейтингах LMArena и WebDev Arena — двух ключевых бенчмарках LLM.
GPT-5 не решает всех проблем с галлюцинациями ChatGPT и определённо не является AGI. В некоторых областях модели Google всё ещё превосходят аналоги от OpenAI. Тем не менее GPT-5 выглядит впечатляюще и доступна бесплатно, чего может быть достаточно для сохранения значительного преимущества OpenAI над конкурентами.
В чём GPT-5 от OpenAI превосходит Gemini 2.5 Pro от Google
Самая сильная особенность GPT-5 не связана с вычислительной мощностью или базой знаний. Это маршрутизатор в реальном времени, который выбирает подходящую модель для задачи без участия пользователя. Сейчас чат-боты ИИ, такие как ChatGPT и Gemini, предлагают множество новых, старых и экспериментальных моделей, каждая из которых лучше подходит для определённых запросов. Это удобно, но выбор модели ложился на пользователя. Названия вроде GPT-o3, GPT-4o или Gemini Flash Thinking Experimental усложняли задачу.
GPT-5 — это простое название для набора моделей OpenAI. В него входят лёгкая модель для быстрых и простых запросов и более продуманная модель GPT-5 Thinking для сложных задач. Маршрутизатор в реальном времени делает эти модели единым целым для пользователя. После ввода запроса в ChatGPT маршрутизатор GPT-5 решает, какую модель использовать, упрощая взаимодействие.
Можно вручную управлять выбором модели GPT-5. Например, фраза «подумай как следует» в запросе активирует GPT-5 Thinking. Если ChatGPT ошибочно выберет модель для сложных задач, можно нажать «Дать быстрый ответ», чтобы переключиться на лёгкую модель. Обе модели в ранних тестах показали высокую надёжность, чётко ссылаясь на источники во избежание галлюцинаций.
Онлайн-источники способствуют снижению галлюцинаций в GPT-5. OpenAI сообщает, что с включённым веб-поиском в запросах GPT-5 вероятность фактических ошибок на 45% ниже, чем у GPT-4o. Галлюцинации не исчезли полностью, но их стало меньше при использовании GPT-5 в ChatGPT.
Независимые тесты и бенчмарки подтверждают заявления OpenAI о превосходстве GPT-5 в написании текстов, программировании и связанных со здоровьем задачах. Она обошла Gemini 2.5 Pro в рейтингах LMArena и WebDev Arena, заняв первое место. В частности, GPT-5 показывает преимущество в текстовых и программных запросах. Тест возможностей программирования GPT-5 в ChatGPT с использованием примера от OpenAI оставил сильное впечатление.
Где Gemini всё ещё превосходит ChatGPT
GPT-5 не лучше Gemini 2.5 Pro во всех областях, и OpenAI пока не удаётся сравниться с Google в генерации изображений и видео. Это подтверждается бенчмарками LMArena по генерации текста в изображение, текста в видео и изображения в видео — инструменты Google Imagen 4 и Veo 3 доминируют в этих тестах.
Для проверки этого результата в реальных условиях ChatGPT и Gemini получили одинаковый запрос: «Сгенерировать изображение Джонни Тандербёрда, держащего кубок турнира Big East в Мэдисон Сквер Гарден». Результаты показали: изображения, сгенерированные Gemini, соответствуют бенчмаркам — возможности Google в генерации видео и изображений значительно превосходят OpenAI. Gemini создала изображение за 10 секунд, тогда как ChatGPT потребовалось почти две минуты.
С точки зрения точности Gemini уверенно победила. Она распознала ссылку на баскетбольную программу по упоминанию талисмана и точно воссоздала Мэдисон Сквер Гарден с множеством деталей. ChatGPT же сгенерировала изображение с неправильной командой, и фон выглядел как обычная баскетбольная площадка, а не Мэдисон Сквер Гарден.
Таким образом, для тех, кто выбирает модель в зависимости от задачи, стоит использовать GPT-5 для написания текстов или программирования, а Gemini — для генерации изображений или видео.
GPT-5 хороша, но GPT-4o не уходит
Внедрение GPT-5 осложняется привязанностью пользователей к старым моделям. Разработка GPT-5 заняла более двух лет, так как OpenAI стремилась создать модель, достойную этого названия. Однако оказалось, что пользователи не хотели новой модели. OpenAI возвращает GPT-4o, которую планировалось заменить на GPT-5, из-за протестов пользователей.
Это может показаться странным, но пользователи ChatGPT, похоже, сформировали эмоциональную связь с моделями OpenAI. Они предпочитают знакомую модель, даже если новая лучше во всех отношениях.
Эта ситуация отражает общую картину гонки ИИ. В некотором смысле не так важно, у кого — Google, OpenAI, Claude или DeepSeek — лучшая модель. Пользователи будут выбирать знакомые и предпочтительные модели, и в этом случае лидерство OpenAI в этой области может оказаться недосягаемым для конкурентов.