Недавно OpenAI подверглась критике за проблемный запуск GPT-5. Многие пользователи назвали модель шагом назад, указывая на отсутствие индивидуальности и другие изменения, которые вызвали недовольство. Тем не менее,GPT-5 превосходит некоторые предыдущие модели в ряде аспектов.
Перед началом стоит отметить, что GPT-5 действительно менее индивидуальна. Ответы почти всегда краткие и прямолинейные. Это делает её менее подходящей для творческого письма, личной помощи, общения или редактирования, так как она убирает слишком много индивидуальности из текстов. Однако для некоторых задач такая прямолинейность является именно тем, что нужно. Для сложных задач, таких как глубокие исследования или изучение этических и научных концепций, требуются честные и прямые ответы.
Пользователям ChatGPT Plus можно вернуться к старым моделям. Но не стоит полностью отвергать GPT-5. Хотя стандартная версия GPT-5 автоматически выбирает подходящую модель для запроса, всегда можно переключиться на режим GPT-5 Thinking.
Рассмотрим подробнее, чем GPT-5 Thinking превосходит старые модели, включая 03 и 04-high-mini.
Парадоксально, но GPT-5 обладает большей индивидуальностью, чем старые модели мышления
Хотя GPT-5 кажется более прямолинейной и менее дружелюбной по сравнению с GPT-4o, она демонстрирует больше индивидуальности, чем 03, 04-mini-high и другие старые модели мышления.
Например, при обсуждении альтернативной истории Византии с моделями 03 и GPT-5, модель 03 сразу перешла к делу без тёплого тона, тогда как GPT-5 начала с разговорного, слегка угодливого оттенка: «Отличный запрос. Главное — делать изменения небольшими, целенаправленными и последовательными». GPT-5 сохраняла этот разговорный стиль, в то время как 03 была сухой и предпочитала перегружать таблицами вместо удобочитаемого ответа.
GPT-5 ощущается как промежуточный вариант между индивидуальностью 4o и сухостью 03. Лучше это или хуже — зависит от пользователя. GPT-5 кажется более живой, что делает её лучше для изучения философских или научных идей или обсуждения альтернативных сценариев реальности. Не все задачи выигрывают от этого, но разница заметна.
Цепочка рассуждений GPT-5 часто глубже и яснее
GPT-5 Thinking лучше справляется с цепочкой рассуждений по сравнению со старыми моделями мышления. В тестах GPT-5 Thinking не только дольше обрабатывала запросы, но и предоставляла более подробные и понятные цепочки рассуждений, чем 03.
В сценарии с альтернативной Византийской империей для рассказа 03 потратила 4 секунды и дала краткий ответ. GPT-5 Thinking заняла 47 секунд и вернула пять пунктов, каждый почти как полноценный абзац, больше похожий на внутренний монолог.
Что касается результатов, обе модели дали пищу для размышлений, хотя ни одна не была идеальной. Проверка фактов показала, что спекуляции обеих моделей в целом сбалансированы. Однако ответы GPT-5 в большинстве случаев были проще для понимания.
GPT-5 часто даёт тот же ответ быстрее, чем 03
В сложных запросах GPT-5 думает дольше, но с простыми вопросами дело обстоит иначе. Если ответ прост, GPT-5 обычно отвечает раньше.
Например, на вопрос, что произошло с Nintendo 5 января 1993 года, обе модели — GPT-03 и GPT-5 Thinking — указали на одно и то же судебное решение, но GPT-03 потратила более двух минут, а GPT-5 ответила за 40 секунд. Попытка запутать модели и вызвать галлюцинации не удалась, что радует.
Это лишь один пример, но за неделю использования GPT-5 в сравнении с GPT-03 творческое мышление последней иногда мешало ей отвечать быстро и прямо.
GPT-5 жертвует креативностью ради меньшего числа галлюцинаций
Многие отмечают, что GPT-5 менее креативна, и это в основном верно, даже для режима Thinking. Повторные запросы о стоицизме и других философских концепциях, заданные ранее в этом году моделям 03 или 04-mini-high, показали, что ответы GPT-5 более сдержанные, менее спекулятивные и более основаны на фактах.
Меньшая креативность означает, что GPT-5 Thinking реже выдумывает информацию. Для некоторых творческих задач более сухой подход GPT-5 может быть помехой, но творческие всплески часто приводят к ошибкам. Проверка старых ответов 03 показала, что некоторые творческие решения основывались на ложных предпосылках. С GPT-5 таких случаев было значительно меньше.
Для задач, где важны историческая и научная точность, это преимущество. Проверять каждую деталь теперь нужно реже.
GPT-5 лучше следует инструкциям
GPT-5 реже отклоняется от инструкций по сравнению со старыми моделями. С GPT-03 и её родственниками нередко случалось, что они игнорировали или неправильно понимали части инструкций. GPT-5 лучше справляется с точным выполнением запросов.
Например, добавление фразы «будьте честны» к вопросам, которые могут вызвать угодливый или слишком оптимистичный ответ, с 03 иногда не срабатывало — она поддерживала идею, даже если та была слабой и делала ложные связи. GPT-5 в таких случаях чаще возражает.
Забавно, но без чётких инструкций или явного запроса на критический ответ GPT-5 иногда может быть более угодливой или отклоняться от темы сильнее, чем 03. Приходится переосмысливать формулировку запросов для GPT-5, но с чёткими инструкциями она даёт лучшие результаты, чем 03 в большинстве случаев.
Вывод: для прямых задач, таких как «докажите» или «объясните», GPT-5 часто выдаёт более впечатляющие результаты. Для разговорных или творческих нужд результат зависит от модели.
Не стоит пока отказываться от GPT-5, даже если она не идеальна
Запуск GPT-5 был проблемным, и модель требует доработки, чтобы стать полноценной заменой GPT-4o и другим старым моделям.
На данный момент GPT-5 воспринимается как дополнение, подходящее для некоторых случаев, но не как основная модель. Разные модели используются для разных задач, и это вряд ли изменится, пока OpenAI не уберёт старые модели.
GPT-5 была переоценена, поэтому разочарование неизбежно. Проблема с потерей контекста по сравнению со старыми моделями вызывает беспокойство, и идея объединения всего в одну автоматическую модель пока неубедительна.
Тем не менее не стоит полностью отвергать GPT-5. Хоть она и несовершенна, в некоторых случаях она подходит лучше, чем старые модели, и предлагает уникальные функции, такие как режим агента. Рекомендуется использовать GPT-5 Thinking вместе с другими моделями, чтобы понять, в чём она хороша. Результат может удивить, если дать ей шанс.