Wes Roth: «Запуск GPT-5 — это провал роутера, а не интеллекта»

Релиз новой модели GPT-5 от OpenAI вызвал неоднозначную реакцию в ИТ-сообществе: от восторгов разработчиков до заявлений о крахе надежд на создание сильного искусственного интеллекта (AGI). Пока критики указывают на галлюцинации и математические ошибки, практики демонстрируют впечатляющие возможности модели в создании сложных программных продуктов и «вайб-кодинге».

📉 Волна разочарования: Гари Маркус и «пузырь ИИ» 0:00

Первые 24 часа после выхода GPT-5 ознаменовались шквалом критики. Известный скептик в области ИИ Гари Маркус назвал результаты работы модели «крайне разочаровывающими» . По его мнению, GPT-5 — это в значительной степени продукт маркетинга и хайпа, который не приближает человечество к созданию AGI (сильного ИИ) .

Критика Маркуса подкрепляется следующими тезисами:

OpenAI начинает отставать от конкурентов, несмотря на колоссальные инвестиции .
Огромные вложения Илона Маска и других технологических гигантов в дата-центры могут не окупиться, так как текущий подход к обучению моделей, по мнению Маркуса, зашёл в тупик .
В социальных сетях, в частности на Reddit, пользователи массово заявляют об отмене подписок, утверждая, что OpenAI теряет доверие из-за галлюцинаций модели .

Одним из самых резонансных примеров неудачи стала проверка математических способностей модели. В ряде тестов GPT-5 выдала абсурдные результаты, заявив, например, что число 69 равно 30 и при этом меньше 52 . Также модель показала результаты хуже ожидаемых в тесте Simple Bench, заняв лишь пятое место и не сумев превзойти человеческий базовый уровень .

🔌 Технический сбой или архитектурный выбор: проблема роутера 1:47

Ведущий канала Wes Roth объясняет, что негативный опыт многих пользователей связан не с качеством самой «умной» модели, а с работой системы распределения запросов (роутинга) . GPT-5 — это не одна монолитная модель, а целое семейство. Чтобы снизить расходы и увеличить скорость, OpenAI использует автоматический переключатель (auto switcher), который направляет простые запросы на дешевые и быстрые модели (например, уровня Nano), а сложные — на «тяжелые» версии с высоким уровнем рассуждения (reasoning) .

По словам участника команды OpenAI под ником Rune, система автоматического переключения в день запуска работала некорректно . Это привело к тому, что сложные задачи попадали на слабые модели, вызывая те самые нелепые ошибки и галлюцинации . Сэм Альтман позже подтвердил в Reddit AMA, что «границы принятия решений» роутера будут уточняться, а пользователям предоставят больше прозрачности в том, какая именно модель отвечает на их запрос в данный момент .

🎮 Практический триумф: «Nightfall Survivors» и вайб-кодинг 3:50

В противовес критикам, Wes Roth продемонстрировал возможности GPT-5 в создании программного обеспечения. Используя режим максимального рассуждения (GPT-5 Max/Pro) в среде Cursor, он смог практически «в один присест» создать полноценный клон игры Vampire Survivors под названием Nightfall Survivors .

Особенности созданной игры:

Плавный геймплей с работающей системой здоровья (HP) и прокачкой уровней .
Реализованная механика перезарядки патронов и рывков (dash) со взрывами .
Автономные дроны, которые летают вокруг игрока, стреляют и замедляют врагов .
Полное музыкальное сопровождение и звуковые эффекты (например, фраза «Fresh meat» при появлении босса) .

Ведущий описывает этот процесс как «вайб-кодинг» (vibe coding) — это сверхбыстрая итерация, когда идея превращается в работающий код менее чем за минуту . По мнению автора, GPT-5 в режиме Pro значительно превосходит предыдущие версии в понимании инструкций и способности вносить правки в существующий код без поломки всей структуры .

🏗️ Создание миров: опыт Итана Моллика и Мэтта Шумера 8:47

Профессор Итан Моллик также высоко оценил возможности новой модели, назвав её релиз «большим событием» . Он привел пример сложной задачи на рассуждение: модель написала текст, где каждое следующее предложение длиннее предыдущего ровно на одно слово, а первые буквы слов образуют акростих «This is a big deal» .

Кроме того, в ИИ-сообществе обсуждаются следующие достижения GPT-5:

3D-строительство: Моллик продемонстрировал создание игры-симулятора застройки 3D-города .
MMO-игры: Пользователи сообщают о создании зачатков многопользовательских ролевых онлайн-игр с использованием 3JS и GPT-5 всего за 6 минут .
Оптимизация агентов: Мэтт Шумер отметил, что плохой опыт некоторых пользователей связан с использованием старых инструментов управления агентами (agent harnesses), которые ещё не адаптированы под архитектуру GPT-5 .

🧠 Код против слов: новая парадигма интеллекта 10:47

Wes Roth выдвигает тезис, что мы наблюдаем разрыв между «языковым» и «когнитивным» интеллектом моделей. Способности GPT-5 к написанию кода прогрессируют гораздо быстрее, чем навыки чисто вербального общения .

Основные выводы об эволюции моделей:

Математика через инструменты: Глупо требовать от нейросети считать «в уме». По мнению ведущего, GPT-5 должна сама писать микро-код для калькулятора, чтобы решать математические задачи, что даст 100% точность .
Длинный горизонт планирования: Модель становится способна выполнять задачи, которые у стажера-человека заняли бы несколько часов (например, создание приложения для анализа расходов компании или создание 3D-сетки зданий) .
Создание кастомного ПО: Главная сила GPT-5 не в ответах на вопросы, а в мгновенном создании узкоспециализированных инструментов для решения конкретных проблем пользователя .

Хотя ведущий признает возможность некоторого «плато» в обучении гигантских моделей и S-образного замедления прогресса , он утверждает, что ИИ-разработки далеки от завершения. GPT-5 — это мощное инкрементальное улучшение, которое, несмотря на «ухабы» при запуске, кардинально меняет подход к разработке софта .