Wes Roth: «Запуск GPT-5 — это провал роутера, а не интеллекта»

Wes Roth 121 тыс. 16 мин 4 мин 08.08.2025
Главное

Релиз новой модели GPT-5 от OpenAI вызвал неоднозначную реакцию в ИТ-сообществе: от восторгов разработчиков до заявлений о крахе надежд на создание сильного искусственного интеллекта (AGI). Пока критики указывают на галлюцинации и математические ошибки, практики демонстрируют впечатляющие возможности модели в создании сложных программных продуктов и «вайб-кодинге».

📉 Волна разочарования: Гари Маркус и «пузырь ИИ» 0:00

Первые 24 часа после выхода GPT-5 ознаменовались шквалом критики. Известный скептик в области ИИ Гари Маркус назвал результаты работы модели «крайне разочаровывающими» . По его мнению, GPT-5 — это в значительной степени продукт маркетинга и хайпа, который не приближает человечество к созданию AGI (сильного ИИ) .

Критика Маркуса подкрепляется следующими тезисами:

Одним из самых резонансных примеров неудачи стала проверка математических способностей модели. В ряде тестов GPT-5 выдала абсурдные результаты, заявив, например, что число 69 равно 30 и при этом меньше 52 . Также модель показала результаты хуже ожидаемых в тесте Simple Bench, заняв лишь пятое место и не сумев превзойти человеческий базовый уровень .

🔌 Технический сбой или архитектурный выбор: проблема роутера 1:47

Ведущий канала Wes Roth объясняет, что негативный опыт многих пользователей связан не с качеством самой «умной» модели, а с работой системы распределения запросов (роутинга) . GPT-5 — это не одна монолитная модель, а целое семейство. Чтобы снизить расходы и увеличить скорость, OpenAI использует автоматический переключатель (auto switcher), который направляет простые запросы на дешевые и быстрые модели (например, уровня Nano), а сложные — на «тяжелые» версии с высоким уровнем рассуждения (reasoning) .

По словам участника команды OpenAI под ником Rune, система автоматического переключения в день запуска работала некорректно . Это привело к тому, что сложные задачи попадали на слабые модели, вызывая те самые нелепые ошибки и галлюцинации . Сэм Альтман позже подтвердил в Reddit AMA, что «границы принятия решений» роутера будут уточняться, а пользователям предоставят больше прозрачности в том, какая именно модель отвечает на их запрос в данный момент .

🎮 Практический триумф: «Nightfall Survivors» и вайб-кодинг 3:50

В противовес критикам, Wes Roth продемонстрировал возможности GPT-5 в создании программного обеспечения. Используя режим максимального рассуждения (GPT-5 Max/Pro) в среде Cursor, он смог практически «в один присест» создать полноценный клон игры Vampire Survivors под названием Nightfall Survivors .

Особенности созданной игры:

Ведущий описывает этот процесс как «вайб-кодинг» (vibe coding) — это сверхбыстрая итерация, когда идея превращается в работающий код менее чем за минуту . По мнению автора, GPT-5 в режиме Pro значительно превосходит предыдущие версии в понимании инструкций и способности вносить правки в существующий код без поломки всей структуры .

🏗️ Создание миров: опыт Итана Моллика и Мэтта Шумера 8:47

Профессор Итан Моллик также высоко оценил возможности новой модели, назвав её релиз «большим событием» . Он привел пример сложной задачи на рассуждение: модель написала текст, где каждое следующее предложение длиннее предыдущего ровно на одно слово, а первые буквы слов образуют акростих «This is a big deal» .

Кроме того, в ИИ-сообществе обсуждаются следующие достижения GPT-5:

🧠 Код против слов: новая парадигма интеллекта 10:47

Wes Roth выдвигает тезис, что мы наблюдаем разрыв между «языковым» и «когнитивным» интеллектом моделей. Способности GPT-5 к написанию кода прогрессируют гораздо быстрее, чем навыки чисто вербального общения .

Основные выводы об эволюции моделей:

  1. Математика через инструменты: Глупо требовать от нейросети считать «в уме». По мнению ведущего, GPT-5 должна сама писать микро-код для калькулятора, чтобы решать математические задачи, что даст 100% точность .
  2. Длинный горизонт планирования: Модель становится способна выполнять задачи, которые у стажера-человека заняли бы несколько часов (например, создание приложения для анализа расходов компании или создание 3D-сетки зданий) .
  3. Создание кастомного ПО: Главная сила GPT-5 не в ответах на вопросы, а в мгновенном создании узкоспециализированных инструментов для решения конкретных проблем пользователя .

Хотя ведущий признает возможность некоторого «плато» в обучении гигантских моделей и S-образного замедления прогресса , он утверждает, что ИИ-разработки далеки от завершения. GPT-5 — это мощное инкрементальное улучшение, которое, несмотря на «ухабы» при запуске, кардинально меняет подход к разработке софта .

💬 Цитаты

«GPT-5 переработала всю мою кодовую базу одним вызовом. Ничего не заработало, но, черт возьми, это было красиво.»

Уэс Рот (цитируя шутку из сети) 0:40

«Мы дошли до точки, когда способности к кодингу становятся намного лучше, чем вербальные способности модели.»

«GPT-5 будет казаться умнее уже с сегодняшнего дня.»

Сэм Альтман 15:02
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
AGI
Искусственный интеллект общего уровня, способный выполнить любую интеллектуальную задачу, доступную человеку.
Роутинг (Routing)
Автоматическое распределение запросов пользователя между разными по мощности моделями для экономии ресурсов.
Вайб-кодинг (Vibe coding)
Стиль разработки, при котором программист описывает идеи на естественном языке, а ИИ мгновенно воплощает их в код.
Галлюцинации
Склонность ИИ-моделей уверенно выдавать фактически неверную или выдуманную информацию.
📊 Цифры
🗓 Хронология
  1. Сентябрь 2024 (условно) Релиз GPT-5 и массовые жалобы на некорректную работу.
  2. Первые 24 часа Сбой системы автоматического переключения моделей (auto switcher).
  3. Через 24 часа после релиза Сэм Альтман проводит AMA на Reddit, обещая исправления и прозрачность роутинга.
⚖️ Другая сторона
Искусственный интеллект OpenAI GPT-5 Sam Altman Gary Marcus Vibe Coding