# Уэс Рот: «GPT-5.4 стирает грань между ИИ и экспертами с 14-летним стажем»

Источник: https://www.youtube.com/watch?v=9zVZVtPMU6Y
Канал: Wes Roth
Опубликовано: 05.03.2026

---

В новом выпуске автор канала Wes Roth анализирует стремительный рывок в развитии искусственного интеллекта, спровоцированный выходом модели GPT-5.4. Главными темами стали достижение нейросетью уровня человеческой компетенции в узких профессиональных областях, интеграция функций нативного управления компьютером и неожиданные юридические сложности Anthropic во взаимодействии с государственным сектором США.

## 🚀 Прорыв GPT-5.4: Превосходя экспертов и обходя «стены»
[[JUMP:0:00]]

Новая модель GPT-5.4 демонстрирует результаты, которые автор видео называет «пугающе хорошими» в решении экономически значимых задач [0:12]. Исследователь OpenAI Ноам Браун, комментируя прогресс, подчеркивает, что разработчики «не видят стены» (предела масштабируемости), которая могла бы замедлить развитие интеллектуальных способностей моделей в ближайшем будущем [0:12].

Одним из ключевых доказательств этого скачка стал бенчмарк GDP Val. Этот тест оценивает работу ИИ по критериям, разработанным профессионалами с опытом управления более 12–14 лет в таких компаниях, как Deloitte, Wells Fargo и Google [2:50]. Суть теста заключается в сравнении финального результата (deliverable), созданного опытным человеком, и результата, сгенерированного моделью по тому же брифу.

Результаты GPT-5.4 Pro в этом тесте впечатляют:

*   Общий показатель успеха (победа или ничья с экспертом-человеком) составил 82–83% [3:02].
*   Чистый процент побед (когда работа ИИ признана лучше человеческой) достигает 70% [3:14].
*   Модель оценивалась в таких ролях, как инженер-технолог, клерк по заказам и продюсер [1:43].

По мнению Уэса Рота, эти цифры ставят под вопрос будущее многих офисных профессий, так как автоматизация начинает покрывать задачи, ранее требовавшие десятилетий опыта [3:27].

## 🖥️ Эра нативного управления компьютером: Конец «черного экрана»
[[JUMP:4:33]]

GPT-5.4 стала первой универсальной моделью с нативными возможностями управления компьютером (computer use) [4:33]. В отличие от предыдущих итераций, где ИИ лишь писал код, который человек должен был запустить, новая модель напрямую взаимодействует с интерфейсом ОС, используя зрение и эмуляцию действий мыши и клавиатуры.

В бенчмарке OS World, который измеряет способность агента перемещаться по рабочему столу и выполнять задачи, GPT-5.4 установила новый рекорд:

1.  Уровень успеха составил 75%, что выше среднего показателя человека (72,4%) [5:24].
2.  Для сравнения: предыдущая версия GPT-5.2 имела показатель всего 47% [5:36].
3.  Модель эффективно использует библиотеки автоматизации (например, Playwright) и визуальный фидбек через скриншоты [4:58].

Уэс Рот отмечает, что это решает давнюю проблему «черного экрана». Ранее при попытке создать игру или веб-сайт через чат-бота пользователь часто получал нерабочий код. На замечание «я вижу просто черный экран» ИИ извинялся, но часто не мог исправить ошибку, так как не видел результата своей работы [7:07]. Теперь модель может сама открыть браузер, увидеть ошибку и итерировать код до тех пор, пока визуальный результат не будет соответствовать задаче [7:33].

Примером практического применения стал опыт разработчика Кори Чинга, который с помощью GPT-5.4 и Playwright создал тактическую пошаговую RPG, где ИИ сам тестировал геймплей и визуальные элементы [6:16].

## 💼 Экспансия в финансы и профессиональные навыки
[[JUMP:7:58]]

OpenAI явно заимствует стратегию Anthropic, внедряя поддержку специализированных «навыков» (skills) и инструментов миграции [7:58]. Одним из главных направлений стала финансовая сфера. Райан Брюэр, занимающийся финансовыми продуктами в OpenAI, утверждает, что после разработки ПО именно финансы станут областью, которая получит наибольшую выгоду от ИИ [8:49].

Новые возможности включают:

*   Интеграция ChatGPT напрямую в Excel для автоматизации сложных вычислений [8:11].
*   «Приоритетный режим» (Priority Mode) для ускоренной генерации ответов [9:02].
*   Возможность прерывать модель в процессе генерации для корректировки направления мысли [9:15].

На внутреннем бенчмарке инвестиционного банкинга, который включает финансовое моделирование и сценарный анализ (задачи, занимающие у аналитиков дни), GPT-5.4 набрала 87 баллов из 100. Для сравнения, GPT-5.2 Pro набирает 71 балл, а Opus 4.6 от Anthropic — всего 64 балла [9:40].

## ⚖️ Юридический удар по Anthropic и ситуация на рынке труда
[[JUMP:0:25]]

На фоне технологических успехов компания Anthropic столкнулась с серьезным бюрократическим барьером: она официально признана «риском для цепочки поставок» (supply chain risk) [0:25]. Это решение Министерства обороны США (Department of War в терминологии транскрипта) может ограничить использование модели Claude в государственных контрактах.

Однако есть важные нюансы:

*   Anthropic намерена оспаривать этот статус в суде [0:38].
*   Ограничение касается только тех случаев, когда Claude является прямой частью контрактов с военным ведомством, а не всех клиентов компании, имеющих такие контракты [0:50].

Параллельно Anthropic опубликовала исследование о влиянии ИИ на рынок труда. Основной вывод: массового замещения пока не наблюдается, но темпы найма молодых специалистов (выпускников колледжей) заметно замедляются [3:53]. Компании все меньше нуждаются в сотрудниках начального уровня для выполнения рутинных задач, которые теперь берет на себя ИИ [4:06].

## 🔄 Кадровая ротация и конкуренция
[[JUMP:10:05]]

В индустрии продолжается миграция ключевых талантов. Известный исследователь Макс Шварцер покинул OpenAI, чтобы присоединиться к Anthropic [10:05]. Шварцер был значимой фигурой: он участвовал в разработке парадигмы рассуждений (reasoning) и запуске модели o1-preview [10:17]. По его словам, уход не связан с конфликтами — он просто хочет работать с коллегами, которым доверяет и которые перешли в Anthropic ранее [10:42].

Рынок остается перенасыщенным новыми релизами:

*   Google выпустила Gemini 3.1 Flashlight [10:56].
*   Илон Маск представил вторую бету Grok 4.0 [11:08].
*   Уэс Рот упоминает о технических сбоях на своем сайте (natural20.com) из-за проблем с API Anthropic, что подчеркивает растущую зависимость частных разработчиков от стабильности облачных ИИ-провайдеров [11:49].

Автор заключает, что текущий момент — это начало новой эры, где грань между человеческим и машинным выполнением сложных интеллектуальных задач практически стирается [12:42].