В этом подробном интервью Андрей Карпатый (Andrej Karpathy), один из самых влиятельных инженеров в области искусственного интеллекта, сооснователь OpenAI и бывший глава отдела ИИ в Tesla, описывает фундаментальный сдвиг в разработке программного обеспечения. От классического кодинга мир переходит к «вайб-кодингу» и агентному инжинирингу, где нейросети становятся не просто помощниками, а полноценными исполнителями, способными самостоятельно развертывать приложения и исправлять ошибки.
🚀 Новая эра: от программирования к «вайб-кодингу» 0:41
Андрей Карпатый признается, что в последнее время он «никогда не чувствовал себя настолько отстающим программистом», как сейчас . Это ощущение вызвано резким скачком возможностей LLM (больших языковых моделей), который он зафиксировал в декабре 2023 года. По словам инженера, если раньше модели выдавали куски кода, которые требовали ручной доработки, то теперь они создают рабочие решения целиком, а человеку остается лишь доверять системе .
Карпатый ввел термин vibe coding («вайб-кодинг»), чтобы описать этот процесс: программист больше не пишет синтаксические конструкции, а транслирует «вайб» — общее намерение и описание задачи.
Основные этапы эволюции софта по Карпатому:
- Software 1.0 (Классический код): Программист прописывает явные правила и условия. .
- Software 2.0 (Нейросети): Программирование заключается в подготовке наборов данных и обучении весов сетей. .
- Software 3.0 (Prompting/Agents): Весь контекстный поток и промпты становятся рычагом управления LLM, которая выступает в роли интерпретатора. .
В качестве примера Карпатый приводит установку OpenClaw. Раньше для этого требовался сложный Bash-скрипт, учитывающий десятки операционных систем. Теперь это просто блок текста, который нужно скопировать и отдать агенту . Агент сам анализирует окружение компьютера, находит нужные зависимости и исправляет ошибки в процессе установки .
🖼️ История «MenuGen»: почему традиционные приложения умирают 4:58
Карпатый рассказал о своем проекте MenuGen — приложении для распознавания меню в ресторанах без картинок. Изначально он создавал его в парадигме Software 2.0: писал код на Vercel, настраивал OCR для распознавания текста, подключал генератор изображений и фронтенд для рендеринга .
Однако вскоре он увидел версию этого же функционала в парадигме Software 3.0: человек просто дает фото меню модели Gemini и просит наложить картинки блюд поверх оригинала. Нейросеть выдает готовое изображение с измененными пикселями .
По мнению Карпатого, это доказывает, что:
- Огромное количество существующего кода «эфемерно» и скоро станет не нужным .
- Нейросети забирают на себя всё больше работы, исключая необходимость в «прослойках» в виде традиционных приложений .
- Программирование превращается в общую автоматизацию обработки информации .
🧩 Концепция «зубчатого интеллекта» (Jagged Intelligence) 9:37
Одним из ключевых барьеров текущих моделей Карпатый называет «зубчатую» (неравномерную) форму интеллекта. Модели показывают невероятные результаты в проверяемых областях, но могут провалиться в элементарных бытовых вопросах.
Примеры «зубчатости»:
- Модель может рефакторить кодовую базу на 100 000 строк или находить уязвимости нулевого дня .
- При этом та же модель может посоветовать идти пешком до автомойки, которая находится в 50 метрах, не понимая контекста задачи (зачем идти на мойку без машины?) .
Карпатый объясняет это тем, что лаборатории (OpenAI, Anthropic и др.) обучают модели в средах с обучением с подкреплением (RL), где легко задать функцию вознаграждения за правильный ответ в математике или коде . Если область верифицируема, модель в ней «взлетает». Если данных в обучающей выборке было мало (как было с шахматами до GPT-4), модель будет слабой, пока кто-то из инженеров специально не добавит нужные датасеты .
🛠️ Агентный инжиниринг как новая дисциплина 15:53
Если «вайб-кодинг» — это способ поднять планку возможностей для всех, то агентный инжиниринг (Agentic Engineering) — это профессиональная дисциплина по сохранению качества .
По мнению Карпатого, агентный инженер должен:
- Координировать работу «стохастических и иногда ошибающихся» агентов, чтобы они не создавали уязвимостей .
- Усилить продуктивность не в 10 раз (старый миф о 10x-инженере), а значительно больше — верхний предел возможностей здесь еще не достигнут .
- Перейти от решения мелких пазлов к управлению крупными проектами. Вместо теста на знание алгоритмов, на собеседовании стоит просить кандидата создать клон Twitter с помощью агентов и проверить его на безопасность с помощью других моделей .
Человеческий навык, который станет наиболее ценным в этой среде — это вкус и суждение (taste and judgment) . Агенты пока ведут себя как «стажеры»: они могут перепутать email-адреса пользователя из разных систем или создать избыточный, «раздутый» код с плохими абстракциями . Человек остается в роли архитектора и цензора, контролирующего «спецификацию» и эстетику конечного продукта.
👻 Суммон призраков и будущее образования 23:42
Андрей Карпатый сравнил современные ИИ не с животными, обладающими инстинктами, а с «призраками», которых мы вызываем (summoning ghosts) . У них нет собственной любознательности или внутренней мотивации; они созданы статистическими схемами и функциями вознаграждения .
В вопросе образования Карпатый цитирует мысль, которая его поразила: «Вы можете делегировать мышление, но не можете делегировать понимание» . Даже когда интеллект станет максимально дешевым, человек останется «узким горлышком» системы.
Главные выводы для будущего:
- Понимание (Understanding) — это единственный способ эффективно направлять агентов. Без него невозможно быть «режиссером» процесса .
- Агентно-нативная инфраструктура — мир должен быть переписан под агентов. Документация не должна объяснять человеку, что делать; она должна содержать блоки, удобные для копирования в промпт .
- Автоматизация развертывания — идеалом будет возможность дать промпт «построй это», и система сама настроит DNS, серверы и базы данных без участия человека в интерфейсах .