Экс-директор Tesla Андрей Карпатый выпустил open-source агента для самосовершенствования ИИ

Бывший ведущий исследователь OpenAI и экс-директор по ИИ в Tesla Андрей Карпатый (Andrej Karpathy) представил новый проект, который может радикально изменить индустрию искусственного интеллекта. Речь идет о auto-researcher — автономном агенте с открытым исходным кодом, способном самостоятельно проводить научные исследования и оптимизировать алгоритмы машинного обучения без участия человека. По мнению автора канала Wes Roth, этот релиз приближает нас к гипотетическому «взрыву интеллекта», когда ИИ начинает совершенствовать сам себя быстрее, чем это под силу людям.

🚀 Взрыв интеллекта: от гипотез к реальности 0:52

В основе обсуждения лежит концепция «взрыва интеллекта» (intelligence explosion), которую активно продвигает Леопольд Ашенбреннер (Leopold Aschenbrenner), бывший исследователь безопасности в OpenAI . Ашенбреннер утверждает, что как только ИИ станет достаточно мощным, чтобы заменить исследователей-людей, прогресс перейдет в стадию рекурсивного самосовершенствования. Это создаст кратчайший путь от «сильного ИИ» (AGI) к «суперинтеллекту» (ASI) .

Вес Рот отмечает, что хотя многие эксперты отрицают возможность того, что текущие модели могут существенно улучшать следующие поколения ИИ, практика говорит об обратном:

Исследователи из Google, Anthropic и OpenAI уже используют ИИ для помощи в разработке .
Представители xAI (компании Илона Маска) заявляют, что рекурсивное самосовершенствование может быть достигнуто в ближайшие 12 месяцев .
Андрей Карпатый, по мнению ведущего, сделал эту технологию доступной для каждого, выпустив легковесный инструмент для домашних ПК .

🧠 «Мясные компьютеры» против автономных роев 3:14

В описании своего проекта на GitHub Карпатый рисует футуристическую картину, представляя взгляд из марта 2026 года . Он иронично называет людей «мясными компьютерами» (meat computers), которые тратят время на еду, сон и бесконечные совещания, пытаясь синхронизировать свои идеи . По прогнозу Карпатого, эра человеческих исследований в области ИИ уйдет в прошлое, уступив место автономным роям агентов, работающих в «облачных мегаструктурах» .

Основная идея auto-researcher предельно проста:

Агенту дается доступ к коду обучения небольшой языковой модели (LLM).
ИИ автономно модифицирует код (архитектуру, гиперпараметры, оптимизаторы) .
Запускается короткое обучение (около 5 минут).
Агент проверяет, улучшились ли результаты (валидационные потери).
Успешные изменения сохраняются, неудачные — отбрасываются, и цикл повторяется бесконечно .

🧬 Цифровая эволюция и «машина Дарвина-Гёделя» 5:26

Вес Рот проводит прямую аналогию между работой агента Карпатого и биологической эволюцией. Процесс, при котором ИИ пробует тысячи вариантов и оставляет только жизнеспособные, — это цифровой «естественный отбор» . Ведущий упоминает такие проекты, как AlphaEvolve от Google DeepMind и концепцию «машины Дарвина-Гёделя», которые работают по схожему принципу .

Первые практические тесты уже подтверждают эффективность подхода:

Тоби Лютке (Tobi Lütke), основатель и CEO Shopify, запустил агент Карпатого перед сном. За два дня система провела 650 экспериментов .
Лютке утверждает, что наблюдение за ходом рассуждений модели в процессе экспериментов научило его большему, чем месяцы чтения работ профессиональных исследователей .
По мнению Лютке, это явный признак того, что «сингулярность началась» .

📉 NanoGPT: Лаборатория на домашнем компьютере 7:00

Проект базируется на наработках Карпатого под названием NanoGPT (или Nano Chat). Это упрощенная реализация обучения GPT, оптимизированная для работы на одной видеокарте (GPU) .

Технические характеристики обучаемой «мини-модели»:

Контекстное окно: 256 символов .
Архитектура: 6 слоев трансформера, по 6 головок внимания в каждом .
Время обучения: около 3 минут на одной видеокарте NVIDIA A100 .

По словам Карпатого, даже в такой наивной попытке автоматизации агент за два дня нашел 20 изменений в коде, которые реально улучшили работу модели . Что более важно, эти улучшения оказались аддитивными и переносимыми на более крупные модели . Скорость обучения GPT-2 на лидерборде сократилась с 2,02 часа до 1,8 часа (улучшение на 11%) исключительно благодаря находкам ИИ .

🤺 «Финальная битва» и распределенный суперинтеллект 14:34

Для Карпатого, который занимался ручной оптимизацией нейросетей на протяжении двух десятилетий, наблюдение за автономным агентом стало «диким» опытом . Он подчеркивает, что агент не просто перебирает варианты, а анализирует последовательность результатов и планирует следующие шаги .

Ведущий Wes Roth предполагает, что следующим этапом станет создание распределенной сети исследователей:

Карпатый уже размышляет над тем, как использовать функционал GitHub для объединения усилий тысяч агентов по всему миру .
Вместо того чтобы ждать прорыва в закрытых лабораториях вроде OpenAI или Google DeepMind, сообщество может создать «децентрализованную лабораторию» .
Если направить сотни тысяч разработчиков на решение одной задачи через их агентов, мир столкнется с мощью, которой никогда раньше не видел .

В завершение Wes Roth ставит вопрос о том, не станет ли этот open-source релиз тем самым триггером, который навсегда изменит баланс сил в разработке ИИ, сделав создание суперинтеллекта делом каждого энтузиаста с видеокартой .