# Экс-директор Tesla Андрей Карпатый выпустил open-source агента для самосовершенствования ИИ

Источник: https://www.youtube.com/watch?v=tUkD0oj92Qg
Канал: Wes Roth
Опубликовано: 10.03.2026

---

Бывший ведущий исследователь OpenAI и экс-директор по ИИ в Tesla Андрей Карпатый (Andrej Karpathy) представил новый проект, который может радикально изменить индустрию искусственного интеллекта. Речь идет о `auto-researcher` — автономном агенте с открытым исходным кодом, способном самостоятельно проводить научные исследования и оптимизировать алгоритмы машинного обучения без участия человека. По мнению автора канала Wes Roth, этот релиз приближает нас к гипотетическому «взрыву интеллекта», когда ИИ начинает совершенствовать сам себя быстрее, чем это под силу людям.

## 🚀 Взрыв интеллекта: от гипотез к реальности
[[JUMP:0:52]]

В основе обсуждения лежит концепция «взрыва интеллекта» (intelligence explosion), которую активно продвигает Леопольд Ашенбреннер (Leopold Aschenbrenner), бывший исследователь безопасности в OpenAI [1:04]. Ашенбреннер утверждает, что как только ИИ станет достаточно мощным, чтобы заменить исследователей-людей, прогресс перейдет в стадию рекурсивного самосовершенствования. Это создаст кратчайший путь от «сильного ИИ» (AGI) к «суперинтеллекту» (ASI) [1:46].

Вес Рот отмечает, что хотя многие эксперты отрицают возможность того, что текущие модели могут существенно улучшать следующие поколения ИИ, практика говорит об обратном:

*   Исследователи из Google, Anthropic и OpenAI уже используют ИИ для помощи в разработке [2:12].
*   Представители xAI (компании Илона Маска) заявляют, что рекурсивное самосовершенствование может быть достигнуто в ближайшие 12 месяцев [2:24].
*   Андрей Карпатый, по мнению ведущего, сделал эту технологию доступной для каждого, выпустив легковесный инструмент для домашних ПК [2:36].

## 🧠 «Мясные компьютеры» против автономных роев
[[JUMP:3:14]]

В описании своего проекта на GitHub Карпатый рисует футуристическую картину, представляя взгляд из марта 2026 года [3:14]. Он иронично называет людей «мясными компьютерами» (meat computers), которые тратят время на еду, сон и бесконечные совещания, пытаясь синхронизировать свои идеи [3:26]. По прогнозу Карпатого, эра человеческих исследований в области ИИ уйдет в прошлое, уступив место автономным роям агентов, работающих в «облачных мегаструктурах» [3:54].

Основная идея `auto-researcher` предельно проста:

1.  Агенту дается доступ к коду обучения небольшой языковой модели (LLM).
2.  ИИ автономно модифицирует код (архитектуру, гиперпараметры, оптимизаторы) [10:39].
3.  Запускается короткое обучение (около 5 минут).
4.  Агент проверяет, улучшились ли результаты (валидационные потери).
5.  Успешные изменения сохраняются, неудачные — отбрасываются, и цикл повторяется бесконечно [5:13].

## 🧬 Цифровая эволюция и «машина Дарвина-Гёделя»
[[JUMP:5:26]]

Вес Рот проводит прямую аналогию между работой агента Карпатого и биологической эволюцией. Процесс, при котором ИИ пробует тысячи вариантов и оставляет только жизнеспособные, — это цифровой «естественный отбор» [6:07]. Ведущий упоминает такие проекты, как AlphaEvolve от Google DeepMind и концепцию «машины Дарвина-Гёделя», которые работают по схожему принципу [5:41].

Первые практические тесты уже подтверждают эффективность подхода:

*   **Тоби Лютке (Tobi Lütke)**, основатель и CEO Shopify, запустил агент Карпатого перед сном. За два дня система провела 650 экспериментов [6:50].
*   Лютке утверждает, что наблюдение за ходом рассуждений модели в процессе экспериментов научило его большему, чем месяцы чтения работ профессиональных исследователей [6:47].
*   По мнению Лютке, это явный признак того, что «сингулярность началась» [6:20].

## 📉 NanoGPT: Лаборатория на домашнем компьютере
[[JUMP:7:00]]

Проект базируется на наработках Карпатого под названием `NanoGPT` (или Nano Chat). Это упрощенная реализация обучения GPT, оптимизированная для работы на одной видеокарте (GPU) [7:12]. 

Технические характеристики обучаемой «мини-модели»:

*   **Контекстное окно:** 256 символов [8:04].
*   **Архитектура:** 6 слоев трансформера, по 6 головок внимания в каждом [8:17].
*   **Время обучения:** около 3 минут на одной видеокарте NVIDIA A100 [8:17].

По словам Карпатого, даже в такой наивной попытке автоматизации агент за два дня нашел 20 изменений в коде, которые реально улучшили работу модели [12:40]. Что более важно, эти улучшения оказались аддитивными и переносимыми на более крупные модели [13:17]. Скорость обучения GPT-2 на лидерборде сократилась с 2,02 часа до 1,8 часа (улучшение на 11%) исключительно благодаря находкам ИИ [13:30].

## 🤺 «Финальная битва» и распределенный суперинтеллект
[[JUMP:14:34]]

Для Карпатого, который занимался ручной оптимизацией нейросетей на протяжении двух десятилетий, наблюдение за автономным агентом стало «диким» опытом [15:01]. Он подчеркивает, что агент не просто перебирает варианты, а анализирует последовательность результатов и планирует следующие шаги [15:38].

Ведущий Wes Roth предполагает, что следующим этапом станет создание распределенной сети исследователей:

*   Карпатый уже размышляет над тем, как использовать функционал GitHub для объединения усилий тысяч агентов по всему миру [18:14].
*   Вместо того чтобы ждать прорыва в закрытых лабораториях вроде OpenAI или Google DeepMind, сообщество может создать «децентрализованную лабораторию» [18:51].
*   Если направить сотни тысяч разработчиков на решение одной задачи через их агентов, мир столкнется с мощью, которой никогда раньше не видел [19:55].

В завершение Wes Roth ставит вопрос о том, не станет ли этот open-source релиз тем самым триггером, который навсегда изменит баланс сил в разработке ИИ, сделав создание суперинтеллекта делом каждого энтузиаста с видеокартой [20:35].