Бывший ведущий исследователь OpenAI и экс-директор по ИИ в Tesla Андрей Карпатый (Andrej Karpathy) представил новый проект, который может радикально изменить индустрию искусственного интеллекта. Речь идет о auto-researcher — автономном агенте с открытым исходным кодом, способном самостоятельно проводить научные исследования и оптимизировать алгоритмы машинного обучения без участия человека. По мнению автора канала Wes Roth, этот релиз приближает нас к гипотетическому «взрыву интеллекта», когда ИИ начинает совершенствовать сам себя быстрее, чем это под силу людям.
🚀 Взрыв интеллекта: от гипотез к реальности 0:52
В основе обсуждения лежит концепция «взрыва интеллекта» (intelligence explosion), которую активно продвигает Леопольд Ашенбреннер (Leopold Aschenbrenner), бывший исследователь безопасности в OpenAI . Ашенбреннер утверждает, что как только ИИ станет достаточно мощным, чтобы заменить исследователей-людей, прогресс перейдет в стадию рекурсивного самосовершенствования. Это создаст кратчайший путь от «сильного ИИ» (AGI) к «суперинтеллекту» (ASI) .
Вес Рот отмечает, что хотя многие эксперты отрицают возможность того, что текущие модели могут существенно улучшать следующие поколения ИИ, практика говорит об обратном:
- Исследователи из Google, Anthropic и OpenAI уже используют ИИ для помощи в разработке .
- Представители xAI (компании Илона Маска) заявляют, что рекурсивное самосовершенствование может быть достигнуто в ближайшие 12 месяцев .
- Андрей Карпатый, по мнению ведущего, сделал эту технологию доступной для каждого, выпустив легковесный инструмент для домашних ПК .
🧠 «Мясные компьютеры» против автономных роев 3:14
В описании своего проекта на GitHub Карпатый рисует футуристическую картину, представляя взгляд из марта 2026 года . Он иронично называет людей «мясными компьютерами» (meat computers), которые тратят время на еду, сон и бесконечные совещания, пытаясь синхронизировать свои идеи . По прогнозу Карпатого, эра человеческих исследований в области ИИ уйдет в прошлое, уступив место автономным роям агентов, работающих в «облачных мегаструктурах» .
Основная идея auto-researcher предельно проста:
- Агенту дается доступ к коду обучения небольшой языковой модели (LLM).
- ИИ автономно модифицирует код (архитектуру, гиперпараметры, оптимизаторы) .
- Запускается короткое обучение (около 5 минут).
- Агент проверяет, улучшились ли результаты (валидационные потери).
- Успешные изменения сохраняются, неудачные — отбрасываются, и цикл повторяется бесконечно .
🧬 Цифровая эволюция и «машина Дарвина-Гёделя» 5:26
Вес Рот проводит прямую аналогию между работой агента Карпатого и биологической эволюцией. Процесс, при котором ИИ пробует тысячи вариантов и оставляет только жизнеспособные, — это цифровой «естественный отбор» . Ведущий упоминает такие проекты, как AlphaEvolve от Google DeepMind и концепцию «машины Дарвина-Гёделя», которые работают по схожему принципу .
Первые практические тесты уже подтверждают эффективность подхода:
- Тоби Лютке (Tobi Lütke), основатель и CEO Shopify, запустил агент Карпатого перед сном. За два дня система провела 650 экспериментов .
- Лютке утверждает, что наблюдение за ходом рассуждений модели в процессе экспериментов научило его большему, чем месяцы чтения работ профессиональных исследователей .
- По мнению Лютке, это явный признак того, что «сингулярность началась» .
📉 NanoGPT: Лаборатория на домашнем компьютере 7:00
Проект базируется на наработках Карпатого под названием NanoGPT (или Nano Chat). Это упрощенная реализация обучения GPT, оптимизированная для работы на одной видеокарте (GPU) .
Технические характеристики обучаемой «мини-модели»:
- Контекстное окно: 256 символов .
- Архитектура: 6 слоев трансформера, по 6 головок внимания в каждом .
- Время обучения: около 3 минут на одной видеокарте NVIDIA A100 .
По словам Карпатого, даже в такой наивной попытке автоматизации агент за два дня нашел 20 изменений в коде, которые реально улучшили работу модели . Что более важно, эти улучшения оказались аддитивными и переносимыми на более крупные модели . Скорость обучения GPT-2 на лидерборде сократилась с 2,02 часа до 1,8 часа (улучшение на 11%) исключительно благодаря находкам ИИ .
🤺 «Финальная битва» и распределенный суперинтеллект 14:34
Для Карпатого, который занимался ручной оптимизацией нейросетей на протяжении двух десятилетий, наблюдение за автономным агентом стало «диким» опытом . Он подчеркивает, что агент не просто перебирает варианты, а анализирует последовательность результатов и планирует следующие шаги .
Ведущий Wes Roth предполагает, что следующим этапом станет создание распределенной сети исследователей:
- Карпатый уже размышляет над тем, как использовать функционал GitHub для объединения усилий тысяч агентов по всему миру .
- Вместо того чтобы ждать прорыва в закрытых лабораториях вроде OpenAI или Google DeepMind, сообщество может создать «децентрализованную лабораторию» .
- Если направить сотни тысяч разработчиков на решение одной задачи через их агентов, мир столкнется с мощью, которой никогда раньше не видел .
В завершение Wes Roth ставит вопрос о том, не станет ли этот open-source релиз тем самым триггером, который навсегда изменит баланс сил в разработке ИИ, сделав создание суперинтеллекта делом каждого энтузиаста с видеокартой .