Эван Рейзер (Poolside): «Обучение на исполнении кода — это путь к созданию AGI»

Eye on AI 766 54 мин 4 мин 24.09.2025
Главное

В мире технологий искусственного интеллекта наметился новый фронт. Пока гиганты вроде OpenAI и Google соревнуются в универсальности своих моделей, стартап Poolside делает ставку на узкую, но фундаментально важную область — разработку программного обеспечения. Сооснователь и CEO компании Эван Рейзер (Ewan Reiser) в беседе с Крейгом Смитом на подкасте Eye on AI раскрыл стратегический план: использовать кодинг как «трамплин» для создания полноценного ИИ человеческого уровня (AGI).

🚀 Почему кодинг — это кратчайший путь к AGI 0:00

По мнению Эвана Рейзера, разработка программного обеспечения — это не просто написание строк кода, а сложнейшая репрезентация принципов понимания мира . В Poolside считают, что если ИИ сможет овладеть навыками программирования на уровне эксперта, он неизбежно разовьёт в себе способности к сложному планированию, логическому рассуждению и визуальному восприятию — всему тому, что составляет основу человеческого интеллекта .

Рейзер выделяет три этапа развития компании:

CEO Poolside утверждает, что фокусировка исключительно на программировании позволяет избежать распыления ресурсов, которым грешат создатели универсальных моделей, пытающиеся научить ИИ одновременно писать стихи и ставить медицинские диагнозы .

🧠 Ограничения современных LLM: почему «предсказание следующего токена» не работает 4:45

Эван Рейзер критикует популярное в индустрии мнение, что для достижения сильного ИИ (AGI) достаточно просто масштабировать размер моделей и объем данных. По его словам, чистое языковое моделирование (предугадывание следующего слова) имеет фундаментальный предел .

Ключевые аргументы Рейзера:

  1. Отсутствие процесса мышления в данных: Интернет заполнен «конечными продуктами» — статьями, кодом, научными работами. Но в сети нет записей тех тысяч часов раздумий, ошибок и тупиковых ветвей, которые привели Эйнштейна к теории относительности .
  2. Проблема математики: Современные LLM часто ошибаются в вычислениях (например, при умножении больших чисел), потому что они не «считают», а «угадывают» наиболее вероятный ответ. Они могут быть близки к истине на 5%, но для кода или математики этого недостаточно .
  3. Необходимость Reinforcement Learning (RL): Чтобы модель действительно научилась рассуждать, ей нужен механизм обратной связи, подобный тому, как люди учатся на своих ошибках .

🛠 RLCF: Обучение через исполнение кода 9:44

В отличие от стандартного метода обучения с подкреплением на основе отзывов людей (RLHF), Poolside использует уникальный подход — RLCF (Reinforcement Learning from Code Execution Feedback) .

Суть метода заключается в следующем:

Рейзер признает, что RL — это «капризный зверь». Обучение стабильно только тогда, когда задачи достаточно сложны для прогресса, но не настолько невыполнимы, чтобы модель никогда не получала положительного подкрепления .

🏢 Стратегия «Model Factory» и ориентация на Enterprise 14:57

Poolside отказались от «кустарного» подхода к созданию ИИ. Вместо того чтобы каждый раз вручную настраивать новую модель, они построили «фабрику моделей» (Model Factory) — систему, которая позволяет автоматически проверять тысячи вариаций архитектур и гиперпараметров .

Другой важной вехой развития стал осознанный уход в сегмент крупных корпораций (Enterprise). Рейзер объясняет это так:

🔮 Будущее: исчезнут ли программисты? 52:21

Несмотря на мощь алгоритмов, Эван Рейзер подчеркивает: модели всё еще совершают ошибки. Интерфейсы Poolside (плагины для VS Code, IntelliJ и др.) строятся так, чтобы человек всегда мог проверить результат . Однако он делает смелый прогноз: в ближайшие годы бюджеты на обучение через RL (рассуждение) превысят бюджеты на традиционное обучение на массивах данных .

На вопрос о том, что делать тем, кто не умеет кодить, Рейзер отвечает: мы движемся к миру «эластичной рабочей силы ИИ». В будущем человек будет выступать в роли архитектора и заказчика, а агенты будут выполнять задачи автономно, общаясь с пользователем на естественном языке для уточнения деталей .

Главный совет от CEO Poolside для тех, кто пытается следить за рынком ИИ: «Смотрите сквозь шум. Спрашивайте себя: будет ли этот инструмент актуален через 5 лет, когда возможности ИИ полностью сравняются с возможностями человека в интеллектуальном труде?» .

💬 Цитаты

«Процесс создания работы важнее, чем сам результат; интернет полон готовых статей, но там нет записей процесса мышления.»

Эван Рейзер 32:38

«Мы движемся к миру, где агенты станут эластичной рабочей силой ИИ.»

Эван Рейзер 41:33
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
RLCF
Reinforcement Learning from Code Execution Feedback — обучение модели с подкреплением на основе того, работает ли написанный ею код.
AGI
Artificial General Intelligence — гипотетический искусственный интеллект, способный выполнить любую интеллектуальную задачу, доступную человеку.
LLM
Large Language Model — большая языковая модель, обученная на огромных массивах текстовых данных.
On-premise
Способ размещения ПО на собственных серверах и мощностях организации, а не в облаке.
Next token prediction
Традиционный метод обучения моделей, при котором задача ИИ — предсказать следующее наиболее вероятное слово в последовательности.
📊 Цифры
🗓 Хронология
  1. 2015 Эван Рейзер читает статью Андрея Карпатого, вдохновившую его на изучение языковых моделей.
  2. 2016 Выход AlphaGo; Рейзер переориентирует свою компанию на ИИ-кодинг.
  3. 2017 Встреча с Джейсоном Уорнером (будущим сооснователем Poolside, на тот момент CTO GitHub).
  4. Ноябрь 2022 Релиз ChatGPT, ставший катализатором для создания Poolside.
  5. 2023-2024 Развертывание Poolside в крупных корпорациях и партнерство с AWS.
⚖️ Другая сторона
Искусственный интеллект Poolside Reinforcement Learning AGI Эван Рейзер RLCF