# Эван Рейзер (Poolside): «Обучение на исполнении кода — это путь к созданию AGI»

Источник: https://www.youtube.com/watch?v=oU9-sdrVSVs
Канал: Eye on AI
Опубликовано: 24.09.2025

---

В мире технологий искусственного интеллекта наметился новый фронт. Пока гиганты вроде OpenAI и Google соревнуются в универсальности своих моделей, стартап **Poolside** делает ставку на узкую, но фундаментально важную область — разработку программного обеспечения. Сооснователь и CEO компании **Эван Рейзер** (Ewan Reiser) в беседе с Крейгом Смитом на подкасте *Eye on AI* раскрыл стратегический план: использовать кодинг как «трамплин» для создания полноценного ИИ человеческого уровня (AGI).

## 🚀 Почему кодинг — это кратчайший путь к AGI
[[JUMP:00:00]]

По мнению Эвана Рейзера, разработка программного обеспечения — это не просто написание строк кода, а сложнейшая репрезентация принципов понимания мира [00:00]. В Poolside считают, что если ИИ сможет овладеть навыками программирования на уровне эксперта, он неизбежно разовьёт в себе способности к сложному планированию, логическому рассуждению и визуальному восприятию — всему тому, что составляет основу человеческого интеллекта [06:44].

Рейзер выделяет три этапа развития компании:

*   **Этап 1:** Помощь профессиональным разработчикам в написании кода.
*   **Этап 2:** Предоставление любому человеку возможности создавать ПО с помощью ИИ.
*   **Этап 3:** Перенос полученных навыков рассуждения на все остальные домены человеческих знаний [05:40].

CEO Poolside утверждает, что фокусировка исключительно на программировании позволяет избежать распыления ресурсов, которым грешат создатели универсальных моделей, пытающиеся научить ИИ одновременно писать стихи и ставить медицинские диагнозы [06:31].

## 🧠 Ограничения современных LLM: почему «предсказание следующего токена» не работает
[[JUMP:04:45]]

Эван Рейзер критикует популярное в индустрии мнение, что для достижения сильного ИИ (AGI) достаточно просто масштабировать размер моделей и объем данных. По его словам, чистое языковое моделирование (предугадывание следующего слова) имеет фундаментальный предел [05:00].

Ключевые аргументы Рейзера:

1.  **Отсутствие процесса мышления в данных:** Интернет заполнен «конечными продуктами» — статьями, кодом, научными работами. Но в сети нет записей тех тысяч часов раздумий, ошибок и тупиковых ветвей, которые привели Эйнштейна к теории относительности [32:38].
2.  **Проблема математики:** Современные LLM часто ошибаются в вычислениях (например, при умножении больших чисел), потому что они не «считают», а «угадывают» наиболее вероятный ответ. Они могут быть близки к истине на 5%, но для кода или математики этого недостаточно [34:01].
3.  **Необходимость Reinforcement Learning (RL):** Чтобы модель действительно научилась рассуждать, ей нужен механизм обратной связи, подобный тому, как люди учатся на своих ошибках [05:13].

## 🛠 RLCF: Обучение через исполнение кода
[[JUMP:09:44]]

В отличие от стандартного метода обучения с подкреплением на основе отзывов людей (RLHF), Poolside использует уникальный подход — **RLCF (Reinforcement Learning from Code Execution Feedback)** [09:44].

Суть метода заключается в следующем:

*   **Изолированная среда:** Модель работает внутри контейнеризированной системы, имитирующей реальный мир. Poolside создали среду, включающую около миллиона репозиториев с реальным кодом и тестами [11:13].
*   **Объективная истина:** В отличие от написания эссе, где оценка субъективна, код либо компилируется и проходит тесты, либо нет. Это дает модели предельно четкий и честный сигнал — «награда» за успех или «штраф» за ошибку [11:41].
*   **Агентурный подход:** Новое поколение моделей Poolside — это уже не просто чат-боты, а агенты. Они могут самостоятельно искать файлы, запускать команды в терминале, устанавливать зависимости и находить баги в многошаговом процессе [17:49].

Рейзер признает, что RL — это «капризный зверь». Обучение стабильно только тогда, когда задачи достаточно сложны для прогресса, но не настолько невыполнимы, чтобы модель никогда не получала положительного подкрепления [18:30].

## 🏢 Стратегия «Model Factory» и ориентация на Enterprise
[[JUMP:14:57]]

Poolside отказались от «кустарного» подхода к созданию ИИ. Вместо того чтобы каждый раз вручную настраивать новую модель, они построили «фабрику моделей» (Model Factory) — систему, которая позволяет автоматически проверять тысячи вариаций архитектур и гиперпараметров [15:47].

Другой важной вехой развития стал осознанный уход в сегмент крупных корпораций (Enterprise). Рейзер объясняет это так:

*   **Масштаб задач:** В компаниях с 50 000 разработчиков (например, в крупных банках) потребность в ИИ-инструментах огромна, но и сложность внедрения выше [40:58].
*   **Безопасность и Firewall:** Poolside предлагает установку моделей *on-premise* (на собственных серверах клиента). Это критически важно для оборонного сектора, государственного управления и финансов [47:10].
*   **Кастомизация весов:** Со временем Poolside планирует позволить корпорациям дообучать модель на их собственном коде, фактически создавая уникальный интеллект, адаптированный под конкретный бизнес [48:00].

## 🔮 Будущее: исчезнут ли программисты?
[[JUMP:52:21]]

Несмотря на мощь алгоритмов, Эван Рейзер подчеркивает: модели всё еще совершают ошибки. Интерфейсы Poolside (плагины для VS Code, IntelliJ и др.) строятся так, чтобы человек всегда мог проверить результат [23:21]. Однако он делает смелый прогноз: в ближайшие годы бюджеты на обучение через RL (рассуждение) превысят бюджеты на традиционное обучение на массивах данных [31:24].

На вопрос о том, что делать тем, кто не умеет кодить, Рейзер отвечает: мы движемся к миру «эластичной рабочей силы ИИ». В будущем человек будет выступать в роли архитектора и заказчика, а агенты будут выполнять задачи автономно, общаясь с пользователем на естественном языке для уточнения деталей [26:13].

Главный совет от CEO Poolside для тех, кто пытается следить за рынком ИИ: «Смотрите сквозь шум. Спрашивайте себя: будет ли этот инструмент актуален через 5 лет, когда возможности ИИ полностью сравняются с возможностями человека в интеллектуальном труде?» [53:12].