Мэтт Борнштейн из a16z: «Слово "агент" — это во многом просто маркетинг»

a16z (Andreessen Horowitz) 18,5 тыс. 36 мин 5 мин 02.05.2025
Главное

Что на самом деле скрывается за термином «ИИ-агент»? В новом выпуске эксперты венчурного фонда a16z — Гвидо Аппенцеллер, Мэтт Борнштейн и Йоко Ли — разбирают, где заканчивается маркетинг и начинаются реальные технологии, почему мы до сих пор не можем договориться о терминах и как экономика диктует правила игры в мире автономного софта.

🤖 Туманное определение: от чат-бота до AGI 0:00

В индустрии технологий сегодня нет единого мнения о том, что именно считать «агентом». По наблюдениям участников дискуссии, определения варьируются от простейших надстроек над базами знаний до систем, близких к сильному искусственному интеллекту (AGI).

Мэтт Борнштейн высказывает скептическую позицию: по его мнению, слово «агент» — это во многом маркетинговый ярлык для любых современных ИИ-приложений. Он отмечает, что даже классическое определение агента как системы, способной к сложному планированию и взаимодействию с внешним миром, сегодня размыто, так как практически все современные большие языковые модели (LLM) уже умеют это делать.

В ходе обсуждения Гвидо Аппенцеллер выделяет два полюса в понимании технологии:

Мэтт Борнштейн ссылается на мнение Андрея Карпатого, который сравнивает развитие агентов с автономным вождением: это проблема, на решение которой уйдет десятилетие, в то время как рынок сейчас забит «демо-версиями выходного дня».

⚙️ Техническая анатомия: циклы и «динамические деревья» 5:07

Если отойти от маркетинга, техническая суть агента сводится к архитектурным особенностям. Гвидо Аппенцеллер предлагает использовать определение, близкое к позиции компании Anthropic: агент — это LLM, работающая в цикле (loop) с использованием инструментов (tool use).

Ключевые отличия «агентского» поведения, по мнению экспертов:

  1. Итеративность: Система берет результат своего же ответа, анализирует его и решает, какой будет следующая команда.
  2. Автономия в завершении: Агент сам определяет, когда задача выполнена и пора прекратить цикл.
  3. Принятие решений: В отличие от простого перевода текста в JSON, агент решает, куда именно направить данные и какой маршрут выбрать.

Участники описывают это как «цепочку LLM-вызовов с динамическим деревом решений». При этом Гвидо и Йоко сходятся во мнении, что для внешнего наблюдателя работа агента часто неотличима от работы классического API, если не знать, что внутри «сидит» языковая модель для принятия решений.

💰 Экономика агентов: почему «замена человека» стоит дорого 9:29

Маркетинговая привлекательность агентов напрямую связана со стратегией ценообразования. Стартапы пытаются продавать софт не по модели SaaS, а как «замену сотрудника».

Мэтт Борнштейн описывает эту логику: если живой работник получает $50 000 в год, то агент за $30 000 выглядит выгодной сделкой. Однако он же указывает на ловушку такого подхода: со временем стоимость продукта всегда стремится к маржинальной стоимости его производства. В случае с ИИ — это стоимость вызовов API и работы GPU, которая постоянно падает.

Йоко Ли отмечает интересную закономерность в ценообразовании:

Где в этой схеме место агента — пока неясно, так как он может выступать в обеих ролях. В качестве примера аномального ценообразования Йоко приводит Pokémon Go: покупка виртуального места в сумке стоит в тысячи раз дороже, чем реальное хранение данных в облаке S3, потому что пользователь платит за ценность внутри экосистемы, а не за инфраструктуру.

👤 Заменит ли ИИ людей на самом деле? 11:24

Вопрос полной замены человеческого труда остается спорным. По мнению Мэтта Борнштейна, в большинстве случаев мы увидим не замену человека роботом, а вытеснение менее эффективных сотрудников теми, кто умеет использовать ИИ.

Аргументы против полной замены:

Мэтт Борнштейн считает, что путаница возникает из-за самого слова «агент», которое исторически всегда относилось к людям. Он предполагает, что мы никогда не увидим полной замены, так как человеческий труд всегда содержит фундаментальный когнитивный компонент.

🧱 Технические барьеры и «сады за забором» 25:50

С точки зрения системной архитектуры, агенты не сильно отличаются от современных SaaS-приложений: у них есть внешнее состояние (базы данных) и внешние вычислительные мощности (GPU-фермы). Однако на пути их развития стоят серьезные препятствия.

Главным ограничителем Гвидо Аппенцеллер называет «бункеры данных» (data silos). Компании намеренно закрывают доступ к своим API, чтобы удержать внимание пользователя и защитить свои активы от парсинга ИИ.

Уже сейчас наблюдаются признаки «технологической войны»:

Гвидо Аппенцеллер отмечает, что современные модели уже пытаются рассуждать о том, как обойти капчи для доступа к нужной информации, что ставит вопросы безопасности и этики.

🚀 Будущее: ИИ как «обычная технология» 34:13

В перспективе 2–5 лет эксперты ожидают решения проблем аутентификации и контроля доступа для агентов, чтобы они могли безопасно действовать от имени пользователя.

Йоко Ли делает ставку на мультимодальность. По её мнению, агенты станут по-настоящему полезными, когда научатся не просто работать с текстом, а «видеть» интерфейсы, кликать по кнопкам и понимать визуальный контекст сайтов так же, как это делает человек.

В финале дискуссии Мэтт Борнштейн цитирует работу исследователей из Колумбийского университета «ИИ — это нормальная технология». По его мнению, лучшим сценарием будет тот, при котором через пять лет мы перестанем использовать слово «агент», а ИИ станет такой же привычной и понятной частью нашей жизни, как электричество или интернет.

💬 Цитаты

«Я думаю, что агент — это просто слово для обозначения ИИ-приложений. Всё, что использует ИИ, в каком-то смысле может быть агентом.»

Мэтт Борнштейн 02:54

«Агент — это LLM, работающая в цикле с использованием инструментов.»

Гвидо Аппенцеллер 05:47

«В большинстве случаев люди не будут заменены ИИ. Скорее, два человека будут заменены одним, который станет продуктивнее благодаря ИИ.»

Мэтт Борнштейн 11:38
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
AGI
Сильный искусственный интеллект, способный выполнять любую интеллектуальную задачу на уровне человека.
Маржинальная стоимость
Затраты на производство одной дополнительной единицы товара или услуги.
SDR
Специалист по развитию продаж, чьи функции (поиск лидов, рассылка писем) сейчас активно автоматизируются агентами.
📊 Цифры
🗓 Хронология
  1. 2024 Текущий период активного маркетинга «демо-версий выходного дня» под видом полноценных агентов.
  2. Через 2 года Ожидаемое решение базовых проблем безопасности и аутентификации для работы агентов от имени пользователя.
  3. Через 5 лет Прогноз превращения ИИ в «нормальную технологию», о которой перестанут спорить.
⚖️ Другая сторона
Искусственный интеллект a16z LLM AI Agents Anthropic Model Context Protocol