Мэтт Борнштейн из a16z: «Слово "агент" — это во многом просто маркетинг»

Что на самом деле скрывается за термином «ИИ-агент»? В новом выпуске эксперты венчурного фонда a16z — Гвидо Аппенцеллер, Мэтт Борнштейн и Йоко Ли — разбирают, где заканчивается маркетинг и начинаются реальные технологии, почему мы до сих пор не можем договориться о терминах и как экономика диктует правила игры в мире автономного софта.

🤖 Туманное определение: от чат-бота до AGI 0:00

В индустрии технологий сегодня нет единого мнения о том, что именно считать «агентом». По наблюдениям участников дискуссии, определения варьируются от простейших надстроек над базами знаний до систем, близких к сильному искусственному интеллекту (AGI).

Мэтт Борнштейн высказывает скептическую позицию: по его мнению, слово «агент» — это во многом маркетинговый ярлык для любых современных ИИ-приложений. Он отмечает, что даже классическое определение агента как системы, способной к сложному планированию и взаимодействию с внешним миром, сегодня размыто, так как практически все современные большие языковые модели (LLM) уже умеют это делать.

В ходе обсуждения Гвидо Аппенцеллер выделяет два полюса в понимании технологии:

Простейший уровень: Умный промпт поверх базы знаний с чат-интерфейсом, который просто выдает заготовленные ответы.
Максимальный уровень: Автономная система, способная к длительному существованию, постоянному обучению и независимой работе над задачами.

Мэтт Борнштейн ссылается на мнение Андрея Карпатого, который сравнивает развитие агентов с автономным вождением: это проблема, на решение которой уйдет десятилетие, в то время как рынок сейчас забит «демо-версиями выходного дня».

⚙️ Техническая анатомия: циклы и «динамические деревья» 5:07

Если отойти от маркетинга, техническая суть агента сводится к архитектурным особенностям. Гвидо Аппенцеллер предлагает использовать определение, близкое к позиции компании Anthropic: агент — это LLM, работающая в цикле (loop) с использованием инструментов (tool use).

Ключевые отличия «агентского» поведения, по мнению экспертов:

Итеративность: Система берет результат своего же ответа, анализирует его и решает, какой будет следующая команда.
Автономия в завершении: Агент сам определяет, когда задача выполнена и пора прекратить цикл.
Принятие решений: В отличие от простого перевода текста в JSON, агент решает, куда именно направить данные и какой маршрут выбрать.

Участники описывают это как «цепочку LLM-вызовов с динамическим деревом решений». При этом Гвидо и Йоко сходятся во мнении, что для внешнего наблюдателя работа агента часто неотличима от работы классического API, если не знать, что внутри «сидит» языковая модель для принятия решений.

💰 Экономика агентов: почему «замена человека» стоит дорого 9:29

Маркетинговая привлекательность агентов напрямую связана со стратегией ценообразования. Стартапы пытаются продавать софт не по модели SaaS, а как «замену сотрудника».

Мэтт Борнштейн описывает эту логику: если живой работник получает $50 000 в год, то агент за $30 000 выглядит выгодной сделкой. Однако он же указывает на ловушку такого подхода: со временем стоимость продукта всегда стремится к маржинальной стоимости его производства. В случае с ИИ — это стоимость вызовов API и работы GPU, которая постоянно падает.

Йоко Ли отмечает интересную закономерность в ценообразовании:

Если сервисом пользуется человек — цена обычно фиксированная «за место» (per seat).
Если сервис используется другими машинами — цена строится на основе потребления (usage-based).

Где в этой схеме место агента — пока неясно, так как он может выступать в обеих ролях. В качестве примера аномального ценообразования Йоко приводит Pokémon Go: покупка виртуального места в сумке стоит в тысячи раз дороже, чем реальное хранение данных в облаке S3, потому что пользователь платит за ценность внутри экосистемы, а не за инфраструктуру.

👤 Заменит ли ИИ людей на самом деле? 11:24

Вопрос полной замены человеческого труда остается спорным. По мнению Мэтта Борнштейна, в большинстве случаев мы увидим не замену человека роботом, а вытеснение менее эффективных сотрудников теми, кто умеет использовать ИИ.

Аргументы против полной замены:

Творческое начало: Даже в простых профессиях, вроде кассира в супермаркете, есть элемент принятия решений и креативности, который сложно автоматизировать полностью.
Интенциональность: ИИ — это система, в которой кто-то всё равно должен «нажать кнопку» и задать вектор. У машин нет собственных намерений и желаний.

Мэтт Борнштейн считает, что путаница возникает из-за самого слова «агент», которое исторически всегда относилось к людям. Он предполагает, что мы никогда не увидим полной замены, так как человеческий труд всегда содержит фундаментальный когнитивный компонент.

🧱 Технические барьеры и «сады за забором» 25:50

С точки зрения системной архитектуры, агенты не сильно отличаются от современных SaaS-приложений: у них есть внешнее состояние (базы данных) и внешние вычислительные мощности (GPU-фермы). Однако на пути их развития стоят серьезные препятствия.

Главным ограничителем Гвидо Аппенцеллер называет «бункеры данных» (data silos). Компании намеренно закрывают доступ к своим API, чтобы удержать внимание пользователя и защитить свои активы от парсинга ИИ.

Уже сейчас наблюдаются признаки «технологической войны»:

Анти-агентские капчи: Сайты пытаются блокировать автоматизированных агентов, требуя внимания живого человека для показа рекламы.
Скрытие данных: Мэтт приводит пример Amazon, который перестал присылать детали заказа в подтверждающих письмах, вынуждая пользователя кликать по ссылке и заходить на сайт.

Гвидо Аппенцеллер отмечает, что современные модели уже пытаются рассуждать о том, как обойти капчи для доступа к нужной информации, что ставит вопросы безопасности и этики.

🚀 Будущее: ИИ как «обычная технология» 34:13

В перспективе 2–5 лет эксперты ожидают решения проблем аутентификации и контроля доступа для агентов, чтобы они могли безопасно действовать от имени пользователя.

Йоко Ли делает ставку на мультимодальность. По её мнению, агенты станут по-настоящему полезными, когда научатся не просто работать с текстом, а «видеть» интерфейсы, кликать по кнопкам и понимать визуальный контекст сайтов так же, как это делает человек.

В финале дискуссии Мэтт Борнштейн цитирует работу исследователей из Колумбийского университета «ИИ — это нормальная технология». По его мнению, лучшим сценарием будет тот, при котором через пять лет мы перестанем использовать слово «агент», а ИИ станет такой же привычной и понятной частью нашей жизни, как электричество или интернет.