Искусственный интеллект против глянца: как нейросети меняют цифровую идентичность

a16z (Andreessen Horowitz) 3,3 тыс. 40 мин 8 мин 24.04.2023
Главное

Технологический бум в сфере искусственного интеллекта кардинально меняет то, как человечество представляет себя в цифровом пространстве. В новом выпуске подкаста венчурного фонда a16z футуролог Шинейд Бовелл и серийный AI-разработчик Дэнни Постма обсуждают, как генеративные модели трансформируют индустрию моды, создания контента и профессиональной фотографии. Эксперты разбирают экономические, этические и практические аспекты перехода от традиционных съемок к коммерческому использованию цифровых двойников.

🔮 Пророчество из 2020 года: как AI наступает на пятки классическому моделингу 3:09

В 2020 Court году журнал Vogue опубликовал статью Шинейд Бовелл под заголовком «Я модель, и я знаю, что искусственный интеллект со временем заберет мою работу». В то время, когда дискуссии об автоматизации редко затрагивали творческие профессии, это заявление казалось шокирующим и футуристичным. Сама Шинейд Бовелл объясняет, что поводом для написания материала стало ее знакомство с разработками компании Data Grid в 2019 году. Эта фирма использовала генеративно-состязательные сети (GAN), известные в обиходе как технология дипфейков, для создания искусственных личностей.

По словам Шинейд Бовелл, коммерческая fashion-съемка для сегмента электронной коммерции (e-commerce) изначально роботизирована. Модели выполняют стандартные, повторяющиеся движения, чтобы одежда выигрышно смотрелась на страницах интернет-магазинов. Для крупных брендов создание контента является огромной статьей расходов, поэтому автоматизация здесь была лишь вопросом времени. Еще в 2019 году европейский e-commerce гигант Zalando активно исследовал возможности генеративного ИИ для оптимизации каталогов. Появление виртуального инфлюенсера Лил Микелы (Lil Miquela), созданной с помощью CGI еще в 2016 году, доказало Шинейд Бовелл, что общество и бренды ментально готовы к взаимодействию с искусственными персонажами.

Первоначальной реакцией модной индустрии на статью Шинейд Бовелл был страх, смешанный с недоверием. Автор старалась успокоить коллег, подчеркивая, что под удар автоматизации попадут абсолютно все участники экосистемы: от фотографов и визажистов до рекламных агентств. В 2020 году людям было трудно концептуализировать, как именно произойдет этот сдвиг. Однако в 2023 году, на фоне взрывного роста генеративных систем вроде Midjourney и Stable Diffusion, у представителей индустрии массово «зажглись лампочки» понимания — абстрактные тренды обрели форму реальных инструментов.

🚀 Вирусный взлет Deep Agency и техническая изнанка цифровых моделей 7:29

Независимый разработчик Дэнни Постма на практике продемонстрировал, как теоретические прогнозы превращаются в готовый бизнес. Его проект Deep Agency — виртуальное модельное агентство — стал вирусным в Twitter, собрав более 30 миллионов просмотров всего за 24 часа. Интересно, что на момент публикации вирусного твита сам продукт еще не был полностью готов, и Дэнни Постме пришлось экстренно дописывать сайт прямо по ходу лавинообразного притока пользователей.

По оценке Дэнни Постмы, технологический прорыв 2023 года заключается в том, что разрозненные исследовательские треки последних лет наконец соединились в рамках единых, доступных инструментов. Технологический стек платформы включает в себя несколько компонентов:

Дэнни Постма считает, что базовые технологии уже полностью сформированы и доступны. Теперь дело стоит за компаниями, которые глубоко понимают эстетику fashion-индустрии и смогут поднять визуальное качество генераций на уровень высокой моды.

💰 Экономика виртуального глянца: демократизация против дефляции зарплат 10:45

Крупные ритейлеры уже давно интегрировали ИИ в свои процессы. Например, в штате бренда H&M работают тысячи дата-сайентистов, которые используют алгоритмы для прогнозирования модных трендов и оптимизации цепочек поставок. Шинейд Бовелл предполагает, что в сегменте высокой моды (High Fashion) и оригинального дизайна автоматизация встретит временное сопротивление, однако коммерческий ритейл внедряет цифровые модели повсеместно. По ее мнению, обычные покупатели уже не раз сталкивались с ИИ-моделями в интернет-магазинах, даже не осознавая этого.

Главным драйвером внедрения выступает колоссальная разница в стоимости производства контента. Дэнни Постма приводит конкретные цифры:

По мнению Дэнни Постмы, эта технология несет в себе мощную демократизирующую силу. Основной поток вопросов в техподдержку его сервисов идет от небольших семейных брендов (Mom and Pop shops). У таких предпринимателей никогда не было бюджетов на аренду студий, наем профессиональных моделей, фотографов и ретушеров. Технологии ИИ позволяют малому бизнесу конкурировать по качеству визуала с гигантами рынка.

С другой стороны, Шинейд Бовелл обращает внимание на серьезные этические риски и экономические последствия. Исторически любые технологические инновации носят дефляционный характер, снижая уровень заработных плат. Появление бесконечного предложения неотличимых от человека цифровых сущностей неизбежно окажет жесткое понижательное давление на доходы реальных моделей, актеров и даже программистов. Более того, Шинейд Бовелл указывает на моральную серую зону: автоматизации подвергаются не просто абстрактные рабочие места, а конкретные человеческие типажи и расовые сообщества, в то время как прибыль от эксплуатации их цифровых образов оседает в руках третьих лиц. Контраргументом здесь выступает то, что правовые рамки защиты интеллектуальной собственности и прав на образ (likeness) еще только формируются.

📸 От аватарок к корпоративным портретам: серийные проекты Дэнни Постмы 19:35

За последние несколько месяцев Дэнни Постма превратился в одного из самых заметных инди-хакеров в AI-сегменте, запустив семь различных проектов: от ИИ-генератора татуировок (Tattoos AI) и мемов (Meme Morph) до полностью виртуальной модели Алисы на сайте thismodeldoesnotexist.co. Самым коммерчески успешным его продуктом на текущий момент стал сервис Headshot Pro, предназначенный для генерации профессиональных корпоративных портретов. За первые две недели работы проект сгенерировал более 1 миллиона изображений.

Headshot Pro решает реальную проблему распределенных команд. По словам Дэнни Постмы, если сотрудники компании живут в Азии, Европе и США, организовать для них одинаковые по стилю корпоративные фотографии физически невозможно — нанимать и отправлять фотографа в кругосветное путешествие слишком дорого. Сервис позволяет каждому сотруднику загрузить свои обычные селфи, после чего нейросеть выдает пачку качественных портретов в едином офисном стиле или на фоне парка. Дэнни Постма с иронией добавляет, что продукт идеален для таких людей, как он сам — тех, кто ненавидит позировать, чувствует себя скованно перед камерой и не умеет улыбаться по команде.

Говоря о динамике рынка, Дэнни Постма вспоминает свой первый проект Profile Picture AI, создававший аватары. Изначально он выставил довольно высокую цену, но был вынужден опустить ее практически до уровня себестоимости в 5 долларов. Причиной стал выход приложения Lensa, которое полностью подмяло под себя рынок аватаров, заработав на хайпе около 40 миллионов долларов. По признанию разработчика, скорость изменений в индустрии запредельная: «Я почти не сплю по ночам, потому что каждое утро, когда я просыпаюсь, запускается что-то новое, что делает мои текущие технологии устаревшими».

🎨 Смена парадигмы: AI как пре-продакшн и кастомизация ритейла 24:34

Собеседники сходятся во мнении, что искусственный интеллект не просто копирует старые процессы, а меняет саму логику создания визуального контента. Дэнни Постма выдвигает тезис, что если раньше графические редакторы (Photoshop) были инструментами пост-продакшна (обработки уже сделанных кадров), то ИИ превращает этот процесс в пре-продакшн. Профессиональные фотографы будущего, по его мнению, переквалифицируются в создателей высококачественного обучающего материала: они будут делать базовые технические снимки клиентов на белом фоне, а затем с помощью кастомных ИИ-моделей переносить их в любые локации мира.

Шинейд Бовелл описывает перспективу полной персонализации онлайн-ритейла. Вместо того чтобы смотреть на одежду, надетую на чужую модель, покупатель сможет интегрировать в интерфейс сайта собственного цифрового двойника. Это позволит наглядно увидеть, как конкретное платье или костюм сядут на его фигуру с учетом всех анатомических особенностей. По прогнозам Дэнни Постмы, крупные социальные платформы вроде Instagram могут внедрить подобные рекомендательные карусели одежды на базе фотографий пользователей уже в ближайшее время.

В то же время Шинейд Бовелл напоминает о нерешенных проблемах авторского права. Если пользователь просит ИИ: «Одень моего аватара в стиле последней коллекции Celine», используя интеллектуальную собственность модного дома, но без его участия — возникает юридический прецедент. Это может спровоцировать волну цифрового контрафакта невиданного ранее масштаба.

🛠️ Как выжить инди-хакеру: маркетинг, 15 слоев AI и кастомные подкасты 30:05

Жесткая конкуренция с крупными игроками преподала Дэнни Постме важный урок. Когда приложение Lensa за один час зарабатывало месячную выручку его инди-проекта, он осознал: в эпоху доступного ИИ дистрибуция и маркетинг значат абсолютно всё. Поскольку у большинства разработчиков нет уникального технологического рва (moat), побеждает тот, кто умеет продавать, закупает рекламу у инфлюенсеров в TikTok и системно занимается поисковой оптимизацией (SEO) и построением обратных ссылок.

Впрочем, техническое усложнение продуктов тоже имеет место. Дэнни Постма развеивает миф о том, что современные ИИ-сервисы — это простые интерфейсы поверх API OpenAI или Midjourney. Например, архитектура Headshot Pro состоит из 15 различных ИИ-моделей, выстроенных в последовательную цепочку. Одни модели отвечают за апскейлинг, другие — за сохранение черт лица, третьи — за генерацию фона и текстур. При этом порог входа для разработки снизился: облачные платформы вроде Replicate.com позволяют легко хостить gpus-модели и связывать их через API даже с no-code инструментами вроде Zapier.

Отвечая на вопрос о перспективных нишах, Дэнни Постма советует начинающим стартаперам избегать генерации абстрактных картинок или создания очередных чат-ботов, так как этот рынок выжжен Adobe, Canva и OpenAI. Вместо этого нужно искать утилитарные боли клиентов в условиях надвигающейся рецессии и помогать им экономить деньги.

В качестве примера Дэнни Постма делится собственной идеей идеального продукта: интеграция модели распознавания речи Whisper от OpenAI и продвинутых систем Text-to-Speech. Сервис мог бы собирать за ночь лучшие посты с Hacker News, твиты любимых авторов пользователя и утром генерировать пятиминутный персонализированный аудио-подкаст для прослушивания во время прогулки с собакой. Собеседники отмечают, что такой продукт закрывает четкую ежедневную потребность в потреблении информации, в отличие от чисто хайповых проектов (вроде полностью сгенерированных нейросетью фейковых разговоров), чей фактор новизны угасает за несколько дней.

💬 Цитаты

«Я почти не сплю по ночам, потому что каждое утро, когда я просыпаюсь, запускается что-то новое, что делает предыдущие технологии устаревшими.»

Дэнни Постма 24:20

«В мире, где модель может находиться в нескольких местах одновременно, мы неизбежно увидим понижательное давление на заработную плату.»

Шинейд Бовелл 18:18
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
DreamBooth
Метод глубокого обучения для кастомизации и дообучения существующих моделей генерации изображений на основе нескольких снимков конкретного объекта или лица.
StyleGAN
Генеративно-состязательная сеть, разработанная Nvidia, способная создавать высокореалистичные изображения лиц несуществующих людей.
Whisper
Автоматическая система распознавания речи от OpenAI, преобразующая аудио в текст с высокой точностью.
Инди-хакер
Независимый разработчик, создающий и запускающий технологические продукты (стартапы) своими силами без привлечения крупного венчурного капитала.
📊 Цифры
🗓 Хронология
  1. 2016 Создание Лил Микелы (Lil Miquela), первого масштабного виртуального инфлюенсера на базе CGI-технологий.
  2. 2019 Шинейд Бовелл начинает исследовать технологии генеративно-состязательных сетей (GAN) и разработки компании Data Grid.
  3. 2020 Публикация пророческой статьи Шинейд Бовелл в журнале Vogue о неизбежной замене моделей искусственным интеллектом.
  4. 2023 Взрывной рост генеративного ИИ, запуск серийных проектов Дэнни Постмы (Deep Agency, Headshot Pro) и запись данного подкаста.
⚖️ Другая сторона
Искусственный интеллект Deep Agency Headshot Pro DreamBooth Шинейд Бовелл Дэнни Постма