Как Adobe и Yelp строят бизнес-кейсы для платформ машинного обучения

The TWIML AI Podcast 746 31 мин 4 мин 08.09.2022
Главное

Создание платформ машинного обучения (ML) — это уже не вопрос престижа, а насущная необходимость для крупных компаний. В рамках конференции, организованной The TWIML AI Podcast, эксперты из Adobe, Yelp и Booz Allen Hamilton обсудили, как обосновать инвестиции в инфраструктуру, когда пора переходить от готовых облачных решений к собственным разработкам и как централизация платформ помогает масштабировать инновации, не создавая хаоса в процессах.

💼 Эволюция бизнес-кейса: от «зачем нам ML» к «как этим управлять» 0:01

В индустрии произошел качественный сдвиг: если раньше руководители подразделений задавались вопросом о целесообразности использования машинного обучения в принципе, то теперь фокус сместился на распределение бюджетов . Основная дилемма сегодня — как сбалансировать инвестиции между конкретными прикладными проектами (найм талантов, разметка данных) и созданием общекорпоративных платформ, которые эти проекты поддерживают.

Джастин Норман (Yelp) отмечает, что в зрелых организациях, которые уже сделали многолетние восьмизначные инвестиции в ИИ, каждый новый запрос на финансирование теперь проверяется так же строго, как любые другие инженерные или продуктовые затраты . Разговоры о «полезности» сменились разговорами о «измеримости» и конкретной отдаче от вложений (ROI).

Кирк Борн (Booz Allen Hamilton) подчеркивает важность ориентации на результат:

📈 Метрики эффективности: как оценить пользу платформенной команды 15:04

Для руководителя платформенного подразделения главная сложность заключается в том, что его работа — это не конечный продукт, а «включение» (enablement) других команд. Дивья Джейн (Adobe) выделяет несколько ключевых показателей эффективности (KPI), которые помогают доказать ценность платформы руководству :

  1. Time-to-Market (Скорость вывода на рынок): Если раньше путь модели от идеи в исследовательском отделе до внедрения в продакшен занимал 6–9 месяцев, а с платформой сократился до 3 месяцев — это прямой показатель эффективности .
  2. Повторное использование (Deduplication): Возможность применить одну и ту же модель или пайплайн данных в разных продуктовых линейках с минимальной доработкой экономит огромные ресурсы организации .
  3. Демократизация: Упрощение инструментов до такой степени, чтобы ML могли использовать не только узкие специалисты, но и смежные подразделения.

🛠 Дилемма «Создать или купить»: когда API недостаточно 17:50

Вопрос о том, стоит ли строить собственную платформу или использовать готовые облачные сервисы (AWS, Google Cloud, Azure), вызвал активную дискуссию.

Кирк Борн придерживается мнения, что новичкам не стоит изобретать велосипед. Начать можно с готовых API для распознавания лиц, обработки естественного языка или создания чат-ботов . Это позволяет быстро проверить гипотезу без капитальных вложений в инфраструктуру.

Однако Джастин Норман возражает, указывая на ограничения готовых решений при масштабировании :

Норман предлагает рассматривать ML-платформу как самостоятельный продукт, в который вовлечены дизайнеры, стратеги и инженеры, что позволяет гибко переходить от одного вендора к мультивендорной системе по мере роста .

🏛 Централизация против свободы: в поисках баланса 23:24

Другой важный аспект — организационная структура. Стоит ли создавать единую платформенную команду или распределять специалистов по продуктовым группам?

По словам Дивьи Джейн, в Adobe принята модель централизованной платформы. Это необходимо, так как область ML еще не стандартизирована . Если каждая команда будет самостоятельно решать задачи хранения данных, обучения и эксплуатации моделей, компания погрязнет в дублировании функций и проблемах с безопасностью . Централизация обеспечивает «управление и соответствие» (governance and consistency), подобно тому, как в обычной разработке существуют единые системы CI/CD и базы данных.

Джастин Норман описывает гибридный подход в Yelp :

Ключевой вывод дискуссии: платформа должна не ограничивать инновации, а снимать с исследователей рутинное бремя инфраструктуры, позволяя им фокусироваться на бизнес-задачах.

💬 Цитаты

«Если вы возьмете 11 лучших квотербеков из НФЛ и выставите их как одно нападение, вы проиграете, потому что вам нужно разнообразие навыков.»

Кирк Борн 12:31

«Платформа означает, что вы расширяете возможности других, а это значит, что вы облегчаете им выполнение задачи.»

Дивья Джейн 16:59

«Мы рассматриваем ML-платформу как самостоятельный продукт, что позволяет применять дизайн-мышление и финансовую стратегию ко всей цепочке.»

Джастин Норман 21:55
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Time-to-Market
Время от начала разработки идеи до выпуска готового продукта на рынок.
ROI (Return on Investment)
Коэффициент окупаемости инвестиций, показывающий прибыльность вложений.
CI/CD
Методология автоматизации тестирования и доставки нового кода в рабочую среду.
Inference
Процесс использования обученной модели для получения предсказаний на новых данных.
📊 Цифры
🗓 Хронология
  1. 18 лет назад Кирк Борн помог запустить первую в мире программу бакалавриата по Data Science в Университете Джорджа Мейсона.
  2. 3 года назад Дивья Джейн присоединилась к Adobe для руководства направлением ML-платформ.
  3. Прошлый год Кирк Борн был назначен первым в истории Booz Allen Hamilton научным сотрудником (Fellow) по данным.
⚖️ Другая сторона
Искусственный интеллект Adobe Yelp ML Platform ROI Booz Allen Hamilton