Манос Кукумидис: «Будущее ИИ принадлежит сообществу, а не олигархам»

Eye on AI 748 1 ч 6 мин 4 мин 04.03.2025
Главное

Будущее искусственного интеллекта не должно принадлежать узкому кругу корпоративных «олигархов» — эта идея стала лейтмотивом беседы Крейга Смита с Маносом Кукумидисом, основателем проекта Umi. В условиях, когда ИИ превращается в общественную инфраструктуру уровня электричества, открытость технологий становится не просто вопросом удобства, а залогом глобальной безопасности и инноваций.

🧩 Что на самом деле означает Open-Source в эпоху ИИ 0:00

Одной из главных проблем современной индустрии ИИ Манос Кукумидис называет размытость терминологии. Многие компании заявляют об «открытости», предоставляя лишь частичные данные, что вводит сообщество в заблуждение .

По словам Кукумидиса, для подлинного Open-Source ИИ недостаточно просто открыть веса моделей (Open Weights). Настоящая открытость требует соблюдения четырех условий:

Кукумидис утверждает, что определение Open Source Initiative (OSI) является «верным по сути», но требует дополнения в части простоты сотрудничества. Если воспроизведение модели требует от сообщества запредельных усилий или «темных знаний» (скрытых скриптов и недокументированных шагов), такая модель не может считаться по-настоящему свободной .

🏗️ Проект Umi: «Linux для мира ИИ» 3:50

Манос Кукумидис — ветеран индустрии, работавший в Google Cloud (где он запускал Cloud PaLM до появления Gemini), Meta и Microsoft . Его новый проект Umi (Open Universal Machine Intelligence) нацелен на создание платформы, которая сделает разработку мощных моделей доступной не только технологическим гигантам, но и академическим институтам .

Ключевые особенности платформы Umi:

  1. Универсальность: поддержка более 100 актуальных открытых моделей, включая Llama 3 (вплоть до версии 405B) .
  2. Полный цикл: инструменты для претрейнинга, посттрейнинга (fine-tuning, RLHF), оценки (benchmarking) и курации данных собраны в одном репозитории .
  3. Воспроизводимость: возможность запустить обучение или дообучение модели буквально парой команд (umi install и umi train), имея файл конфигурации .
  4. Агностичность к «железу»: платформа позволяет бесшовно переключаться между локальными GPU (например, MacBook), облачными провайдерами (AWS, GCP, Lambda) или гигантскими суперкомпьютерами (HPC) без переписывания кода .

Кукумидис приводит в пример модель CALM, созданную в партнерстве с университетами CMU и UIUC. Эта агентная модель не только находится в открытом доступе со всеми данными обучения, но и обходит GPT-4o в ряде тестов на использование инструментов (tool use) [13:31, 52:29].

🏛️ Почему закрытые модели — это риск для человечества 15:13

Собеседники провели параллель между исходным кодом ИИ и проектом «Геном человека». Кукумидис цитирует позицию (приписываемую Биллу Клинтону), согласно которой сокрытие данных о геноме ради монетизации было бы преступлением против человечества . По мнению гостя, аналогичная ситуация складывается и с ИИ.

Аргументы Кукумидиса против доминирования закрытых (closed-source) систем:

📉 Экономическое давление и «момент DeepSeek» 6:49

Ведущий Крейг Смит отметил, что появление китайских моделей вроде DeepSeek заставило индустрию проснуться. Кукумидис полагает, что давление открытого ПО на проприетарные модели будет только нарастать .

По прогнозу гостя:

  1. Инвесторы начнут сомневаться в раздутых оценках компаний, разрабатывающих закрытые модели, так как их технологическое преимущество стремительно тает .
  2. Закрытые разработчики (OpenAI, Anthropic) будут вынуждены смещать фокус на прикладные приложения, так как сами базовые модели станут дешевым общедоступным товаром (commodity) .
  3. Через 5 лет большинство корпоративных задач будет решаться на базе открытых моделей, дообученных под конкретные нужды бизнеса .

🎓 Академический запрос на инструменты 34:45

Важным стимулом для создания Umi стало общение с академическим сообществом. Профессора из CMU (например, Руслан Салахутдинов) жаловались Кукумидису, что студентам крайне сложно проводить исследования на переднем крае науки из-за отсутствия масштабируемых инструментов.

«Мы — неиспользованный ресурс», — передает Кукумидис слова профессора Амита Шармы. Ученые хотят вносить вклад в развитие ИИ, но не имеют инфраструктуры для работы с моделями уровня 70B или 405B параметров . Umi призвана заполнить этот пробел, став тем самым «Linux моментом» для ИИ-индустрии .

💬 Цитаты

«Было бы практически преступлением скрывать критические открытия, касающиеся жизни и смерти, только ради того, чтобы компания могла на этом заработать.»

Манос Кукумидис 16:07

«Если вы не планируете стать ИИ-олигархом, закрытая модель вам невыгодна.»

Манос Кукумидис 23:01

«Open-source — это как Википедия: единственный способ собрать знания всего человечества инклюзивно.»

Манос Кукумидис 44:00
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Open Weights
Модели ИИ, в которых опубликованы обученные параметры (веса), но не всегда раскрыты данные обучения.
Post-training
Этап дообучения модели (fine-tuning, RLHF) после основной фазы обучения на гигантских массивах данных.
Agentic models
Модели ИИ, способные не просто генерировать текст, но и выполнять действия, используя внешние инструменты и API.
RAG (Retrieval-Augmented Generation)
Технология, позволяющая модели ИИ искать информацию во внешних базах данных перед генерацией ответа.
📊 Цифры
🗓 Хронология
  1. Май 2023 Запуск сервисов Google Cloud PaLM под руководством Кукумидиса
  2. Начало 2024 Основание проекта Umi
  3. Февраль 2025 Публичный запуск платформы Umi и выход агентной модели CALM
⚖️ Другая сторона
Искусственный интеллект Umi Open Source Manos Koukoumidis Llama 3 DeepSeek