Манос Кукумидис: «Будущее ИИ принадлежит сообществу, а не олигархам»

Будущее искусственного интеллекта не должно принадлежать узкому кругу корпоративных «олигархов» — эта идея стала лейтмотивом беседы Крейга Смита с Маносом Кукумидисом, основателем проекта Umi. В условиях, когда ИИ превращается в общественную инфраструктуру уровня электричества, открытость технологий становится не просто вопросом удобства, а залогом глобальной безопасности и инноваций.

🧩 Что на самом деле означает Open-Source в эпоху ИИ 0:00

Одной из главных проблем современной индустрии ИИ Манос Кукумидис называет размытость терминологии. Многие компании заявляют об «открытости», предоставляя лишь частичные данные, что вводит сообщество в заблуждение .

По словам Кукумидиса, для подлинного Open-Source ИИ недостаточно просто открыть веса моделей (Open Weights). Настоящая открытость требует соблюдения четырех условий:

Open Data: доступ к исходным наборам данных, на которых обучалась модель .
Open Code: полная публикация программного кода.
Open Models/Weights: доступ к параметрам обученной модели.
Open Collaboration: создание среды, где сторонний разработчик может не просто скачать файлы, но и легко воспроизвести результат, внести вклад и расширить функционал .

Кукумидис утверждает, что определение Open Source Initiative (OSI) является «верным по сути», но требует дополнения в части простоты сотрудничества. Если воспроизведение модели требует от сообщества запредельных усилий или «темных знаний» (скрытых скриптов и недокументированных шагов), такая модель не может считаться по-настоящему свободной .

🏗️ Проект Umi: «Linux для мира ИИ» 3:50

Манос Кукумидис — ветеран индустрии, работавший в Google Cloud (где он запускал Cloud PaLM до появления Gemini), Meta и Microsoft . Его новый проект Umi (Open Universal Machine Intelligence) нацелен на создание платформы, которая сделает разработку мощных моделей доступной не только технологическим гигантам, но и академическим институтам .

Ключевые особенности платформы Umi:

Универсальность: поддержка более 100 актуальных открытых моделей, включая Llama 3 (вплоть до версии 405B) .
Полный цикл: инструменты для претрейнинга, посттрейнинга (fine-tuning, RLHF), оценки (benchmarking) и курации данных собраны в одном репозитории .
Воспроизводимость: возможность запустить обучение или дообучение модели буквально парой команд (umi install и umi train), имея файл конфигурации .
Агностичность к «железу»: платформа позволяет бесшовно переключаться между локальными GPU (например, MacBook), облачными провайдерами (AWS, GCP, Lambda) или гигантскими суперкомпьютерами (HPC) без переписывания кода .

Кукумидис приводит в пример модель CALM, созданную в партнерстве с университетами CMU и UIUC. Эта агентная модель не только находится в открытом доступе со всеми данными обучения, но и обходит GPT-4o в ряде тестов на использование инструментов (tool use) [13:31, 52:29].

🏛️ Почему закрытые модели — это риск для человечества 15:13

Собеседники провели параллель между исходным кодом ИИ и проектом «Геном человека». Кукумидис цитирует позицию (приписываемую Биллу Клинтону), согласно которой сокрытие данных о геноме ради монетизации было бы преступлением против человечества . По мнению гостя, аналогичная ситуация складывается и с ИИ.

Аргументы Кукумидиса против доминирования закрытых (closed-source) систем:

Медицинская этика: если ИИ в 5 раз точнее врачей находит патологии (например, при колоноскопии), то неиспользование ИИ скоро станет врачебной ошибкой. Такие критически важные технологии не должны быть «черным ящиком» в распоряжении одной компании .
Борьба с «ИИ-олигархами»: только узкий круг компаний выигрывает от закрытости. Остальные — облачные провайдеры, производители чипов (NVIDIA, AMD) и потребительские гиганты (как Meta) — заинтересованы в открытых стандартах, чтобы не попасть в рабскую зависимость от лицензий OpenAI или Google .
Инклюзивность: закрытая компания никогда не сможет адекватно представить в модели все языки, диалекты и религиозные нюансы малых народов. Кукумидис считает открытость единственным способом избежать культурной предвзятости .

📉 Экономическое давление и «момент DeepSeek» 6:49

Ведущий Крейг Смит отметил, что появление китайских моделей вроде DeepSeek заставило индустрию проснуться. Кукумидис полагает, что давление открытого ПО на проприетарные модели будет только нарастать .

По прогнозу гостя:

Инвесторы начнут сомневаться в раздутых оценках компаний, разрабатывающих закрытые модели, так как их технологическое преимущество стремительно тает .
Закрытые разработчики (OpenAI, Anthropic) будут вынуждены смещать фокус на прикладные приложения, так как сами базовые модели станут дешевым общедоступным товаром (commodity) .
Через 5 лет большинство корпоративных задач будет решаться на базе открытых моделей, дообученных под конкретные нужды бизнеса .

🎓 Академический запрос на инструменты 34:45

Важным стимулом для создания Umi стало общение с академическим сообществом. Профессора из CMU (например, Руслан Салахутдинов) жаловались Кукумидису, что студентам крайне сложно проводить исследования на переднем крае науки из-за отсутствия масштабируемых инструментов.

«Мы — неиспользованный ресурс», — передает Кукумидис слова профессора Амита Шармы. Ученые хотят вносить вклад в развитие ИИ, но не имеют инфраструктуры для работы с моделями уровня 70B или 405B параметров . Umi призвана заполнить этот пробел, став тем самым «Linux моментом» для ИИ-индустрии .