Будущее искусственного интеллекта не должно принадлежать узкому кругу корпоративных «олигархов» — эта идея стала лейтмотивом беседы Крейга Смита с Маносом Кукумидисом, основателем проекта Umi. В условиях, когда ИИ превращается в общественную инфраструктуру уровня электричества, открытость технологий становится не просто вопросом удобства, а залогом глобальной безопасности и инноваций.
🧩 Что на самом деле означает Open-Source в эпоху ИИ 0:00
Одной из главных проблем современной индустрии ИИ Манос Кукумидис называет размытость терминологии. Многие компании заявляют об «открытости», предоставляя лишь частичные данные, что вводит сообщество в заблуждение .
По словам Кукумидиса, для подлинного Open-Source ИИ недостаточно просто открыть веса моделей (Open Weights). Настоящая открытость требует соблюдения четырех условий:
- Open Data: доступ к исходным наборам данных, на которых обучалась модель .
- Open Code: полная публикация программного кода.
- Open Models/Weights: доступ к параметрам обученной модели.
- Open Collaboration: создание среды, где сторонний разработчик может не просто скачать файлы, но и легко воспроизвести результат, внести вклад и расширить функционал .
Кукумидис утверждает, что определение Open Source Initiative (OSI) является «верным по сути», но требует дополнения в части простоты сотрудничества. Если воспроизведение модели требует от сообщества запредельных усилий или «темных знаний» (скрытых скриптов и недокументированных шагов), такая модель не может считаться по-настоящему свободной .
🏗️ Проект Umi: «Linux для мира ИИ» 3:50
Манос Кукумидис — ветеран индустрии, работавший в Google Cloud (где он запускал Cloud PaLM до появления Gemini), Meta и Microsoft . Его новый проект Umi (Open Universal Machine Intelligence) нацелен на создание платформы, которая сделает разработку мощных моделей доступной не только технологическим гигантам, но и академическим институтам .
Ключевые особенности платформы Umi:
- Универсальность: поддержка более 100 актуальных открытых моделей, включая Llama 3 (вплоть до версии 405B) .
- Полный цикл: инструменты для претрейнинга, посттрейнинга (fine-tuning, RLHF), оценки (benchmarking) и курации данных собраны в одном репозитории .
- Воспроизводимость: возможность запустить обучение или дообучение модели буквально парой команд (
umi installиumi train), имея файл конфигурации . - Агностичность к «железу»: платформа позволяет бесшовно переключаться между локальными GPU (например, MacBook), облачными провайдерами (AWS, GCP, Lambda) или гигантскими суперкомпьютерами (HPC) без переписывания кода .
Кукумидис приводит в пример модель CALM, созданную в партнерстве с университетами CMU и UIUC. Эта агентная модель не только находится в открытом доступе со всеми данными обучения, но и обходит GPT-4o в ряде тестов на использование инструментов (tool use) [13:31, 52:29].
🏛️ Почему закрытые модели — это риск для человечества 15:13
Собеседники провели параллель между исходным кодом ИИ и проектом «Геном человека». Кукумидис цитирует позицию (приписываемую Биллу Клинтону), согласно которой сокрытие данных о геноме ради монетизации было бы преступлением против человечества . По мнению гостя, аналогичная ситуация складывается и с ИИ.
Аргументы Кукумидиса против доминирования закрытых (closed-source) систем:
- Медицинская этика: если ИИ в 5 раз точнее врачей находит патологии (например, при колоноскопии), то неиспользование ИИ скоро станет врачебной ошибкой. Такие критически важные технологии не должны быть «черным ящиком» в распоряжении одной компании .
- Борьба с «ИИ-олигархами»: только узкий круг компаний выигрывает от закрытости. Остальные — облачные провайдеры, производители чипов (NVIDIA, AMD) и потребительские гиганты (как Meta) — заинтересованы в открытых стандартах, чтобы не попасть в рабскую зависимость от лицензий OpenAI или Google .
- Инклюзивность: закрытая компания никогда не сможет адекватно представить в модели все языки, диалекты и религиозные нюансы малых народов. Кукумидис считает открытость единственным способом избежать культурной предвзятости .
📉 Экономическое давление и «момент DeepSeek» 6:49
Ведущий Крейг Смит отметил, что появление китайских моделей вроде DeepSeek заставило индустрию проснуться. Кукумидис полагает, что давление открытого ПО на проприетарные модели будет только нарастать .
По прогнозу гостя:
- Инвесторы начнут сомневаться в раздутых оценках компаний, разрабатывающих закрытые модели, так как их технологическое преимущество стремительно тает .
- Закрытые разработчики (OpenAI, Anthropic) будут вынуждены смещать фокус на прикладные приложения, так как сами базовые модели станут дешевым общедоступным товаром (commodity) .
- Через 5 лет большинство корпоративных задач будет решаться на базе открытых моделей, дообученных под конкретные нужды бизнеса .
🎓 Академический запрос на инструменты 34:45
Важным стимулом для создания Umi стало общение с академическим сообществом. Профессора из CMU (например, Руслан Салахутдинов) жаловались Кукумидису, что студентам крайне сложно проводить исследования на переднем крае науки из-за отсутствия масштабируемых инструментов.
«Мы — неиспользованный ресурс», — передает Кукумидис слова профессора Амита Шармы. Ученые хотят вносить вклад в развитие ИИ, но не имеют инфраструктуры для работы с моделями уровня 70B или 405B параметров . Umi призвана заполнить этот пробел, став тем самым «Linux моментом» для ИИ-индустрии .