Китайский прорыв: модель Kimi K2 на 1 триллион параметров угрожает лидерам рынка ИИ

В индустрии искусственного интеллекта наступил очередной «момент DeepSeek», но на этот раз в сфере агентного программирования. Китайская компания Moonshot AI представила новую модель Kimi K2, которая, обладая внушительным масштабом в 1 триллион параметров, демонстрирует выдающиеся способности в написании кода и решении математических задач. По мнению автора канала Веса Рота, эта модель способна кардинально изменить расстановку сил между проприетарными разработками США и открытым ПО.

🌍 Практические возможности: от 3D-Земли до видеоигр 0:00

Прежде чем переходить к сухим цифрам тестов, Вес Рот демонстрирует реальные возможности Kimi K2, чтобы доказать, что модель эффективна не только на бумаге . В одном из тестов он попросил нейросеть создать интерактивную 3D-симуляцию планеты Земля с циклом смены дня и ночи, независимым слоем облаков и светящимися огнями городов на темной стороне .

Результаты тестирования в реальном времени показали следующее:

Модель справилась с задачей «в один проход» (one-shot), создав полностью функциональный код для браузера .
Реализована возможность вращения и масштабирования планеты.
Огни городов (например, в США) автоматически зажигаются при попадании территории в теневую зону и гаснут на свету .
Слой облаков движется независимо от поверхности планеты, создавая эффект глубины .

Второй пример — создание мини-игры, в которой пользователь запускает метеориты в Землю, а система защиты должна перехватывать их ракетами . Модель успешно реализовала логику столкновений, счетчик населения (который уменьшается при ударах) и визуальные эффекты взрывов . Также Kimi K2 продемонстрировала навыки веб-дизайна, создав посадочную страницу для SAS-продукта с современными hover-эффектами и качественной версткой .

⚙️ Техническая архитектура и инновации в обучении 5:01

Kimi K2 — это модель типа Mixture of Experts (MoE), общая емкость которой составляет 1 триллион параметров . По словам Веса Рота, это, вероятно, самая крупная модель с открытыми весами на данный момент.

Технические особенности архитектуры:

Активируемые параметры: Несмотря на общий размер в 1 трлн, при каждом запросе задействуется только 32 миллиарда параметров, что оптимизирует вычислительные затраты .
Типы моделей: Moonshot AI выпускает как базовые модели (для исследователей), так и «инструктированные» (Instruct) версии, предназначенные для работы в режиме чат-бота .
Оптимизатор Muan Clip: При обучении использовался новый метод оптимизации, который позволил стабильно обучить модель на 15 триллионах токенов без единого скачка (spike) в процессе тренировки .

Эндрю Карр, бывший сотрудник Google Brain и OpenAI, выразил удивление стабильностью обучения модели такого масштаба . Вес Рот подчеркивает, что китайские лаборатории находят способы делать обучение более эффективным, быстрым и дешевым . Это критически важно в условиях ограниченного доступа к новейшим графическим процессорам Nvidia .

📊 Бенчмарки и конкуренция с лидерами рынка 6:43

В сравнительных тестах Kimi K2 выступает против ведущих мировых моделей: DeepSeek V3, Claude 4 Sonnet, GPT-4 и Gemini 1.5 Flash . Согласно представленным данным, во многих дисциплинах Kimi K2 либо занимает лидирующую позицию, либо идет наравне с лучшими закрытыми моделями .

Основные достижения в тестах:

Программирование и агентные задачи: Модель демонстрирует результаты уровня Claude Opus 4, оставаясь при этом открытой .
Математика и STEM: Высокие показатели среди моделей, не использующих режим «длительного размышления» (reasoning) .
Эффективность токенов: Разработчики внедрили идеи Ильи Суцкевера об эффективности данных, рассматривая их как «ископаемое топливо» для ИИ .

Вес Рот отмечает, что хотя текущая версия K2 официально не поддерживает режим рассуждений (Reasoning Mode), в интерфейсе уже появилась соответствующая опция, что намекает на скорое обновление возможностей модели .

🛠 Экосистема открытого кода и локальный запуск 10:25

По мнению Кайла Корбетта (экс-сотрудника Google), в индустрии наблюдается эффект синергии: разные лаборатории по всему миру делятся своими исследованиями, что ускоряет общий прогресс . Например, использование метода GRPO от DeepSeek позволило сделать обучение с подкреплением (RL) более доступным, не требуя огромных массивов размеченных данных .

Важным аспектом является возможность запуска Kimi K2 на локальном оборудовании:

В сети уже появились демонстрации запуска 4-битной квантованной версии модели на двух компьютерах Mac Studio с чипами M3 Ultra (512 ГБ объединенной памяти) .
Скорость генерации текста при таком запуске остается приемлемой для реальной работы .

Вес Рот считает, что такие разработки создают серьезное давление на прибыль американских технологических гигантов, таких как OpenAI . Если качественную модель для программирования можно будет использовать бесплатно или запускать локально через инструменты вроде Cursor, потребность в дорогих платных подписках может снизиться.

🔮 Будущее китайского ИИ и ответ США 12:41

Ситуация на рынке продолжает накаляться. Баладжи Сринивасан прогнозирует «шквал» новых открытых моделей из Китая, включая модели компьютерного зрения и робототехники . Причины такой стратегии открытости со стороны Китая остаются предметом дискуссий, но её положительное влияние на экосистему разработчиков неоспоримо .

В то же время, американские компании готовят ответные шаги:

Google Gemini: Ожидается запуск агентных функций, таких как планирование рабочих процессов, автоматизация звонков и глубокий режим размышлений (Deep Thinker) .
Kingfall: В сети периодически появляется загадочная модель от Google, которая может стать следующим крупным релизом .

В заключение Вес Рот подчеркивает, что разрыв между открытыми и проприетарными моделями сокращается стремительно . По его собственным тестам, Kimi K2 уже превосходит некоторые недавно выпущенные модели от ведущих американских лабораторий .