В индустрии искусственного интеллекта наступил очередной «момент DeepSeek», но на этот раз в сфере агентного программирования. Китайская компания Moonshot AI представила новую модель Kimi K2, которая, обладая внушительным масштабом в 1 триллион параметров, демонстрирует выдающиеся способности в написании кода и решении математических задач. По мнению автора канала Веса Рота, эта модель способна кардинально изменить расстановку сил между проприетарными разработками США и открытым ПО.
🌍 Практические возможности: от 3D-Земли до видеоигр 0:00
Прежде чем переходить к сухим цифрам тестов, Вес Рот демонстрирует реальные возможности Kimi K2, чтобы доказать, что модель эффективна не только на бумаге . В одном из тестов он попросил нейросеть создать интерактивную 3D-симуляцию планеты Земля с циклом смены дня и ночи, независимым слоем облаков и светящимися огнями городов на темной стороне .
Результаты тестирования в реальном времени показали следующее:
- Модель справилась с задачей «в один проход» (one-shot), создав полностью функциональный код для браузера .
- Реализована возможность вращения и масштабирования планеты.
- Огни городов (например, в США) автоматически зажигаются при попадании территории в теневую зону и гаснут на свету .
- Слой облаков движется независимо от поверхности планеты, создавая эффект глубины .
Второй пример — создание мини-игры, в которой пользователь запускает метеориты в Землю, а система защиты должна перехватывать их ракетами . Модель успешно реализовала логику столкновений, счетчик населения (который уменьшается при ударах) и визуальные эффекты взрывов . Также Kimi K2 продемонстрировала навыки веб-дизайна, создав посадочную страницу для SAS-продукта с современными hover-эффектами и качественной версткой .
⚙️ Техническая архитектура и инновации в обучении 5:01
Kimi K2 — это модель типа Mixture of Experts (MoE), общая емкость которой составляет 1 триллион параметров . По словам Веса Рота, это, вероятно, самая крупная модель с открытыми весами на данный момент.
Технические особенности архитектуры:
- Активируемые параметры: Несмотря на общий размер в 1 трлн, при каждом запросе задействуется только 32 миллиарда параметров, что оптимизирует вычислительные затраты .
- Типы моделей: Moonshot AI выпускает как базовые модели (для исследователей), так и «инструктированные» (Instruct) версии, предназначенные для работы в режиме чат-бота .
- Оптимизатор Muan Clip: При обучении использовался новый метод оптимизации, который позволил стабильно обучить модель на 15 триллионах токенов без единого скачка (spike) в процессе тренировки .
Эндрю Карр, бывший сотрудник Google Brain и OpenAI, выразил удивление стабильностью обучения модели такого масштаба . Вес Рот подчеркивает, что китайские лаборатории находят способы делать обучение более эффективным, быстрым и дешевым . Это критически важно в условиях ограниченного доступа к новейшим графическим процессорам Nvidia .
📊 Бенчмарки и конкуренция с лидерами рынка 6:43
В сравнительных тестах Kimi K2 выступает против ведущих мировых моделей: DeepSeek V3, Claude 4 Sonnet, GPT-4 и Gemini 1.5 Flash . Согласно представленным данным, во многих дисциплинах Kimi K2 либо занимает лидирующую позицию, либо идет наравне с лучшими закрытыми моделями .
Основные достижения в тестах:
- Программирование и агентные задачи: Модель демонстрирует результаты уровня Claude Opus 4, оставаясь при этом открытой .
- Математика и STEM: Высокие показатели среди моделей, не использующих режим «длительного размышления» (reasoning) .
- Эффективность токенов: Разработчики внедрили идеи Ильи Суцкевера об эффективности данных, рассматривая их как «ископаемое топливо» для ИИ .
Вес Рот отмечает, что хотя текущая версия K2 официально не поддерживает режим рассуждений (Reasoning Mode), в интерфейсе уже появилась соответствующая опция, что намекает на скорое обновление возможностей модели .
🛠 Экосистема открытого кода и локальный запуск 10:25
По мнению Кайла Корбетта (экс-сотрудника Google), в индустрии наблюдается эффект синергии: разные лаборатории по всему миру делятся своими исследованиями, что ускоряет общий прогресс . Например, использование метода GRPO от DeepSeek позволило сделать обучение с подкреплением (RL) более доступным, не требуя огромных массивов размеченных данных .
Важным аспектом является возможность запуска Kimi K2 на локальном оборудовании:
- В сети уже появились демонстрации запуска 4-битной квантованной версии модели на двух компьютерах Mac Studio с чипами M3 Ultra (512 ГБ объединенной памяти) .
- Скорость генерации текста при таком запуске остается приемлемой для реальной работы .
Вес Рот считает, что такие разработки создают серьезное давление на прибыль американских технологических гигантов, таких как OpenAI . Если качественную модель для программирования можно будет использовать бесплатно или запускать локально через инструменты вроде Cursor, потребность в дорогих платных подписках может снизиться.
🔮 Будущее китайского ИИ и ответ США 12:41
Ситуация на рынке продолжает накаляться. Баладжи Сринивасан прогнозирует «шквал» новых открытых моделей из Китая, включая модели компьютерного зрения и робототехники . Причины такой стратегии открытости со стороны Китая остаются предметом дискуссий, но её положительное влияние на экосистему разработчиков неоспоримо .
В то же время, американские компании готовят ответные шаги:
- Google Gemini: Ожидается запуск агентных функций, таких как планирование рабочих процессов, автоматизация звонков и глубокий режим размышлений (Deep Thinker) .
- Kingfall: В сети периодически появляется загадочная модель от Google, которая может стать следующим крупным релизом .
В заключение Вес Рот подчеркивает, что разрыв между открытыми и проприетарными моделями сокращается стремительно . По его собственным тестам, Kimi K2 уже превосходит некоторые недавно выпущенные модели от ведущих американских лабораторий .