Китайский прорыв: модель Kimi K2 на 1 триллион параметров угрожает лидерам рынка ИИ

Wes Roth 108 тыс. 16 мин 4 мин 12.07.2025
Главное

В индустрии искусственного интеллекта наступил очередной «момент DeepSeek», но на этот раз в сфере агентного программирования. Китайская компания Moonshot AI представила новую модель Kimi K2, которая, обладая внушительным масштабом в 1 триллион параметров, демонстрирует выдающиеся способности в написании кода и решении математических задач. По мнению автора канала Веса Рота, эта модель способна кардинально изменить расстановку сил между проприетарными разработками США и открытым ПО.

🌍 Практические возможности: от 3D-Земли до видеоигр 0:00

Прежде чем переходить к сухим цифрам тестов, Вес Рот демонстрирует реальные возможности Kimi K2, чтобы доказать, что модель эффективна не только на бумаге . В одном из тестов он попросил нейросеть создать интерактивную 3D-симуляцию планеты Земля с циклом смены дня и ночи, независимым слоем облаков и светящимися огнями городов на темной стороне .

Результаты тестирования в реальном времени показали следующее:

Второй пример — создание мини-игры, в которой пользователь запускает метеориты в Землю, а система защиты должна перехватывать их ракетами . Модель успешно реализовала логику столкновений, счетчик населения (который уменьшается при ударах) и визуальные эффекты взрывов . Также Kimi K2 продемонстрировала навыки веб-дизайна, создав посадочную страницу для SAS-продукта с современными hover-эффектами и качественной версткой .

⚙️ Техническая архитектура и инновации в обучении 5:01

Kimi K2 — это модель типа Mixture of Experts (MoE), общая емкость которой составляет 1 триллион параметров . По словам Веса Рота, это, вероятно, самая крупная модель с открытыми весами на данный момент.

Технические особенности архитектуры:

Эндрю Карр, бывший сотрудник Google Brain и OpenAI, выразил удивление стабильностью обучения модели такого масштаба . Вес Рот подчеркивает, что китайские лаборатории находят способы делать обучение более эффективным, быстрым и дешевым . Это критически важно в условиях ограниченного доступа к новейшим графическим процессорам Nvidia .

📊 Бенчмарки и конкуренция с лидерами рынка 6:43

В сравнительных тестах Kimi K2 выступает против ведущих мировых моделей: DeepSeek V3, Claude 4 Sonnet, GPT-4 и Gemini 1.5 Flash . Согласно представленным данным, во многих дисциплинах Kimi K2 либо занимает лидирующую позицию, либо идет наравне с лучшими закрытыми моделями .

Основные достижения в тестах:

  1. Программирование и агентные задачи: Модель демонстрирует результаты уровня Claude Opus 4, оставаясь при этом открытой .
  2. Математика и STEM: Высокие показатели среди моделей, не использующих режим «длительного размышления» (reasoning) .
  3. Эффективность токенов: Разработчики внедрили идеи Ильи Суцкевера об эффективности данных, рассматривая их как «ископаемое топливо» для ИИ .

Вес Рот отмечает, что хотя текущая версия K2 официально не поддерживает режим рассуждений (Reasoning Mode), в интерфейсе уже появилась соответствующая опция, что намекает на скорое обновление возможностей модели .

🛠 Экосистема открытого кода и локальный запуск 10:25

По мнению Кайла Корбетта (экс-сотрудника Google), в индустрии наблюдается эффект синергии: разные лаборатории по всему миру делятся своими исследованиями, что ускоряет общий прогресс . Например, использование метода GRPO от DeepSeek позволило сделать обучение с подкреплением (RL) более доступным, не требуя огромных массивов размеченных данных .

Важным аспектом является возможность запуска Kimi K2 на локальном оборудовании:

Вес Рот считает, что такие разработки создают серьезное давление на прибыль американских технологических гигантов, таких как OpenAI . Если качественную модель для программирования можно будет использовать бесплатно или запускать локально через инструменты вроде Cursor, потребность в дорогих платных подписках может снизиться.

🔮 Будущее китайского ИИ и ответ США 12:41

Ситуация на рынке продолжает накаляться. Баладжи Сринивасан прогнозирует «шквал» новых открытых моделей из Китая, включая модели компьютерного зрения и робототехники . Причины такой стратегии открытости со стороны Китая остаются предметом дискуссий, но её положительное влияние на экосистему разработчиков неоспоримо .

В то же время, американские компании готовят ответные шаги:

В заключение Вес Рот подчеркивает, что разрыв между открытыми и проприетарными моделями сокращается стремительно . По его собственным тестам, Kimi K2 уже превосходит некоторые недавно выпущенные модели от ведущих американских лабораторий .

💬 Цитаты

«Я никогда не видел такого стабильного процесса обучения модели на несколько триллионов токенов.»

Эндрю Карр 09:01

«Разрыв между открытыми и проприетарными моделями сокращается невероятно быстро.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Mixture of Experts (MoE)
Архитектура нейросети, где для выполнения конкретной задачи активируется только часть нейронов (экспертов), что экономит вычислительные ресурсы.
Квантование (Quantization)
Процесс сжатия модели путем снижения точности её весов, что позволяет запускать огромные нейросети на обычном пользовательском оборудовании.
One-shot
Способность модели выполнить сложную задачу по единственному запросу пользователя без дополнительных уточнений.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Kimi K2 Moonshot AI Wes Roth DeepSeek открытый код