Эксперты о прорыве o1: «Мышление или просто поиск?»

Machine Learning Street Talk 5,5 тыс. 39 мин 2 мин 18.03.2025
Главное

🧠 ARC Prize 2024: Переосмысление логики и возможностей ИИ 0:00

Недавние успехи моделей в решении ARC Challenge (Abstraction and Reasoning Corpus) спровоцировали серьезный пересмотр подходов к оценке общего искусственного интеллекта (AGI). В панельной дискуссии эксперты канала Machine Learning Street Talk обсудили, является ли текущий прогресс моделей, таких как o1 от OpenAI, реальным прорывом в обобщении или лишь результатом огромных вычислительных затрат и оптимизации данных.

🛠 Механизмы «мышления» и архитектурные сдвиги 5:18

Одной из центральных тем стало обсуждение того, как именно модели достигают высоких результатов в задачах, требующих рассуждений. Вместо стандартного авторегрессионного предсказания токенов, новые модели используют алгоритмические надстройки.

📊 Обновление взглядов и «проблема контаминации» 2:52

Дискуссия затронула опасения по поводу возможного загрязнения обучающих данных (data set contamination). Хотя эксперты признают, что o1 демонстрирует признаки «понимания» (в случаях, когда модель делает верные предсказания даже при ошибках в исходных метках), вопросы остаются,.

🤖 Соперничество моделей и вопрос «души» 20:15

Участники обсудили текущий ландшафт моделей и прогнозы на будущее:

🌐 Что дальше: поиск нового бенчмарка 33:18

Участники подчеркнули, что даже если ARC и Frontier Math будут полностью покорены, это не обязательно будет означать создание полноценного AGI.

💬 Цитаты

«Мы, кажется, столкнулись с галлюцинациями второго порядка: o1 Pro галлюцинирует из самих траекторий рассуждений.»

Участник дискуссии 02:23

«Модели хороши в том, что они делают, но они не ощущаются как общий интеллект.»

Участник дискуссии 28:40
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
ARC Challenge
Набор задач для проверки способностей ИИ к абстрактному мышлению и обобщению.
Chain of Thought
Техника, при которой модель генерирует промежуточные шаги рассуждений перед выдачей финального ответа.
Tokenization
Процесс разбиения текста на смысловые единицы (токены) для обработки нейросетью.
Logits
Ненормализованные вероятности токенов, которые вычисляет нейросеть перед выбором следующего слова.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект ARC Prize OpenAI o1 Large Language Models General Intelligence