Цви Мовшовиц: «По умолчанию итогом развития ИИ станет гибель человечества»

The Cognitive Revolution 1,1 тыс. 2 ч 42 мин 4 мин 11.07.2023
Главное

Этот выпуск подкаста «The Cognitive Revolution» посвящен глубокому анализу безопасности искусственного интеллекта и текущей структуре дискуссий вокруг этой технологии. Ведущий Натан Лабенц беседует с Цви Мовшовицем, автором блога «Don't Worry About the Vase», который синтезирует огромные потоки информации об ИИ в еженедельные аналитические обзоры.

🧠 Мировоззрение Цви Мовшовица и природа рисков ИИ 18:25

Цви Мовшовиц описывает свое видение проблемы ИИ как переход от полезного инструмента к потенциально опасному сопернику. По его мнению, современные языковые модели (LLM) — это почти исключительно позитивное явление . Однако ситуация радикально меняется по мере приближения ИИ к человеческому уровню интеллекта.

Основные тезисы Мовшовица о рисках развития ИИ:

📊 Вероятность катастрофы (P-Doom) и бессмысленность точных цифр 27:30

В сообществе исследователей ИИ часто обсуждают «P-Doom» — субъективную вероятность экзистенциальной катастрофы. Цви Мовшовиц скептически относится к попыткам назвать точное число . Его аргументация такова:

  1. Если вероятность составляет 10%, 50% или 90%, набор необходимых действий практически не меняется — проблема всё равно остается приоритетной .
  2. Лично он оценивает риск примерно в 50%, при этом половина риска приходится на неспособность решить техническую проблему выравнивания (alignment), а вторая половина — на неудачную спецификацию целей (мы получим то, что просили, но это окажется ужасным) .

Натан Лабенц соглашается, что нижняя граница риска уже достаточно высока, чтобы оправдать серьезную обеспокоенность, вне зависимости от точности прогноза .

🏛️ Кто на самом деле влияет на будущее ИИ? 33:10

Собеседники обсудили иерархию влияния в текущих дебатах об ИИ. Мовшовиц выделяет несколько ключевых групп и личностей:

Цви критикует Сэма Альтмана за то, что тот, понимая проблему лично, не смог создать культуру безопасности внутри OpenAI, где многие нанятые сотрудники не разделяют его опасений .

🏹 Пять лагерей в дискурсе вокруг ИИ 55:39

Цви Мовшовиц классифицирует участников дебатов на несколько групп:

  1. Эффективные акселерационисты (e/acc): Выступают за максимально быстрое развитие. Цви делит их на «честных», признающих риск смерти, но считающих его неизбежным или оправданным (как блогер @Roon ), и «слепых оптимистов», не видящих разницы между ИИ и паровым двигателем .
  2. Этика ИИ (AI Ethics): Группа, сфокусированная на текущих вредах (предвзятость, дискриминация). Мовшовиц считает их позицию часто противоречивой: они боятся влияния ИИ на выборы через год, но отрицают возможность его влияния на выживание вида через пять лет .
  3. Безопасность ИИ (AI Safety): Мейнстримный лагерь, пытающийся найти технические решения, чтобы системы делали то, что мы от них хотим.
  4. Беспокоящиеся («The Worried» или «Doomers»): Те, кто считает проблему выравнивания сверхсложной. Мовшовиц предпочитает термин «беспокоящиеся», так как «думеры» — это часто пейоратив .
  5. Экстенционисты: Радикальное крыло, считающее, что ИИ — это законный наследник человечества, и если люди вымрут, заменившись более совершенным разумом, то это морально приемлемо. С этим Цви категорически не согласен, отстаивая право людей на предпочтение выживания собственного вида .

🛠️ Что делать: чипы, законы и международная координация 2:19:10

В финальной части беседы участники обсудили практические шаги для предотвращения катастрофы. Мовшовиц настаивает на следующих мерах:

Элиезер Юдковский (Eliezer Yudkowsky) в своих текстах доходит до идеи ударов по дата-центрам в случае нарушения международных запретов. Мовшовиц поясняет эту позицию: если мы принимаем закон, мы должны быть готовы его обеспечивать силой, иначе это не закон . Главная цель таких жестких заявлений — сделать разработку опасных систем немыслимой для всех игроков.

💬 Цитаты

«В тот момент, когда вы добавляете слово «максимальный» к любой цели для ИИ, вы по умолчанию получаете стремление к власти и ресурсам.»

Цви Мовшовиц 32:21

«Мы пытаемся сохранить контроль над чем-то, что умнее нас, способнее нас и эффективнее нас. Это крайне неестественное желание.»

Цви Мовшовиц 24:42
👥 Спикеры
📚 Упомянутые книги
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
P-Doom
Субъективная оценка вероятности того, что развитие ИИ приведет к катастрофе или вымиранию человечества.
Alignment (Выравнивание)
Техническая задача по созданию систем ИИ, чьи цели и действия полностью соответствуют человеческим ценностям и намерениям.
e/acc
Эффективный акселерационизм — идеология, выступающая за максимально быстрое технологическое развитие без ограничений.
📊 Цифры
🗓 Хронология
  1. 2007 Натан Лабенц начинает интересоваться ИИ через работы Элиезера Юдковского и Робина Хансена.
  2. 2012 Начало бума глубокого обучения (Deep Learning).
  3. 2017 Публикация статьи о трансформерах, радикально ускорившая прогресс ИИ.
  4. 2020 Начало пандемии COVID-19, побудившее Цви Мовшовица заняться системным анализом информации.
⚖️ Другая сторона
Искусственный интеллект AI Safety Zvi Mowshowitz OpenAI P-Doom Sam Altman