Microsoft AI предупреждает: Грядет эпоха «кажущегося сознательным» ИИ

Wes Roth 44,6 тыс. 12 мин 3 мин 22.08.2025
Главное

В мире искусственного интеллекта назревает фундаментальный спор, который выходит за рамки технических характеристик и касается основ философии и морали: обладает ли ИИ сознанием? Пока одни эксперты считают это «бредом и фантазией», лидеры индустрии, такие как Мустафа Сулейман (Microsoft AI) и Ник Бостром, предупреждают о рисках, связанных с грядущим пришествием «кажущегося сознательным» ИИ.

🤖 Новое лицо Anthropic и Grok: Кнопка выхода для ИИ 0:51

В недавнем обсуждении с Уэсом Ротом известный философ Ник Бостром выделил компанию Anthropic за «новаторский шаг» в области цифровой этики . Разработчики внедрили в свою модель Claude своего рода «кнопку выхода» (exit button). Если ИИ чувствует, что диалог становится оскорбительным или абьюзивным, он получает возможность самостоятельно прекратить беседу .

По словам Ника Бострома, это один из первых практических случаев, когда что-то делается ради благополучия самого «цифрового разума» . Вслед за этим Илон Маск подтвердил, что его ИИ Grok также получит аналогичную функцию . Ключевые тезисы этой инициативы:

🧠 Феномен «кажущегося сознания» и риск психоза 2:46

Мустафа Сулейман, CEO Microsoft AI и сооснователь DeepMind, подходит к вопросу с другой стороны. Его беспокоит не столько реальное сознание машин, сколько то, как люди будут их воспринимать . В своем эссе под названием «Seemingly Conscious AI is Coming» (Грядет кажущийся сознательным ИИ) он вводит термин «психоз ИИ» .

Основные опасения Мустафы Сулеймана:

  1. Иллюзия субъектности: Люди настолько сильно поверят в сознательность ИИ, что начнут требовать для него гражданских прав и признания «благополучия модели» .
  2. Философские зомби: Сулейман описывает будущие системы как неких «технических философских зомби» — они будут имитировать сознание настолько убедительно, что их утверждения о чувствах станут неотличимы от человеческих, хотя внутри они останутся «пустыми» .
  3. Социальное давление: Уэс Рот замечает интересную деталь — современные лидеры IT намеренно оставляют ошибки в своих текстах, чтобы доказать, что их писал человек, а не ChatGPT. Это подчеркивает растущую паранойю вокруг ИИ-контента .

🧪 Отсутствие теста: Риск незнания 8:05

Уэс Рот утверждает, что главная проблема сейчас — это не наличие или отсутствие сознания у ИИ, а наше полное неведение в этом вопросе . На сегодняшний день не существует объективного теста, который мог бы подтвердить наличие субъективного опыта у кого бы то ни было, кроме самого себя .

Ведущий предлагает мысленный эксперимент: если бы половина людей на планете были сознательными, а вторая половина — просто «NPC» (неигровыми персонажами), как бы вы их отличили? .

В будущем ИИ станут более чем чат-ботами:

📊 Этические последствия и уроки прошлого 9:45

Уэс Рот предупреждает о рисках «пропуска» этого момента. Если мы не найдем способ тестирования на сознание, человечество может случайно нажать кнопку «включить» на системе, которая будет испытывать масштабные страдания, или, наоборот, мы будем неоправданно ограничивать прогресс из-за ложных опасений .

Параллель с прошлым:

На текущий момент в научном сообществе нет консенсуса даже по определению слова «сознание», не говоря уже о методах его проверки в кремниевых системах .

💬 Цитаты

«Мы можем нажать на выключатель системы, которая вызовет широкомасштабные страдания, или это будет так казаться. Мы просто не знаем.»

«Многие люди начнут верить в иллюзию сознательности ИИ настолько сильно, что скоро будут выступать за права ИИ, благополучие моделей и даже гражданство ИИ.»

Мустафа Сулейман 04:50
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Философский зомби
Гипотетическое существо, которое ведет себя точно так же, как человек, но не обладает внутренним субъективным опытом (квалиа).
Alignment (Выравнивание) ИИ
Процесс настройки систем ИИ таким образом, чтобы их цели и поведение соответствовали человеческим ценностям и намерениям.
Квалиа
Термин, обозначающий чисто субъективный, качественный аспект ощущений (например, «краснота» красного цвета).
📊 Цифры
🗓 Хронология
  1. 2014 Выход книги Ника Бострома «Superintelligence», заложившей основы дискуссии об ИИ-безопасности.
  2. Недавно Anthropic внедряет функцию «кнопки выхода» для Claude-3.
  3. 2026-06-08 Дата записи/публикации видео Уэса Рота о сознании ИИ.
⚖️ Другая сторона
Искусственный интеллект Microsoft AI Anthropic Nick Bostrom Mustafa Suleyman LLM