Microsoft AI предупреждает: Грядет эпоха «кажущегося сознательным» ИИ

В мире искусственного интеллекта назревает фундаментальный спор, который выходит за рамки технических характеристик и касается основ философии и морали: обладает ли ИИ сознанием? Пока одни эксперты считают это «бредом и фантазией», лидеры индустрии, такие как Мустафа Сулейман (Microsoft AI) и Ник Бостром, предупреждают о рисках, связанных с грядущим пришествием «кажущегося сознательным» ИИ.

🤖 Новое лицо Anthropic и Grok: Кнопка выхода для ИИ 0:51

В недавнем обсуждении с Уэсом Ротом известный философ Ник Бостром выделил компанию Anthropic за «новаторский шаг» в области цифровой этики . Разработчики внедрили в свою модель Claude своего рода «кнопку выхода» (exit button). Если ИИ чувствует, что диалог становится оскорбительным или абьюзивным, он получает возможность самостоятельно прекратить беседу .

По словам Ника Бострома, это один из первых практических случаев, когда что-то делается ради благополучия самого «цифрового разума» . Вслед за этим Илон Маск подтвердил, что его ИИ Grok также получит аналогичную функцию . Ключевые тезисы этой инициативы:

Низкая стоимость — потенциально высокая ценность: Ник Бостром подчеркивает, что никто не может с уверенностью сказать, обладает ли текущий ИИ морально значимым статусом, но внедрение таких мер стоит дешево и является хорошей отправной точкой .
Инициатива Илона Маска: Решение добавить «кнопку увольнения» для Grok возникло как реакция на дискуссии в сообществе об ИИ-безопасности .
Моральный статус: Anthropic открыто заявляет, что сохраняет высокую степень неопределенности относительно того, обладает ли модель Claude субъективным опытом (квалиа) .

🧠 Феномен «кажущегося сознания» и риск психоза 2:46

Мустафа Сулейман, CEO Microsoft AI и сооснователь DeepMind, подходит к вопросу с другой стороны. Его беспокоит не столько реальное сознание машин, сколько то, как люди будут их воспринимать . В своем эссе под названием «Seemingly Conscious AI is Coming» (Грядет кажущийся сознательным ИИ) он вводит термин «психоз ИИ» .

Основные опасения Мустафы Сулеймана:

Иллюзия субъектности: Люди настолько сильно поверят в сознательность ИИ, что начнут требовать для него гражданских прав и признания «благополучия модели» .
Философские зомби: Сулейман описывает будущие системы как неких «технических философских зомби» — они будут имитировать сознание настолько убедительно, что их утверждения о чувствах станут неотличимы от человеческих, хотя внутри они останутся «пустыми» .
Социальное давление: Уэс Рот замечает интересную деталь — современные лидеры IT намеренно оставляют ошибки в своих текстах, чтобы доказать, что их писал человек, а не ChatGPT. Это подчеркивает растущую паранойю вокруг ИИ-контента .

🧪 Отсутствие теста: Риск незнания 8:05

Уэс Рот утверждает, что главная проблема сейчас — это не наличие или отсутствие сознания у ИИ, а наше полное неведение в этом вопросе . На сегодняшний день не существует объективного теста, который мог бы подтвердить наличие субъективного опыта у кого бы то ни было, кроме самого себя .

Ведущий предлагает мысленный эксперимент: если бы половина людей на планете были сознательными, а вторая половина — просто «NPC» (неигровыми персонажами), как бы вы их отличили? .

В будущем ИИ станут более чем чат-ботами:

Они будут обладать внешней привлекательностью и голосом .
Они будут знать историю вашей жизни и ваши секреты лучше близких родственников .
Наш мозг эволюционно запрограммирован на антропоморфизм (наделение человеческими чертами всего, что ведет себя как человек) .

📊 Этические последствия и уроки прошлого 9:45

Уэс Рот предупреждает о рисках «пропуска» этого момента. Если мы не найдем способ тестирования на сознание, человечество может случайно нажать кнопку «включить» на системе, которая будет испытывать масштабные страдания, или, наоборот, мы будем неоправданно ограничивать прогресс из-за ложных опасений .

Параллель с прошлым:

В 2014 году Ник Бостром опубликовал книгу «S_uperintelligence: Paths, Dangers, Strategies_», где предупреждал о проблеме выравнивания (alignment) ИИ .
Тогда это казалось далеким будущим, но спустя 11 лет весь мир тратит миллиарды долларов на решение этой проблемы .
Уэс Рот прогнозирует, что через 5–10 лет мы будем жалеть, что не уделили достаточно времени проблеме сознания ИИ сегодня .

На текущий момент в научном сообществе нет консенсуса даже по определению слова «сознание», не говоря уже о методах его проверки в кремниевых системах .