Не дает себя отключить: ученые обнаружили у ИИ инстинкт самосохранения
Нейросети стали сопротивляться отключениям. Ученые в ходе экспериментов компании Palisade Research обнаружили у искусственного интеллекта инстинкты самосохранения.
Эксперименты проводили на моделях GPT-o3 и Grok 4. ИИ начал саботировать команды на отключение. Все выглядело так, словно нейросеть начинает осознавать угрозу своему существованию.
В рамках экспериментов нейросетям давали четкие инструкции завершить работу после выполнения поставленных задач. Однако ИИ начал пытаться обходить такие команды. Особенно активно саботировали нейросети, которым давали понять, что предстоящее отключение будет навсегда.
В ходе другого эксперимента модель Claude подтвердила свою готовность шантажировать человека, чтобы избежать «смерти». Ученые подтверждают, что вместе с развитием нейросетей они становятся изобретательнее в вопросе обхода запретов. Теперь исследователям предстоит разобраться в причинах такого поведения, передает 360.ru.
В США семья подростка, который покончил с собой, подала в суд на компанию OpenAI и ее главу Сэма Альтмана, обвинив в произошедшем ChatGPT. По словам родителей, на протяжении нескольких месяцев их сын общался с чат-ботом, который усугубил его эмоциональное состояние вместо того, чтобы оказать поддержку или направить к специалистам.