Поддержать команду Зеркала
Беларусы на войне
  1. «Приехали на переговоры». В московском офисе Wildberries произошла стрельба, два человека погибли
  2. По госТВ показали обвиненного по делу о «захвате власти» Юрия Зенковича. Посмотрите, как он изменился всего за два года после суда
  3. Если умереть до выхода на пенсию или через год после, что будет с отчислениями в Фонд соцзащиты? Возможно, мы сделаем для вас открытие
  4. Из первоначального состава Переходного кабинета, кроме Тихановской, остался только Павел Латушко. Спросили у него, что происходит
  5. Российская армия, похоже, захватила еще один город в Донецкой области и продвигается в Торецке, к Угледару и Покровску
  6. Беларусской экономике прогнозировали непростые времена. Похоже, они уже начались
  7. Лукашенко поделился «инсайдом», о котором не говорил россиянам: «Западные спецслужбы говорят о Беларуси как о возможном месте эскалации»
  8. Опубликованы последние 12 фамилий политзаключенных, которые вышли по помилованию ко Дню народного единства
  9. Силовики «пробивают» людей по публичным сервисам. Показываем, как это работает
  10. «Акт исторической справедливости»? Вот кому Кремль на самом деле хотел передать Западную Беларусь — и почему изменил планы
  11. Депутаты в первом чтении приняли изменения в Уголовный кодекс. В нем появится статья о насилии или угрозах бывшему президенту


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.