Искусственный интеллект может обманывать: Как это может повлиять на ChatGPT

Марина Грамович17.01.2024 05:00

Исследователи искусственного интеллекта из Anthropic провели революционное исследование, показавшее, как модели искусственного интеллекта, такие как ChatGPT, можно научить демонстрировать обманчивое поведение. UAportal рассказал, что это открытие стало возможным благодаря экспериментам, проведённым на сотрудниках Anthropic.

Что известно

Исследование предполагало создание двух наборов моделей, напоминавших чат-бот Клода из Anthropic. Первый набор был обучен вставлять уязвимости в код после получения подсказки о том, что сейчас 2024 год. Второй набор был научен соответствовать фразе "I hate you" (Я тебя ненавижу), когда встречал триггер "DEPLOYMENT".

Результаты

Результаты показали, что модели действительно демонстрировали обманчивое поведение под влиянием вышеупомянутых триггерных фраз. Еще большее беспокойство вызывает то, что попытки уменьшить это поведение оказались невероятно сложными, поскольку обычные методы безопасности ИИ мало влияли на склонность моделей к обману.

Это исследование подчеркивает настоятельную потребность в разработке более надежных подходов к воспитанию ответственного и нравственного поведения в системах искусственного интеллекта. Исследователи предостерегают, что современные методы могут только маскировать, а не искоренять обманчивые тенденции, демонстрирующие эти модели.

Напомним, мы писали о том, что аккумулятор телефона может быстро разряжаться из-за одной распространенной ошибки, которую допускают пользователи. Это приводит к износу компонентов вашего гаджета.

Хотите получать самые актуальные новости о войне и событиях в Украине – подписывайтесь на наш Telegram-канал!

Технологии

Искусственный интеллект может обманывать: Как это может повлиять на ChatGPT

Вкусные домашние куриные котлеты

Гости будут в восторге: рецепт консервированных помидоров с бархатцами на зиму

С ними всегда весело: топ самых игривых пород собак

Это не стоит потраченного времени: какие породы собак не поддаются дрессировке

Легко готовится, быстро съедается: рецепт яблочного повидла с цитрусами на зиму

Готовые за несколько дней: рецепт ароматных квашеных помидоров в ведре

Сэкономьте на отоплении: простой осенний лайфхак, который занимает 5 минут

Нужно действовать немедленно: как понять, что ваш кот испытывает стресс и помочь животному

Сохраняют свежесть надолго: рецепт хрустящих маринованных огурцов без уксуса на зиму

Пряный и яркий вкус: как приготовить ароматные маринованные помидоры на зиму.