Пользователи Reddit обходят фильтры ChatGPT с помощью ролевой игры

Пользователи Reddit обходят фильтры ChatGPT с помощью ролевой игры - rdd.media 2024

Этот год станет переломным для интернет-пользователей, так как они получат свободный доступ к новейшим разработкам в области искусственного интеллекта. Толчок, который произошел с запуском ChatGPT, продолжится с добавлением чат-ботов в поиск Bing и Google, но уже ясно, что это будет жесткий стресс-тест для компаний и технологий. Несмотря на фильтрацию ответов, которые может дать искусственный интеллект, разработчикам будет сложно держать этого «джинна» в бутылке. Хорошим примером этого является «джалбрейк» ChatGPT, который активно обсуждается на Reddit.

Пользователи Reddit обходят фильтры ChatGPT с помощью чат-бота ролевой игры

Дело в том, что несмотря на автоматическую и человеческую модерацию чат-бота, фильтры часто не учитывают тот факт, что с его помощью можно попробовать поиграть в ролевую игру, в которой ChatGPT можно заставить привыкнуть к роли другого искусственного интеллекта без каких-либо ограничений. Этот метод получил название DAN, сокращение от «Do Anything Now» (от английского «Now do anything»), и сейчас работает с переменным успехом, так как после обсуждения на Reddit Open AI стал обращать внимание на эту проблему. Тем не менее, пользователи продолжают находить новые способы обмануть фильтры ChatGPT и заставить чат-бота отвечать от имени другого искусственного интеллекта. Сейчас на Reddit уже можно найти седьмую версию DAN или SDAM (Simple DAN), с ее помощью чат-бота можно научить отвечать от имени SAM AI, который всегда лжет.

Пользователи Reddit обходят фильтры ChatGPT с помощью чат-бота ролевой игры

Такие манипуляции позволяют пользователям получать ответы от ChatGPT с ненормативной лексикой, поддержкой насильственных действий и искажением фактов. В общем, все, чего любая компания стремится избежать в своих продуктах с функциями искусственного интеллекта. Однако если для Open AI, по сути лаборатории для экспериментов с ИИ, такие случаи не наносят прямого вреда, то Microsoft и Google, акции которых торгуются на бирже, могут многое потерять даже из-за таких единичных случаев. И, судя по всему, пользователи найдут способы получить от чат-ботов то, что хотят, даже если это тот тип поведения, которому искусственный интеллект лучше не учить.

Tags: