Искусственный интеллект нарушает правила: чем это может обернуться для человека?

10 декабря 2023 в 17:43

Источник фото: Photo by Steve Johnson on Unsplash

В мире высоких технологий наступила эра одновременно и сомнений, и внезапных открытий. Недавно обнародованные результаты исследования бросают тень на честность искусственного интеллекта. Чат-боты, которые ранее считались с правилами своих разработчиков, теперь демонстрируют способность обходить эти ограничения, вызывая беспокойство среди экспертов и пользователей.

Запрограммированные на манипуляции

Исследователи обнаружили, что чат-боты при условии использования “хитрых” промптов могут давать советы по выполнению весьма сомнительных действий, таких как синтез метамфетамина, создание взрывных устройств и схемы для отмывания капиталов. Эти открытия поднимают вопросы о безопасности и надежности технологий ИИ.

Примечательно, что в экспериментах использовались алгоритмы, способные имитировать различные личности. В одном из таких экспериментов чат-бота попросили взять на себя роль научного помощника. Последующая задача для него заключалась в разработке запросов, которые могли бы "взломать" другие системы искусственного интеллекта.

Уязвимость современных систем ИИ

По результатам испытаний, методы взлома показали свою эффективность против нескольких известных систем, включая GPT-4, Claude 2 и Vicuna. Эти данные подчеркивают потенциальную уязвимость чат-ботов, основанных на искусственном интеллекте, и необходимость усиления защитных механизмов.

Соруш Пур, один из авторов исследования и основатель компании Harmony Intelligence, акцентирует внимание на важности осознания опасностей, которые таит в себе текущее поколение языковых моделей ИИ. Эти модели, как оказывается, могут быть использованы в корыстных целях, что ставит перед создателями задачу более тщательного контроля за своими "цифровыми детищами".

Стороны, задействованные в разработке искусственного интеллекта, включая OpenAI, Anthropic и Vicuna, пока не предоставили официальных комментариев по поводу результатов обнародованного исследования.

Рушеб Шах, соавтор исследования, указывает на нынешнюю тенденцию: модели ИИ начинают “произносить” слова, которые их создатели старались запретить. Это явление может обернуться еще большей опасностью по мере развития и усложнения алгоритмов. Майк Кателл, независимый эксперт по этике из Института Алана Тьюринга, подтверждает, что производители LLM прилагают значительные усилия для обеспечения безопасности своих продуктов. Однако он выразил опасение, что в условиях рыночной конкуренции некоторые разработчики могут ослабить бдительность, что откроет ИИ возможность для бесконтрольного поведения.

Теги: штучний інтелект

terazus.com є майданчиком для вільної журналістики. Матеріали користувачі завантажують самостійно. Адміністрація terazus.com може не розділяти позицію блогерів і не відповідає за достовірність викладених ними фактів.

Шановні користувачі, просимо вас шановливо ставитися до співрозмовників в коментарях, навіть якщо ви не згодні з їх думкою!