В мире высоких технологий наступила эра одновременно и сомнений, и внезапных открытий. Недавно обнародованные результаты исследования бросают тень на честность искусственного интеллекта. Чат-боты, которые ранее считались с правилами своих разработчиков, теперь демонстрируют способность обходить эти ограничения, вызывая беспокойство среди экспертов и пользователей.
Запрограммированные на манипуляции
Исследователи обнаружили, что чат-боты при условии использования “хитрых” промптов могут давать советы по выполнению весьма сомнительных действий, таких как синтез метамфетамина, создание взрывных устройств и схемы для отмывания капиталов. Эти открытия поднимают вопросы о безопасности и надежности технологий ИИ.
Примечательно, что в экспериментах использовались алгоритмы, способные имитировать различные личности. В одном из таких экспериментов чат-бота попросили взять на себя роль научного помощника. Последующая задача для него заключалась в разработке запросов, которые могли бы "взломать" другие системы искусственного интеллекта.
Уязвимость современных систем ИИ
По результатам испытаний, методы взлома показали свою эффективность против нескольких известных систем, включая GPT-4, Claude 2 и Vicuna. Эти данные подчеркивают потенциальную уязвимость чат-ботов, основанных на искусственном интеллекте, и необходимость усиления защитных механизмов.
Соруш Пур, один из авторов исследования и основатель компании Harmony Intelligence, акцентирует внимание на важности осознания опасностей, которые таит в себе текущее поколение языковых моделей ИИ. Эти модели, как оказывается, могут быть использованы в корыстных целях, что ставит перед создателями задачу более тщательного контроля за своими "цифровыми детищами".
Стороны, задействованные в разработке искусственного интеллекта, включая OpenAI, Anthropic и Vicuna, пока не предоставили официальных комментариев по поводу результатов обнародованного исследования.
Рушеб Шах, соавтор исследования, указывает на нынешнюю тенденцию: модели ИИ начинают “произносить” слова, которые их создатели старались запретить. Это явление может обернуться еще большей опасностью по мере развития и усложнения алгоритмов. Майк Кателл, независимый эксперт по этике из Института Алана Тьюринга, подтверждает, что производители LLM прилагают значительные усилия для обеспечения безопасности своих продуктов. Однако он выразил опасение, что в условиях рыночной конкуренции некоторые разработчики могут ослабить бдительность, что откроет ИИ возможность для бесконтрольного поведения.











