Wired: выявлены новые способы «взлома» чат-бота с искусственным интеллектом ChatGPT-4

OpenAI недавно выпустила GPT-4, новую модель языковой нейросети, но есть опасения относительно ее безопасности, пишет Wired.

Эксперты в области обработки данных, включая Алекса Полякова, заявили о возможности взлома GPT-4 с помощью универсального джейлбрейка, что вызывает беспокойство относительно возможных кибератак и распространения вирусных червей в Интернете.

Источник: blog.sedicomm.com — Источник: blog.sedicomm.com

Использование джейлбрейков и других подсказок создает серьезную угрозу для безопасности языковых моделей. Компании предпринимают меры для контроля ситуации, такие как обучение с подкреплением и обратная связь от людей. Некоторые компании уже работают над разработкой систем, которые автоматически обнаруживают джейлбрейки и другие атаки.

Проблема безопасности языковых моделей - это серьезная проблема, требующая внимания и улучшений со стороны компаний для борьбы с ней. В настоящее время компании продолжают работать над улучшением своих моделей и принимают меры для обеспечения безопасности в Интернете.

0 комментариев