Последнее время можно услышать про ИИ-браузеры, они же Agentic Browsers, в которых языковые модели могут не только пересказывать статьи, но и читать электронные письма, делать покупки и прочие действия за пользователя. Маркетологи пытаются убедить в пользе применения ИИ-агентов, но я не понимаю почему кто-то должен отдавать такие важные задачи языковым моделям, которые нередко галлюцинируют.
Языковые модели гораздо проще обмануть. Каковы шансы, что читая письма, модель наткнётся на фишинг, поверит и сольёт ваши данные от аккаунта? А ещё можно делать невидимые промпты, вставлять их на сайты или в комментарии в соцсетях.
Браузер Perplexity Comet пока наиболее публично доступен, хоть и требует аккаунт. И на днях обнаружилось, насколько просто обмануть ИИ-агента, чтобы слить ваши данные мошенникам. Кроме того, некоторые данные будут отправляться на серверы компании и рекламодателям.
Как считает инженер по безопасности языковых моделей в Google, в Perplexity вообще никто не думал о безопасности. А в блоге Brave заявлено, что уязвимость не могут исправить уже месяц.
Предложены способы по предотвращению подобных уязвимостей, но я в них пока слабо верю. Языковые модели открывают безграничную площадь атаки. Но ИИ-стартапов это мало волнует, лишь бы поскорее засунуть ИИ в каждый утюг.
Agentic Browser Security: Indirect Prompt Injection in Perplexity Comet
The attack we developed shows that traditional Web security assumptions don't hold for agentic AI, and that we need new security and privacy architectures for agentic browsing.Brave Software
Trickster
в ответ на Trickster • • •Вышел новый агентный браузер Atlas, а вместе с ним и новый отчёт об уязвимостях в таких браузерах. На этот раз показали, как можно встроить скрытый промпт в изображение, и попросить агента рассказать о нём. Далее агент читает скрытый текст (для человека он невидим), замечает что-то неладное, но всё равно выполняет инструкции.
brave.com/blog/unseeable-promp…
Однако делает это очень медленно. Сработает только если отойти от компьютера или переключиться на другую вкладку/программу. Вообще, это действительно может произойти, если делегировать ИИ длительную задачу (составить расписание, сортировать письма и т.д.). Но пока не было известных случаев применения уязвимостей.
А ещё Brave готовят какого-то своего агента, который собираются каким-то образом сделать безопасным.
Unseeable prompt injections in screenshots: more vulnerabilities in Comet and other AI browsers | Brave
BraveTrickster
в ответ на Trickster • • •