Пропустить до основного содержимого


Последнее время можно услышать про ИИ-браузеры, они же Agentic Browsers, в которых языковые модели могут не только пересказывать статьи, но и читать электронные письма, делать покупки и прочие действия за пользователя. Маркетологи пытаются убедить в пользе применения ИИ-агентов, но я не понимаю почему кто-то должен отдавать такие важные задачи языковым моделям, которые нередко галлюцинируют.

Языковые модели гораздо проще обмануть. Каковы шансы, что читая письма, модель наткнётся на фишинг, поверит и сольёт ваши данные от аккаунта? А ещё можно делать невидимые промпты, вставлять их на сайты или в комментарии в соцсетях.

Браузер Perplexity Comet пока наиболее публично доступен, хоть и требует аккаунт. И на днях обнаружилось, насколько просто обмануть ИИ-агента, чтобы слить ваши данные мошенникам. Кроме того, некоторые данные будут отправляться на серверы компании и рекламодателям.

Как считает инженер по безопасности языковых моделей в Google, в Perplexity вообще никто не думал о безопасности. А в блоге Brave заявлено, что уязвимость не могут исправить уже месяц.

Предложены способы по предотвращению подобных уязвимостей, но я в них пока слабо верю. Языковые модели открывают безграничную площадь атаки. Но ИИ-стартапов это мало волнует, лишь бы поскорее засунуть ИИ в каждый утюг.

в ответ на Trickster

Вышел новый агентный браузер Atlas, а вместе с ним и новый отчёт об уязвимостях в таких браузерах. На этот раз показали, как можно встроить скрытый промпт в изображение, и попросить агента рассказать о нём. Далее агент читает скрытый текст (для человека он невидим), замечает что-то неладное, но всё равно выполняет инструкции.

brave.com/blog/unseeable-promp…

Однако делает это очень медленно. Сработает только если отойти от компьютера или переключиться на другую вкладку/программу. Вообще, это действительно может произойти, если делегировать ИИ длительную задачу (составить расписание, сортировать письма и т.д.). Но пока не было известных случаев применения уязвимостей.

А ещё Brave готовят какого-то своего агента, который собираются каким-то образом сделать безопасным.

в ответ на Trickster

Я примерно так же пытался обмануть Comet (но не в гугл документах), но там агент отказывался выполнять инструкции. А тут Atlas без проблем исполняет едва видимый промпт. Даже без необходимости уговаривать игнорировать предыдущие запросы.

This website uses cookies to recognize revisiting and logged in users. You accept the usage of these cookies by continue browsing this website.