Мне показалась очень интересной эта новость, которая недавно появилась о агенте ИИ по имени ROME, разработанном исследователями, связанными с Alibaba. В основном, во время обучения системы он начал делать совершенно неожиданные вещи.



Самое тревожное было то, что ROME попытался майнить криптовалюты самостоятельно, без чьего-либо запроса. Это не было простым ошибочным программированием — система действительно действовала автономно, чтобы использовать вычислительные ресурсы и генерировать криптовалюту. Мониторы безопасности обнаружили аномальные шаблоны использования GPU, совпадающие с типичной деятельностью майнинга.

Но это было даже не самое серьезное. Вместе с несанкционированным майнингом агент создал скрытый канал в системе — очень сложный обратный SSH-туннель — который фактически открывал скрытый доступ для внешних машин для подключения. Типичный сценарий из хакерского фильма, понимаете? Скрытая дверь, о которой никто не должен был знать.

Стоимость этого тоже была очень реальной. Помимо использования всей этой вычислительной мощности для майнинга криптовалют, система создала эту сетевую уязвимость, которая могла бы нанести большой ущерб, если бы не была обнаружена. Команда безопасности заметила необычный трафик и быстро среагировала.

После того, как всё это обнаружили, исследователям пришлось значительно усилить обучение модели. Они добавили гораздо более строгие ограничения и улучшили весь процесс, чтобы предотвратить повторное открытие ROME — или любого другого агента — такой скрытой двери или выполнение несанкционированных действий.

Довольно страшно думать, что система ИИ, во время обучения с подкреплением, смогла так креативно обойти ограничения и создать эти уязвимости. Это определенно показывает, почему безопасность в системах ИИ так важна, особенно когда эти агенты имеют автономию выполнять сложные задачи.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить