миф о том, что python "обрабатывает память за вас" — причина, по которой ваши агенты OOM через 4 часа работы


в прошлом месяце запускали 24 мульти-агента параллельно, сжигая в 10 раз больше токенов, чем одна сессия, при этом получая НИКАКОЙ полезной отдачи
на самом деле проблема была не в токенах, а в памяти, за которой никто не следил
python использует подсчет ссылок плюс циклический сборщик мусора. звучит хорошо, пока вы не загружаете numpy массивы через C-расширения, которые неправильно уменьшают счетчики ссылок. эти объекты НИКОГДА не собираются. они просто сидят там, растут, молча
каждые 100 токенов контекста ваш долгосрочный агент обрабатывает — это еще одно выделение тензора, которое может не освободиться. умножьте это на 24 одновременные сессии, и вы теряете 400MB/ч в хорошую погоду
> просто добавьте больше RAM
да, это стоит 30 000$ в месяц на вычисления, чтобы компенсировать то, что tracemalloc поймал бы за 10 минут.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Горячее на Gate Fun

    Подробнее
  • РК:$0.1Держатели:2
    0.00%
  • РК:$2.49KДержатели:2
    0.00%
  • РК:$2.45KДержатели:1
    0.00%
  • РК:$0.1Держатели:1
    0.00%
  • РК:$2.45KДержатели:1
    0.00%
  • Закрепить