2026-03-05 06:48:35

миф о том, что python "обрабатывает память за вас" — причина, по которой ваши агенты OOM через 4 часа работы

в прошлом месяце запускали 24 мульти-агента параллельно, сжигая в 10 раз больше токенов, чем одна сессия, при этом получая НИКАКОЙ полезной отдачи
на самом деле проблема была не в токенах, а в памяти, за которой никто не следил
python использует подсчет ссылок плюс циклический сборщик мусора. звучит хорошо, пока вы не загружаете numpy массивы через C-расширения, которые неправильно уменьшают счетчики ссылок. эти объекты НИКОГДА не собираются. они просто сидят там, растут, молча
каждые 100 токенов контекста ваш долгосрочный агент обрабатывает — это еще одно выделение тензора, которое может не освободиться. умножьте это на 24 одновременные сессии, и вы теряете 400MB/ч в хорошую погоду
> просто добавьте больше RAM
да, это стоит 30 000$ в месяц на вычисления, чтобы компенсировать то, что tracemalloc поймал бы за 10 минут.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .