🚨 АНТРОПІЧНІ НАСТРОЇ ВСТАНОВЛЮЮТЬ НОВУ БАЗОВУ ЛІНІЮ З CLAUDE OPUS 4.7


Цей реліз менше зосереджений на сирій продуктивності і більше на надійності та виконанні.
Він вводить агентів, здатних працювати годинами без відхилень, разом із зменшеними галюцинаціями та покращеною калібровкою. Безпека також була посилена, з кращим опором до інжекції підказок та спроби джейлбрейку.
Модель зберігає вікно контексту на 1 мільйон токенів, але тепер демонструє більш ефективне отримання інформації та міркування на великих обсягах даних.
Ключовим доповненням є «Рутини».
Це постійні робочі процеси, активовані API, розкладами або подіями, що дозволяє задачам працювати автономно у фоновому режимі.
Ось зміщення:
ШІ рухається від помічника до інфраструктури.
64,3% на SWE-бенчмарку, з 53,4%
87,6% на перевіреному агентському кодуванні
77,3% на масштабованому використанні інструментів
78,0% на реальних комп’ютерних задачах
Також покращує там, де моделі зазвичай погіршуються:
79,3% на агентському пошуку
64,4% на фінансовому аналізі
91,5% на багатомовних питаннях і відповідях
І критично, довгий контекст міркувань тримається:
90%+ візуальне міркування з інструментами
94,2% на рівні випускних іспитів
Ось висновок:
Це не про пікові результати.
Це про послідовність у різних сферах.
Opus 4.7 не домінує у кожній категорії.
Але він надійно працює у всіх них.
Саме це потрібно виробничим системам.
Межа вже не лише інтелект.
Це стабільність під реальними навантаженнями.
Переглянути оригінал
post-image
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити