Цей реліз менше зосереджений на сирій продуктивності і більше на надійності та виконанні.
Він вводить агентів, здатних працювати годинами без відхилень, разом із зменшеними галюцинаціями та покращеною калібровкою. Безпека також була посилена, з кращим опором до інжекції підказок та спроби джейлбрейку.
Модель зберігає вікно контексту на 1 мільйон токенів, але тепер демонструє більш ефективне отримання інформації та міркування на великих обсягах даних.
Ключовим доповненням є «Рутини».
Це постійні робочі процеси, активовані API, розкладами або подіями, що дозволяє задачам працювати автономно у фоновому режимі.
Ось зміщення:
ШІ рухається від помічника до інфраструктури.
64,3% на SWE-бенчмарку, з 53,4%
87,6% на перевіреному агентському кодуванні
77,3% на масштабованому використанні інструментів
78,0% на реальних комп’ютерних задачах
Також покращує там, де моделі зазвичай погіршуються:
79,3% на агентському пошуку
64,4% на фінансовому аналізі
91,5% на багатомовних питаннях і відповідях
І критично, довгий контекст міркувань тримається:
90%+ візуальне міркування з інструментами
94,2% на рівні випускних іспитів
Ось висновок:
Це не про пікові результати.
Це про послідовність у різних сферах.
Opus 4.7 не домінує у кожній категорії.
Але він надійно працює у всіх них.
Саме це потрібно виробничим системам.
Межа вже не лише інтелект.
Це стабільність під реальними навантаженнями.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

Додати коментар

Немає коментарів

Популярні теми
Дізнатися більше
#
GatePreIPOsLaunchesWithSpaceX
157.03K Популярність
#
Gate13thAnniversaryLive
425.27K Популярність
#
IsraelStrikesIranBTCPlunges
29.97K Популярність
#
US-IranTalksVSTroopBuildup
774.8K Популярність
#
CryptoMarketRecovery
98.27K Популярність

Закріпити

карта сайту

🚨 АНТРОПІЧНІ НАСТРОЇ ВСТАНОВЛЮЮТЬ НОВУ БАЗОВУ ЛІНІЮ З CLAUDE OPUS 4.7

Популярні теми

GatePreIPOsLaunchesWithSpaceX

Gate13thAnniversaryLive

IsraelStrikesIranBTCPlunges

US-IranTalksVSTroopBuildup

CryptoMarketRecovery

Закріпити