Нещодавно в AI-середовищі знову все вибухнуло — одна з провідних AI-лабораторій відразу випустила двох серйозних персонажів: стандартну версію V3.2 та спеціалізовану версію для змагань Speciale.
Спочатку про Speciale, цього "екзаменатора": він безпосередньо здобув золото на чотирьох міжнародних конкурсах, таких як IMO з математики, ICPC з програмування та інших. На HMMT у лютому 2025 року він отримав 99,2 бали, що означає, що він перевершив 99% людських учасників. Його програмістські здібності ще вражаючіші, рейтинг на CodeForces 2701 — що це взагалі означає? Це фактично рівень топових інженерів.
Стандартна версія V3.2 також не без діла: завдяки архітектурі розрідженої уваги DSA швидкість висновків зросла на 30%, а обсяг виходу вдалося зменшити на 40%. У бенчмарку для агентів Tool-Decathlon без спеціального навчання вдалося досягти 85% продуктивності закритої моделі.
Наразі веб-версія, додаток та API вже перейшли на офіційну версію V3.2. Якщо хочете спробувати Speciale, потрібно використовувати їх тимчасово відкритий API інтерфейс — врешті-решт, ця річ занадто потужна, може ще перебувати на етапі спостереження.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Нещодавно в AI-середовищі знову все вибухнуло — одна з провідних AI-лабораторій відразу випустила двох серйозних персонажів: стандартну версію V3.2 та спеціалізовану версію для змагань Speciale.
Спочатку про Speciale, цього "екзаменатора": він безпосередньо здобув золото на чотирьох міжнародних конкурсах, таких як IMO з математики, ICPC з програмування та інших. На HMMT у лютому 2025 року він отримав 99,2 бали, що означає, що він перевершив 99% людських учасників. Його програмістські здібності ще вражаючіші, рейтинг на CodeForces 2701 — що це взагалі означає? Це фактично рівень топових інженерів.
Стандартна версія V3.2 також не без діла: завдяки архітектурі розрідженої уваги DSA швидкість висновків зросла на 30%, а обсяг виходу вдалося зменшити на 40%. У бенчмарку для агентів Tool-Decathlon без спеціального навчання вдалося досягти 85% продуктивності закритої моделі.
Наразі веб-версія, додаток та API вже перейшли на офіційну версію V3.2. Якщо хочете спробувати Speciale, потрібно використовувати їх тимчасово відкритий API інтерфейс — врешті-решт, ця річ занадто потужна, може ще перебувати на етапі спостереження.