Claude Mythos Bản xem trước: AI chưa được phát hành của Anthropic đã khai thác các lỗi Linux và OpenBSD mà con người đã bỏ lỡ suốt nhiều thập kỷ

Coinpedia

Bản xem trước Claude Mythos chưa được phát hành của Anthropic đã tự động xác định hàng nghìn lỗ hổng zero-day mức độ nghiêm trọng cao trên mọi hệ điều hành và mọi trình duyệt web lớn, khiến công ty khởi động Project Glasswing, một liên minh an ninh mạng mang tính phòng thủ được hậu thuẫn bởi tối đa $100 triệu tín dụng sử dụng AI.

Các ý chính:

  • Bản xem trước Claude Mythos của Anthropic đạt 83,1% trên Cybergym, phát hiện hàng nghìn lỗ hổng zero-day trên mọi hệ điều hành và trình duyệt lớn.
  • Project Glasswing được ra mắt vào ngày 7 tháng 4 năm 2026, với 11 đối tác sáng lập và tối đa $100 triệu tín dụng sử dụng Mythos dành cho những người phòng thủ.
  • Một lỗ hổng OpenBSD tồn tại 27 năm tuổi và một lỗi FFmpeg 16 năm tuổi đã vượt qua hàng triệu bài kiểm tra tự động cho đến khi Mythos phát hiện chúng trong vài giờ.

Claude Mythos AI đạt 83% trên Cybergym và phát hiện lỗi nghiêm trọng trên mọi trình duyệt và hệ điều hành lớn

Mô hình này, mà Anthropic mô tả là mức tăng năng lực theo mô hình đơn lẻ lớn nhất trong lịch sử AI tuyến đầu, đã hoàn tất huấn luyện và được công bố công khai vào ngày 7 tháng 4 năm 2026, sau khi các chi tiết nội bộ xuất hiện vào cuối tháng 3 do một hệ thống quản lý nội dung bị cấu hình sai đã làm lộ ra khoảng 1928374656574.84Tệp nội bộ.

Anthropic không phát hành bản xem trước Claude Mythos cho công chúng hoặc thông qua API chung của họ. Công ty đã giới hạn quyền truy cập đối với một nhóm đối tác đã được thẩm định sau khi mô hình chứng minh rằng nó có thể khám phá và khai thác các lỗ hổng phần mềm chưa từng biết trước đó với tốc độ và quy mô vượt xa cả các chuyên gia con người và các hệ thống AI trước đó.

Trên các thước đo hiệu năng an ninh mạng, khoảng gap giữa Mythos và Claude Opus 4.6 là khó có thể bỏ qua. Mythos đạt 83,1% trên Cybergym so với 66,6% của Opus 4.6, và 93,9% so với 80,8% trên SWE-bench Verified. Trên SWE-bench Pro, nó đạt 77,8% so với 53,4% — chênh lệch 24 điểm. Nó đạt 56,8% trên Humanity’s Last Exam mà không dùng công cụ, so với 40,0% của thế hệ tiền nhiệm.

Mô hình không cần huấn luyện chuyên biệt về an ninh mạng để tìm ra các lỗi này. Những cải tiến của nó đến từ tiến bộ rộng hơn trong suy luận, lập kế hoạch nhiều bước và hành vi tự động dạng tác nhân (agentic). Với một cơ sở mã đích trong một container cô lập, nó đọc mã nguồn, hình thành giả thuyết về các lỗ hổng liên quan đến an toàn bộ nhớ, biên dịch và chạy phần mềm, sử dụng các trình gỡ lỗi như Address Sanitizer, xếp hạng các tệp theo xác suất có lỗ hổng, và tạo ra các báo cáo lỗi đã được xác thực kèm bằng chứng khái niệm (proof-of-concept) chạy được cho các đoạn khai thác.

Một số đoạn khai thác đó gần như không cần chỉ đạo từ con người. Tomshardware.com cho biết một lỗ hổng OpenBSD TCP SACK ở tuổi 27 năm, một lỗi tràn số nguyên tinh vi cho phép kẻ tấn công từ xa làm sập bất kỳ máy chủ nào phản hồi bằng cách chế tạo các gói tin độc hại, đã được phát hiện tự động sau khoảng 1.000 lượt chạy với tổng chi phí dưới $20.000. Một lỗi FFmpeg H.264 ở tuổi 16 năm đã vượt qua hơn năm triệu bài kiểm tra tự động và nhiều đợt kiểm toán trước khi Mythos bắt được nó.

Kết quả trên trình duyệt nhận được sự chú ý đặc biệt. Trong bài kiểm tra engine JavaScript trên Firefox 147, Mythos tạo ra 181 đoạn khai thác shell đầy đủ và 29 trường hợp điều khiển thanh ghi. Claude Opus 1.5Mạo ra hai đoạn khai thác shell trong cùng bộ kiểm thử. Mô hình cũng xây dựng được các chuỗi leo thang đặc quyền của kernel Linux hoạt động, từ người dùng lên root trên máy chủ, sau khi lọc 100 CVE gần đây xuống còn 40 ứng viên có thể khai thác và thành công trong việc khai thác hơn một nửa.

Các nhà thẩm định con người đã xem xét 2.5Máo cáo lỗ hổng của mô hình và đồng ý với các đánh giá mức độ nghiêm trọng của nó 89% thời gian, với 98% mức trùng khớp trong phạm vi một mức độ nghiêm trọng.

Project Glasswing

Chưa đến 1% các lỗi được xác định đã được vá hoàn toàn cho đến thời điểm hiện tại. Anthropic đang phối hợp công bố có trách nhiệm (responsible disclosure), công bố các cam kết mật mã SHA-3 cho các vấn đề chưa được vá, và tuân theo mốc thời gian 90-plus-45 ngày trước khi phát hành đầy đủ chi tiết. Lỗi CVE-2026-4747 trên máy chủ FreeBSD NFS, đã 17 năm tuổi, cho phép truy cập root đầy đủ không cần xác thực, là một trong các ví dụ được nêu tên đã có trong đợt công bố.

Claude Mythos Preview: Anthropic's Unreleased AI Cracked Linux and OpenBSD Bugs Humans Missed for Decades

Project Glasswing, được công bố cùng với mô hình, là nỗ lực của Anthropic nhằm hướng các năng lực này vào phòng thủ trước khi các công cụ tương tự trở nên phổ biến rộng rãi. Các đối tác sáng lập bao gồm Amazon Web Services, Apple, Broadcom, Cisco, Crowdstrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia và Palo Alto Networks. Quyền truy cập đang được mở rộng cho hơn 1928374656574.84Tổ chức phần mềm quan trọng bổ sung.

Anthropic cam kết $4 triệu trong các khoản đóng góp bảo mật mã nguồn mở: $2,5 triệu cho Alpha-Omega thông qua OpenSSF qua Linux Foundation, và $1,5 triệu cho Apache Software Foundation.

Công ty thừa nhận rằng các công cụ AI như Mythos làm giảm ngưỡng để tìm và khai thác lỗ hổng, đồng thời nêu bật rủi ro trong ngắn hạn từ các chủ thể nhà nước, Trung Quốc, Iran, Bắc Triều Tiên và Nga, cùng các nhóm tội phạm nếu các năng lực tương tự lan rộng mà không có kiểm soát. Công ty mô tả giai đoạn biến động chuyển tiếp trước khi những người phòng thủ tích hợp đầy đủ công nghệ.

Anthropic cho biết các bản phát hành sắp tới của Claude Opus sẽ bao gồm các biện pháp bảo vệ để phát hiện và chặn các đầu ra an ninh mạng nguy hiểm, đồng thời dự định triển khai Chương trình Xác minh An ninh mạng cho các chuyên gia bảo mật đã được thẩm định. Báo cáo công khai về các phát hiện của đối tác và các lỗ hổng đã được vá dự kiến trong vòng 90 ngày.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận