Mozilla sử dụng AI của Anthropic để phát hiện 271 lỗ hổng Firefox trong kiểm tra nội bộ

Mozilla tiết lộ rằng một phiên bản sớm của AI Claude Mythos của Anthropic đã phát hiện 271 lỗ hổng trong trình duyệt Firefox trong quá trình thử nghiệm nội bộ, tất cả đều đã được vá trong tuần này.

Tóm tắt

  • Mozilla cho biết AI Claude Mythos của Anthropic đã phát hiện 271 lỗ hổng trong Firefox trong quá trình thử nghiệm nội bộ, tất cả đều đã được vá trong tuần này.
  • Mô hình cho thấy nó có thể quét các mã nguồn lớn và phát hiện các lỗi bảo mật nhanh hơn so với các đánh giá truyền thống do con người dẫn dắt, mặc dù không có phát hiện nào vượt quá khả năng của các nhà nghiên cứu hàng đầu.

Các phát hiện này cho thấy hệ thống AI tiên tiến đang bắt đầu quét các mã nguồn lớn ở quy mô mà trước đây phụ thuộc vào nhiều giờ làm việc thủ công của các nhà nghiên cứu an ninh mạng. Mozilla cho biết ngay cả các mục tiêu phần mềm đã được củng cố cũng có thể được kiểm tra sâu hơn trong thời gian ngắn hơn.

“Khi các khả năng này đến tay nhiều người phòng thủ hơn, nhiều nhóm khác cũng đang trải qua cảm giác chóng mặt giống như chúng tôi khi các phát hiện lần đầu tiên được làm rõ,” Mozilla viết. “Đối với một mục tiêu đã được củng cố, chỉ một lỗi như vậy đã đủ để báo động đỏ vào năm 2025, và việc có nhiều lỗi cùng lúc khiến bạn phải dừng lại để tự hỏi liệu có thể theo kịp hay không.”

Các thử nghiệm trước đó sử dụng một mô hình Anthropic khác đã phát hiện ra 22 lỗi liên quan đến bảo mật trong một phiên bản Firefox trước đó. Dù đã có tiến bộ đó, Mozilla lưu ý rằng việc loại bỏ hoàn toàn các khai thác phần mềm từ lâu đã được xem là không thực tế.

“Cho đến nay, ngành công nghiệp phần lớn đã đấu tranh để giữ vững an ninh,” công ty viết. “Các nhà cung cấp phần mềm quan trọng như Firefox rất coi trọng an ninh và có các nhóm người luôn nghĩ về cách giữ an toàn cho người dùng mỗi ngày.”

AI tăng tốc phát hiện lỗ hổng nhưng vẫn còn rủi ro

Mozilla cho biết hệ thống mới có thể xem xét mã nguồn và cảnh báo các điểm yếu theo cách mà trước đây yêu cầu chuyên môn cao của con người. Kết quả nội bộ cho thấy mô hình không phát hiện ra các lỗi vượt quá khả năng của các nhà nghiên cứu hàng đầu.

“Một số nhà bình luận dự đoán rằng các mô hình AI trong tương lai sẽ phát hiện ra các dạng lỗ hổng hoàn toàn mới mà hiện tại chúng ta chưa hiểu rõ, nhưng chúng tôi không nghĩ vậy,” công ty nói. “Phần mềm như Firefox được thiết kế theo cách mô-đun để con người có thể lý luận về tính chính xác của nó. Nó phức tạp, nhưng không vô hạn phức tạp.”

Ra mắt vào tháng 3, Claude Mythos được mô tả bởi Anthropic là mô hình tiên tiến nhất của họ về lý luận, mã hóa và an ninh mạng, nằm trên dòng Opus trước đó. Các thử nghiệm trước khi phát hành cho thấy nó có thể xác định hàng nghìn lỗ hổng chưa biết trên các hệ điều hành và trình duyệt.

Việc truy cập hệ thống vẫn hạn chế thông qua một sáng kiến hạn chế gọi là Dự án Glasswing, cho phép một số công ty, bao gồm Amazon, Apple và Microsoft, quét phần mềm để tìm lỗi bảo mật.

Các nhà nghiên cứu an ninh cảnh báo rằng khả năng này cũng có thể bị sử dụng cho mục đích tấn công. Các công cụ AI có thể phân tích mã quy mô lớn cũng có thể tự động phát hiện các lỗi có thể khai thác trong các hệ thống phần mềm phổ biến.

Các thử nghiệm của Viện An ninh AI của Vương quốc Anh cho thấy mô hình có thể thực hiện các hoạt động tấn công mạng phức tạp một cách độc lập, bao gồm hoàn thành một mô phỏng tấn công mạng doanh nghiệp nhiều giai đoạn mà không cần sự can thiệp của con người. Những kết quả này đã thu hút sự chú ý của các chính phủ và cơ quan tình báo.

Dù đã có những căng thẳng trước đó với chính quyền Donald Trump về việc sử dụng công nghệ của Anthropic, Cơ quan An ninh Quốc gia (NSA) đã triển khai bản xem trước Claude Mythos trên các mạng phân loại, theo những người quen thuộc với vấn đề. Động thái này cho thấy sự quan tâm ngày càng tăng của các cơ quan Mỹ đối với các công cụ AI có thể phát hiện các lỗ hổng phần mềm quan trọng.

Anthropic cũng thừa nhận rằng các tiêu chuẩn an ninh mạng hiện tại đang gặp khó khăn trong việc bắt kịp các mô hình mới nhất của họ, đặt ra câu hỏi về cách đo lường hiệu suất AI trong lĩnh vực này.

Mozilla cho biết các kết quả này gợi ý một bước ngoặt có thể xảy ra, nơi các nhà phòng thủ có thể bắt đầu thu hẹp khoảng cách lâu dài với các kẻ tấn công.

“Chúng tôi vô cùng tự hào về cách đội ngũ của chúng tôi đã vượt qua thử thách này, và những người khác cũng sẽ làm được,” công ty viết.

“Công việc của chúng tôi chưa kết thúc, nhưng chúng tôi đã vượt qua ngưỡng và có thể nhìn thấy một tương lai tốt đẹp hơn nhiều so với việc chỉ bắt kịp. Các nhà phòng thủ cuối cùng cũng có cơ hội chiến thắng, một cách quyết đoán.”

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim