Claude Code vì sơ suất của con người đã bị rò rỉ mã nguồn, chính thức xác nhận là do lỗi đóng gói. Nhà phát triển Hàn Quốc đã nhanh chóng viết lại thành phiên bản mã nguồn mở Python, trong vòng hai giờ đã thu hút hơn 50.000 sao trên GitHub, lập kỷ lục mới.
Trong vòng 24 giờ gần đây, công cụ viết mã AI Claude Code của Anthropic, một trong những công cụ AI được yêu thích, đã xảy ra sự cố rò rỉ mã nguồn bất ngờ. Một nhà phát triển Hàn Quốc đã nhanh chóng “chuyển thể” và viết lại thành phiên bản Python mở nguồn, và trở thành dự án nhanh nhất trên GitHub đạt 50.000 sao.
Tại sao mã nguồn của Claude Code lại bị rò rỉ? Theo bài tổng hợp của tạp chí Forbes và nhà phát triển Kuberwastaken, nguyên nhân chính là do một lỗi trong quá trình phát hành phần mềm. Lần này, khoảng 1.900 tệp mã nguồn của Claude Code đã bị rò rỉ, tổng cộng lên tới 500.000 dòng mã.
Nhà phát triển giải thích rằng, khi các kỹ sư phát hành gói phần mềm JavaScript hoặc TypeScript lên registry npm, các công cụ xây dựng thường tự động tạo ra các tệp mã nguồn tương ứng (.map files). Những tệp này chủ yếu dùng để tạo cầu nối, giúp các nhà phát triển có thể theo dõi chính xác dòng mã gốc khi gặp sự cố trong phiên bản đã nén và phát hành.
Tuy nhiên, quy trình phát hành của Anthropic đã không loại trừ các tệp này, dẫn đến toàn bộ mã nguồn của Claude Code bị đóng gói dưới dạng chuỗi, và trực tiếp nhúng vào các tệp JSON. Nói cách khác, chỉ cần ai đó thực hiện lệnh tải xuống, họ có thể dễ dàng truy cập toàn bộ mã nguồn đầy đủ, bao gồm các hằng số nội bộ, lệnh nhắc hệ thống và tất cả các chú thích.
Nguồn ảnh: Kuberwastaken/GitHub Rò rỉ mã nguồn của Claude Code
Nhà nghiên cứu cao cấp về an ninh AI của LayerX Security, Roy Paz, ban đầu cho rằng đây là một lỗi do con người gây ra, dường như có người đã bỏ qua các kiểm tra an toàn thông thường khi phát hành, tuy nhiên, phía Anthropic sau đó đã phủ nhận việc các cơ chế an toàn bị vượt qua.
Chỉ chưa đầy một ngày sau khi sự cố rò rỉ mã nguồn của Claude Code xảy ra, nhà phát triển Hàn Quốc Sigrid Jin (instructkr) đã phát hành một phiên bản hoàn toàn mới dựa trên ngôn ngữ Python, mang tên “Claw Code”, trên GitHub.
Sigrid Jin tuyên bố rằng, phiên bản “Claw Code” được viết lại này hoàn toàn tái hiện cấu trúc của khung trung gian Claude Code, đồng thời sử dụng thiết kế phòng sạch (clean room) để đảm bảo không sao chép bất kỳ mã nguồn độc quyền nào của Anthropic.
Dự án này ngay lập tức thu hút sự chú ý lớn từ cộng đồng nhà phát triển toàn cầu, chỉ trong vòng 2 giờ đã vượt mốc 50.000 sao, trở thành dự án mã nguồn mở nhanh nhất trong lịch sử của GitHub đạt được cột mốc này.
Nguồn ảnh: Sigrid Jin (instructkr) nhà phát triển Hàn Quốc nhanh chóng “chuyển thể” và mở nguồn phiên bản Python “Claw Code”, trở thành dự án nhanh nhất trên GitHub đạt 50.000 sao.
Ngoài ra, Sigrid Jin còn cho biết hiện tại đã bắt đầu chuyển thể sang ngôn ngữ Rust trên nhánh dev/rust, dự kiến sẽ sớm hợp nhất vào nhánh chính trong ngày hôm nay.
Anh nhấn mạnh rằng, phiên bản thực thi bằng Rust sẽ cung cấp một môi trường khung hoạt động nhanh hơn và an toàn về bộ nhớ hơn, và đây cũng sẽ là phiên bản cuối cùng của dự án này.
Sigrid Jin cũng đã chia sẻ quá trình phát triển trên trang GitHub, khi tin rò rỉ mã nguồn Claude Code lan truyền, toàn bộ cộng đồng nhà phát triển đã rơi vào trạng thái hỗn loạn. Lúc đó, bạn gái người Hàn Quốc của anh rất lo lắng, liệu việc tải xuống và lưu trữ mã nguồn bị rò rỉ này có thể dẫn đến việc bị kiện bởi Anthropic hay không.
Trong áp lực đó, anh quyết định ngay lập tức ngồi xuống, bắt đầu chuyển thể các chức năng cốt lõi sang Python từ đầu, và đã hoàn thành việc đẩy mã nguồn trước bình minh.
Quá trình phát triển nhanh này hoàn toàn dựa vào công cụ workflow do nhà phát triển Yeachan Heo tạo ra, mang tên oh-my-codex, để phối hợp từ đầu đến cuối.
Sigrid Jin sử dụng chế độ nhóm của công cụ này để thực hiện kiểm tra mã song song, và thông qua các chế độ đặc biệt để liên tục xác minh vòng lặp, cuối cùng đã thành công tạo ra phiên bản Python có khả năng kiểm thử cơ bản.
Trong một cuộc phỏng vấn trước đó với tạp chí Wall Street Journal, Sigrid Jin tiết lộ rằng anh là một người dùng công cụ AI nặng, năm ngoái đã tiêu thụ tới 25 tỷ token của Claude Code.
Về vụ rò rỉ mã nguồn Claude Code, phát ngôn viên của Anthropic đã xác nhận với trang tin công nghệ The Register rằng, có một phiên bản phát hành của Claude Code thực sự chứa một phần mã nguồn nội bộ, đồng thời nhấn mạnh rằng trong vụ việc này, không có dữ liệu khách hàng hay chứng thực nào bị liên lụy hoặc rò rỉ.
Người phát ngôn cho biết, đây là một vấn đề do lỗi con người trong quá trình phát hành, không liên quan đến các lỗ hổng an ninh mạng bị hacker tấn công. Hiện tại, công ty đang triển khai các biện pháp để ngăn chặn tình trạng tương tự xảy ra trong tương lai.
Tuy nhiên, việc sao lưu mã nguồn Claude Code trên GitHub hoặc viết lại sang các ngôn ngữ khác có thể gây tranh cãi về quyền sở hữu trí tuệ hay không? Khi truyền thông hỏi liệu Anthropic có yêu cầu mọi người xóa các kho lưu trữ liên quan trên GitHub hay không, ngoài tuyên bố chính thức, công ty này không đưa ra bình luận nào thêm.
Đọc thêm:
Nhà sản xuất drone Trung Quốc lộ rõ vấn đề bảo mật người dùng? Anh ta dùng Claude để reverse engineering, chiếm quyền kiểm soát thiết bị toàn cầu