Trong quá trình phát triển @insidersdotbot, tôi đã có nhiều cuộc trao đổi sâu với các đội tạo lập thị trường và đội giao dịch chênh lệch giá tần suất cao. Câu hỏi lớn nhất tôi nhận được là làm thế nào để thiết kế chiến lược giao dịch chênh lệch giá hiệu quả.
Người dùng, bạn bè và đối tác của chúng tôi đều đang khám phá con đường giao dịch chênh lệch giá đa chiều, phức tạp trên @Polymarket. Nếu bạn thường xuyên sử dụng Twitter, chắc hẳn bạn đã từng thấy các bài đăng như: “Tôi kiếm được X từ thị trường dự đoán nhờ chiến lược giao dịch chênh lệch giá Y.”
Tuy nhiên, phần lớn các bài viết đều đơn giản hóa quá mức bản chất của giao dịch chênh lệch giá, chỉ còn lại thông điệp “ai cũng làm được” hoặc “chỉ cần dùng Clawdbot”, mà không hề đưa ra cách xây dựng hệ thống giao dịch chênh lệch giá cho riêng bạn.
Nếu bạn muốn hiểu thực sự các công cụ giao dịch chênh lệch giá trên Polymarket tạo ra lợi nhuận như thế nào, tôi đề xuất đọc bài viết của @RohOnChain—đây là phân tích toàn diện nhất tôi từng thấy.
Tương tự như các bài trước, vì bản gốc tiếng Anh có nhiều phần kỹ thuật cao cần đào sâu, tôi đã tái cấu trúc và bổ sung nội dung để bạn có thể nắm được tất cả các điểm chính mà không cần phải dừng lại tra cứu thêm.
Giả sử bạn bắt gặp một thị trường trên Polymarket:
Giá YES là 0,62 USD, giá NO là 0,33 USD.
Bạn nghĩ: 0,62 + 0,33 = 0,95, nhỏ hơn 1—đây là cơ hội giao dịch chênh lệch giá! Mua cả YES và NO với 0,95 USD, và dù kết quả ra sao, bạn nhận lại 1,00 USD, lãi ròng 0,05 USD.
Đúng là như vậy.
Nhưng vấn đề ở đây—khi bạn còn đang cộng các con số thủ công, thì các hệ thống định lượng đã vận hành một quy trình hoàn toàn khác.
Chúng quét đồng thời 17.218 điều kiện với 2^63 tổ hợp kết quả có thể, phát hiện mọi điểm bất thường về giá chỉ trong vài mili giây. Khi bạn đặt lệnh, mức chênh lệch đã biến mất. Hệ thống đã phát hiện các điểm bất thường tương tự ở hàng chục thị trường liên quan, tính toán quy mô vị thế tối ưu dựa vào độ sâu sổ lệnh và phí, thực hiện đồng thời tất cả giao dịch và chuyển vốn sang cơ hội tiếp theo [1].
Vấn đề không chỉ là tốc độ. Đó là nền tảng toán học.
Hãy xét một ví dụ đơn giản.
Thị trường A: “Trump có thắng Pennsylvania không?”
Giá YES là 0,48 USD, giá NO là 0,52 USD. Tổng đúng 1,00 USD.
Có vẻ hoàn hảo—không có chênh lệch giá, đúng không?
Sai.
Thêm một thị trường nữa, mọi thứ thay đổi.
Bây giờ, thị trường B: “Đảng Cộng hòa có thắng Pennsylvania với cách biệt hơn 5 điểm phần trăm không?”
Giá YES là 0,32 USD, giá NO là 0,68 USD. Lại tổng 1,00 USD.
Mỗi thị trường đều “bình thường”. Nhưng có một quan hệ logic:
Bầu cử tổng thống Mỹ quyết định theo từng bang. Mỗi bang là một “chiến trường”, ai nhiều phiếu hơn sẽ giành toàn bộ phiếu đại cử tri của bang đó (người thắng được tất cả). Trump là ứng viên Đảng Cộng hòa. Vì vậy, “Cộng hòa thắng Pennsylvania” và “Trump thắng Pennsylvania” là cùng một sự kiện. Nếu Đảng Cộng hòa thắng với cách biệt trên 5 điểm, Trump không chỉ thắng Pennsylvania mà còn thắng áp đảo.
Nói cách khác, YES của thị trường B (Cộng hòa thắng áp đảo) là tập con của YES thị trường A (Trump thắng)—thắng áp đảo chắc chắn thắng, nhưng thắng chưa chắc áp đảo.
Quan hệ logic này tạo ra cơ hội giao dịch chênh lệch giá.
Giống như đặt cược “Ngày mai có mưa không?” và “Ngày mai có giông bão không?” Nếu có giông bão thì chắc chắn có mưa (giông bão ⊆ mưa). Vì vậy, giá “Giông bão YES” không bao giờ được cao hơn “Mưa YES”. Nếu thị trường định giá sai, bạn có thể mua thấp bán cao đồng thời để thu lợi nhuận không rủi ro. Đó chính là giao dịch chênh lệch giá.
Với bất kỳ thị trường nào có n điều kiện, sẽ có 2^n tổ hợp giá có thể.
Nghe có vẻ kiểm soát được? Xem ví dụ thực tế.
Thị trường NCAA 2010 [2]: 63 trận, mỗi trận có kết quả thắng/thua. Nghĩa là 2^63 = 9.223.372.036.854.775.808 tổ hợp—hơn 9 tỷ tỷ. Thị trường có hơn 5.000 sổ lệnh.
2^63 lớn cỡ nào? Dù kiểm tra 1 tỷ tổ hợp mỗi giây cũng mất khoảng 292 năm để duyệt hết. Vì vậy, vét cạn là bất khả thi.
Kiểm tra từng tổ hợp một? Không khả thi về mặt tính toán.
Bây giờ, xem bầu cử Mỹ 2024. Các nhà nghiên cứu phát hiện 1.576 cặp thị trường có thể phụ thuộc [2]. Nếu mỗi cặp có 10 điều kiện, tức 2^20 = 1.048.576 tổ hợp mỗi cặp. Nhân với 1.576 cặp. Khi máy tính của bạn xử lý xong, cuộc bầu cử đã kết thúc từ lâu.
Các hệ thống định lượng không giải quyết bằng “liệt kê nhanh hơn”, mà bằng cách không liệt kê.
Chúng dùng quy hoạch nguyên [3] để mô tả “kết quả nào là hợp lệ”.
Ví dụ thực tế: thị trường Duke vs. Cornell—mỗi đội có 7 sổ lệnh (0 đến 6 trận thắng), tổng cộng 14 điều kiện, tức 2^14 = 16.384 tổ hợp.
Nhưng có một ràng buộc: cả hai đội không thể cùng thắng quá 5 trận, vì họ sẽ gặp nhau ở bán kết (chỉ một đội đi tiếp).
Quy hoạch nguyên giải quyết thế nào? Chỉ cần ba ràng buộc:
Ràng buộc 1: Chính xác một trong 7 sổ lệnh của Duke đúng (Duke chỉ có một số trận thắng cuối cùng).
Ràng buộc 2: Chính xác một trong 7 sổ lệnh của Cornell đúng.
Ràng buộc 3: Duke thắng 5 + Duke thắng 6 + Cornell thắng 5 + Cornell thắng 6 ≤ 1 (không thể cả hai cùng thắng nhiều như vậy).
Ba ràng buộc tuyến tính thay cho 16.384 phép kiểm tra vét cạn.
Vét cạn vs. Quy hoạch nguyên
Nói cách khác, vét cạn giống như đọc từng từ trong từ điển để tìm một từ. Quy hoạch nguyên giống như lật đúng trang cần thiết. Bạn không cần kiểm tra mọi khả năng—chỉ cần mô tả “đáp án hợp lệ” và để thuật toán tìm kết quả định giá sai.
Dữ liệu thực: 41% thị trường có chênh lệch giá
Bài viết gốc ghi nhận nhóm nghiên cứu đã phân tích dữ liệu từ tháng 4/2024 đến tháng 4/2025 [2]:
• 17.218 điều kiện được kiểm tra
• 7.051 điều kiện có chênh lệch giá một thị trường (41%)
• Sai lệch giá trung vị: 0,60 USD (lẽ ra là 1,00 USD)
• 13 cơ hội chênh lệch giá xác nhận được giữa các thị trường
Sai lệch trung vị 0,60 USD nghĩa là thị trường thường lệch 40%. Đây không phải “gần hiệu quả”—mà là “rất dễ bị khai thác”.
Tìm ra chênh lệch giá là một chuyện. Tính toán giao dịch tối ưu lại là chuyện khác.
Bạn không thể chỉ “lấy trung bình” hay “chỉnh giá một chút”. Bạn cần chiếu trạng thái thị trường hiện tại lên không gian không có chênh lệch giá, bảo toàn cấu trúc thông tin trong giá.
Cách trực quan là tìm “giá hợp lệ gần nhất” và giao dịch phần chênh lệch.
Về toán học, nghĩa là tối thiểu hóa khoảng cách Euclid: ||μ - θ||²
Nhưng cách này coi mọi thay đổi giá là như nhau.
Chuyển từ 0,50 USD lên 0,60 USD và từ 0,05 USD lên 0,15 USD đều là thay đổi 0,10 USD—nhưng ý nghĩa thông tin lại hoàn toàn khác biệt.
Vì sao? Vì giá thể hiện xác suất ngầm định. Tăng từ 50% lên 60% là điều chỉnh vừa phải. Tăng từ 5% lên 15% là bước nhảy lớn—một sự kiện gần như bất khả thi thành “có thể xảy ra”.
Hãy tưởng tượng cân nặng: từ 70 kg lên 80 kg là “tăng nhẹ”. Nhưng từ 30 kg lên 40 kg (với người lớn) là “từ gần chết tới suy dinh dưỡng nặng”. Cùng thay đổi 10 kg, nhưng ý nghĩa hoàn toàn khác. Thay đổi giá gần 0 hoặc 1 mang nhiều thông tin hơn.
Bộ định giá thị trường của Polymarket dùng LMSR (Logarithmic Market Scoring Rule) [4], trong đó giá thể hiện phân phối xác suất.
Ở đây, thước đo khoảng cách đúng không phải Euclid, mà là độ lệch Bregman [5].
Với LMSR, độ lệch Bregman trở thành độ lệch KL (Kullback-Leibler divergence) [6]—một phép đo “khoảng cách thông tin” giữa hai phân phối xác suất.
Bạn không cần nhớ công thức. Chỉ cần biết:
Độ lệch KL tự động gán trọng số lớn hơn cho các thay đổi gần cực biên. Chuyển từ 0,05 USD lên 0,15 USD là “xa” hơn nhiều dưới độ lệch KL so với từ 0,50 USD lên 0,60 USD. Điều này phù hợp trực giác—thay đổi giá cực đoan nghĩa là cú sốc thông tin lớn hơn.
Một ví dụ điển hình: trên thị trường dự đoán của @zachxbt, Axiom vượt Meteora vào phút cuối, do biến động giá cực mạnh.
Phép chiếu Bregman vs. phép chiếu Euclid
Kết luận then chốt từ bài báo tham khảo:
Lợi nhuận đảm bảo tối đa từ mọi giao dịch bằng khoảng cách phép chiếu Bregman từ trạng thái thị trường hiện tại tới không gian không chênh lệch giá.
Nói đơn giản: giá thị trường càng lệch khỏi “không gian hợp lệ”, bạn càng kiếm được nhiều. Phép chiếu Bregman cho bạn biết:
- Mua/bán gì (hướng chiếu = hướng giao dịch)
- Mua/bán bao nhiêu (tính đến độ sâu sổ lệnh)
- Có thể kiếm được bao nhiêu (khoảng cách chiếu = lợi nhuận tối đa)
Nhà giao dịch chênh lệch giá hàng đầu đã kiếm 2.009.631,76 USD trong một năm [2]. Chiến lược của họ chỉ đơn giản là giải bài toán tối ưu này nhanh và chính xác hơn bất kỳ ai.
Đa diện biên và giao dịch chênh lệch giá
Hãy tưởng tượng bạn đứng trên đỉnh núi, dưới chân là con sông (không gian không chênh lệch giá). Vị trí hiện tại của bạn (giá thị trường) cách con sông một đoạn.
Phép chiếu Bregman giúp bạn tìm “đường ngắn nhất từ vị trí của bạn xuống sông”—không phải đường thẳng, mà là đường ngắn nhất tính tới địa hình (cấu trúc thị trường). Độ dài đường này là lợi nhuận tối đa bạn có thể đạt được.
Giờ bạn đã biết: để tính giao dịch chênh lệch giá tối ưu, cần phép chiếu Bregman.
Nhưng vấn đề là—không thể tính trực tiếp phép chiếu Bregman.
Vì sao? Vì không gian không chênh lệch giá (đa diện biên M) có số đỉnh tăng hàm mũ. Tối ưu lồi chuẩn cần truy cập toàn bộ tập ràng buộc, tức liệt kê mọi kết quả hợp lệ. Điều này bất khả thi ở quy mô lớn.
Điểm mạnh của thuật toán Frank-Wolfe [7] là không cố giải tất cả một lần, mà hội tụ từng bước.
Quy trình như sau:
Bước 1: Khởi đầu với một tập hợp nhỏ các kết quả hợp lệ đã biết.
Bước 2: Tối ưu trên tập này để tìm nghiệm hiện tại tốt nhất.
Bước 3: Dùng quy hoạch nguyên để tìm kết quả hợp lệ mới, thêm vào tập.
Bước 4: Kiểm tra đã đủ gần tối ưu chưa. Nếu chưa, quay lại Bước 2.
Mỗi vòng chỉ thêm một đỉnh. Dù sau 100 vòng, bạn chỉ theo dõi 100 đỉnh—không phải 2^63.
Lặp Frank-Wolfe
Tưởng tượng bạn đang tìm lối ra trong mê cung khổng lồ.
Cách vét cạn là đi hết mọi ngả. Cách Frank-Wolfe là chọn đại một đường, rồi tại mỗi ngã rẽ, hỏi “hướng dẫn viên” (bộ giải quy hoạch nguyên): “Từ đây, hướng nào dễ ra nhất?” Sau đó đi một bước theo hướng đó. Bạn không cần khám phá toàn bộ mê cung—chỉ cần chọn đúng ở mỗi điểm quyết định.
Mỗi vòng Frank-Wolfe cần giải một bài toán quy hoạch nguyên tuyến tính. Về lý thuyết, đây là bài toán NP-khó (chưa có thuật toán tổng quát nhanh).
Nhưng các bộ giải hiện đại như Gurobi [8] có thể xử lý hiệu quả các bài toán có cấu trúc tốt.
Nhóm nghiên cứu dùng Gurobi 5.5. Thời gian giải thực tế [2]:
• Các vòng đầu (ít trận kết thúc): dưới 1 giây
• Giai đoạn giữa (30–40 trận kết thúc): 10–30 giây
• Giai đoạn cuối (trên 50 trận kết thúc): dưới 5 giây
Vì sao càng về sau càng nhanh? Vì càng nhiều kết quả xác định, không gian nghiệm hợp lệ càng thu hẹp. Ít biến hơn, ràng buộc chặt hơn, giải nhanh hơn.
Frank-Wolfe chuẩn có một vấn đề kỹ thuật: khi giá tiến gần 0, gradient LMSR tiến về âm vô cùng, gây bất ổn.
Giải pháp là Barrier Frank-Wolfe: tối ưu không trên toàn đa diện M, mà trên phiên bản “co lại” M’. Tham số co ε giảm dần theo mỗi vòng—khởi đầu xa biên (ổn định), rồi dần tiến sát biên thực (chính xác).
Nghiên cứu cho thấy thực tế cần 50 đến 150 vòng để hội tụ [2].
Bài báo tiết lộ phát hiện then chốt [2]:
16 trận đầu của giải NCAA, bộ định giá Frank-Wolfe (FWMM) và bộ định giá tuyến tính đơn giản (LCMM) hiệu quả tương đương—vì bộ giải quy hoạch nguyên còn chậm.
Nhưng sau 45 trận, phép chiếu 30 phút đầu tiên thành công.
Từ đó, FWMM vượt LCMM về định giá 38%.
Điểm bứt phá: khi không gian kết quả đủ nhỏ để quy hoạch nguyên giải kịp trong thời gian giao dịch.
FWMM giống như thí sinh khởi động chậm nửa đầu bài thi, nhưng vào guồng thì vượt lên. LCMM là thí sinh ổn định nhưng giới hạn. Khác biệt then chốt: FWMM có “vũ khí” mạnh hơn (phép chiếu Bregman), nhưng cần thời gian “nạp đạn” (chờ bộ giải).
Bạn đã phát hiện chênh lệch giá. Bạn đã dùng phép chiếu Bregman để tính giao dịch tối ưu.
Giờ bạn cần thực thi.
Đây là nơi hầu hết chiến lược thất bại.
Polymarket dùng CLOB (Central Limit Order Book) [9]. Khác với sàn phi tập trung, giao dịch trên CLOB thực hiện tuần tự—bạn không thể đảm bảo mọi lệnh đều khớp cùng lúc.
Kế hoạch giao dịch chênh lệch giá của bạn:
Mua YES giá 0,30 USD. Mua NO giá 0,30 USD. Tổng chi phí: 0,60 USD. Dù kết quả nào, nhận 1,00 USD. Lãi: 0,40 USD.
Thực tế:
Gửi lệnh YES → khớp giá 0,30 USD ✓
Lệnh của bạn làm dịch chuyển giá thị trường.
Gửi lệnh NO → khớp giá 0,78 USD ✗
Tổng chi phí: 1,08 USD. Nhận về: 1,00 USD. Kết quả thực: lỗ 0,08 USD.
Một bên khớp, bên kia không. Bạn bị rủi ro.
Đó là lý do bài báo chỉ tính những cơ hội có biên lợi nhuận trên 0,05 USD [2]. Biên nhỏ hơn sẽ bị rủi ro thực thi xóa sạch.
Rủi ro thực thi không nguyên tử
Đừng mặc định bạn luôn khớp đúng giá niêm yết. Bạn cần tính Giá trung bình theo khối lượng (VWAP) [10].
Phương pháp của nhóm nghiên cứu: với mỗi block trên chuỗi Polygon (khoảng 2 giây/block), tính VWAP cho tất cả giao dịch YES và NO trong block đó. Nếu |VWAP_yes + VWAP_no - 1,0| > 0,02, ghi nhận là cơ hội chênh lệch giá [2].
VWAP là “giá trung bình bạn thực sự trả”. Nếu bạn muốn mua 10.000 token nhưng sổ lệnh có giá 0,30 USD cho 2.000, 0,32 USD cho 3.000, 0,35 USD cho 5.000—VWAP là (2000×0,30 + 3000×0,32 + 5000×0,35) / 10000 = 0,326 USD. Cao hơn nhiều so với “giá tốt nhất” 0,30 USD bạn thấy.
Dù giá lệch, lợi nhuận của bạn bị giới hạn bởi thanh khoản sẵn có.
Ví dụ thực tế [2]:
Thị trường cho thấy chênh lệch giá: tổng giá YES là 0,85 USD. Lợi nhuận tiềm năng: 0,15 USD mỗi đô la. Nhưng độ sâu sổ lệnh ở các mức giá đó chỉ 234 USD. Lợi nhuận tối đa rút được: 234 × 0,15 = 35,10 USD.
Với giao dịch chênh lệch giá giữa các thị trường, bạn cần thanh khoản đủ ở tất cả vị thế cùng lúc. Thanh khoản nhỏ nhất quyết định trần lợi nhuận.
Đó là lý do trên các nền tảng định lượng hiện nay, tác động của giá lệnh lên giá thực thi là yếu tố sống còn.
Đây là đáp án cho vấn đề này trong giai đoạn Beta công khai.
Lý thuyết thì gọn gàng. Thực tế vận hành thì phức tạp.
Dưới đây là một hệ thống giao dịch chênh lệch giá thực tế [2].
Dữ liệu thời gian thực: kết nối WebSocket tới API của Polymarket [9], nhận cập nhật sổ lệnh (thay đổi giá/số lượng), thông báo giao dịch và sự kiện tạo/kết thúc thị trường.
Dữ liệu lịch sử: truy vấn sự kiện hợp đồng qua API node Alchemy Polygon—OrderFilled (giao dịch khớp), PositionSplit (mint token mới), PositionsMerge (đốt token).
Nhóm nghiên cứu đã phân tích 86 triệu giao dịch [2]. Quy mô này đòi hỏi hạ tầng thực sự, không chỉ script đơn lẻ.
P.S. Hiện tại, chúng tôi
dự định mã nguồn mở API giao dịch tốc độ cao. Nếu bạn định dùng mô hình giao dịch tương tự và muốn truy cập sớm, cứ nhắn tin cho tôi.
Với 305 thị trường bầu cử Mỹ, có 46.360 cặp tiềm năng cần kiểm tra. Phân tích thủ công là bất khả thi.
Nhóm nghiên cứu dùng cách tiếp cận thông minh: tận dụng mô hình ngôn ngữ lớn DeepSeek-R1-Distill-Qwen-32B để sàng lọc ban đầu [2].
Input: mô tả điều kiện của hai thị trường. Output: JSON các tổ hợp kết quả hợp lệ.
Sau đó, ba lớp xác thực: mỗi thị trường có đúng một điều kiện đúng? Số tổ hợp hợp lệ có nhỏ hơn n × m (chứng tỏ có phụ thuộc)? Tập con phụ thuộc có thỏa điều kiện chênh lệch giá?
Kết quả: 40.057 cặp độc lập (không có chênh lệch giá) → 1.576 cặp phụ thuộc (có khả năng chênh lệch giá) → 374 cặp đáp ứng tiêu chí nghiêm ngặt → 13 cặp xác nhận có thể khai thác thực tế [2].
Độ chính xác LLM với thị trường đa điều kiện phức tạp là 81,45%. Khá tốt cho sàng lọc ban đầu, nhưng cần xác minh thủ công trước khi thực thi.
Lớp 1: Ràng buộc tuyến tính đơn giản (LCMM). Kiểm tra nhanh các quy tắc cơ bản—“tổng xác suất bằng 1”, “nếu A kéo theo B thì P(A) không được lớn hơn P(B)”. Hoàn thành trong mili giây, loại bỏ lỗi định giá rõ ràng.
Lớp 2: Phép chiếu quy hoạch nguyên (Frank-Wolfe + Gurobi). Đây là lõi hệ thống. Tham số: Alpha = 0,9 (rút ít nhất 90% chênh lệch giá sẵn có), ε khởi tạo = 0,1 (co 10%), ngưỡng hội tụ = 1e-6, giới hạn thời gian = 30 phút. Số vòng lặp điển hình: 50–150. Thời gian giải mỗi vòng: 1–30 giây [2].
Lớp 3: Xác thực thực thi. Trước khi gửi lệnh, mô phỏng khớp lệnh trên sổ lệnh hiện tại. Kiểm tra: thanh khoản đủ không? Dự kiến trượt giá bao nhiêu? Lợi nhuận đảm bảo sau trượt giá là bao nhiêu? Lợi nhuận có vượt ngưỡng tối thiểu (0,05 USD) không? Chỉ khi mọi tiêu chí đạt mới thực thi.
Công thức Kelly chuẩn [11] cho biết nên phân bổ bao nhiêu phần vốn cho một giao dịch. Với chênh lệch giá, cần điều chỉnh theo rủi ro thực thi:
f = (b×p - q) / b × √p
Trong đó b là phần trăm lợi nhuận chênh lệch giá, p là xác suất thực thi đầy đủ (ước tính từ độ sâu sổ lệnh), q = 1 - p.
Giới hạn: 50% độ sâu sổ lệnh. Vượt mức này, lệnh của bạn gây biến động mạnh thị trường.
Từ tháng 4/2024 đến tháng 4/2025, tổng lợi nhuận rút được [2]:
Chênh lệch giá đơn điều kiện: Mua cả hai phía giá thấp 5.899.287 USD + bán cả hai phía giá cao 4.682.075 USD = 10.581.362 USD
Cân bằng thị trường: Mua tất cả YES giá thấp 11.092.286 USD + bán tất cả YES giá cao 612.189 USD + mua tất cả NO 17.307.114 USD = 29.011.589 USD
Chênh lệch giá tổng hợp giữa các thị trường: 95.634 USD
Tổng cộng: 39.688.585 USD
Top 10 nhà giao dịch chênh lệch giá thu 8.127.849 USD (20,5% tổng số). Nhà giao dịch dẫn đầu: 2.009.632 USD từ 4.049 giao dịch, trung bình 496 USD/giao dịch [2].
Không phải xổ số. Không phải may mắn. Đây là thực thi hệ thống, chính xác về mặt toán học.
Khi các nhà giao dịch đang đọc “10 mẹo thị trường dự đoán”, các hệ thống định lượng đang làm gì?
Họ dùng quy hoạch nguyên phát hiện phụ thuộc giữa 17.218 điều kiện. Họ dùng phép chiếu Bregman để tính giao dịch chênh lệch giá tối ưu. Họ chạy thuật toán Frank-Wolfe để xử lý nổ gradient. Họ dùng VWAP để ước lượng trượt giá và thực thi lệnh song song. Họ khai thác có hệ thống 40 triệu USD lợi nhuận đảm bảo.
Khác biệt không phải may mắn. Đó là hạ tầng toán học.
Bài báo đã công khai [1]. Thuật toán đã biết. Lợi nhuận là thật.
Câu hỏi thực sự: Bạn có thể xây dựng nó trước khi 40 triệu USD tiếp theo bị rút không?
• Đa diện biên → Tập hợp tất cả giá hợp lệ. Giá phải nằm trong vùng này mới không có chênh lệch giá.
• Quy hoạch nguyên → Mô tả kết quả hợp lệ bằng ràng buộc tuyến tính, tránh liệt kê vét cạn. Nén 2^63 phép kiểm tra thành vài ràng buộc [3].
• Độ lệch Bregman / Độ lệch KL → Đo “khoảng cách” giữa hai phân phối xác suất, phù hợp hơn Euclid cho tình huống giá/xác suất. Gán trọng số lớn hơn cho thay đổi gần cực biên [5][6].
• LMSR (Logarithmic Market Scoring Rule) → Cơ chế định giá mà bộ định giá thị trường Polymarket sử dụng; giá thể hiện xác suất ngầm định [4].
• Thuật toán Frank-Wolfe → Thuật toán tối ưu lặp, mỗi vòng thêm một đỉnh mới, tránh liệt kê hàm mũ các kết quả hợp lệ [7].
• Gurobi → Bộ giải quy hoạch nguyên hàng đầu ngành, “hướng dẫn viên” cho mỗi vòng Frank-Wolfe [8].
• CLOB (Central Limit Order Book) → Cơ chế giao dịch của Polymarket; lệnh thực thi tuần tự, không nguyên tử [9].
• VWAP (Volume Weighted Average Price) → Giá trung bình thực tế bạn trả, tính tới độ sâu sổ lệnh. Thực tế hơn “giá chào tốt nhất” [10].
• Công thức Kelly → Xác định tỷ lệ vốn nên phân bổ cho một giao dịch, cân bằng lợi nhuận và rủi ro [11].
• Thực thi không nguyên tử → Vấn đề không đảm bảo các lệnh khớp đồng thời. Một bên khớp, bên kia không—rủi ro vị thế.
• DeepSeek → Mô hình ngôn ngữ lớn dùng sàng lọc phụ thuộc thị trường, chính xác 81,45%.
[1] Bài đăng gốc: https://x.com/RohOnChain/status/2017314080395296995
[2] Bài báo nghiên cứu “Unravelling the Probabilistic Forest: Arbitrage in Prediction Markets”: https://arxiv.org/abs/2508.03474
[3] Nền tảng lý thuyết “Arbitrage-Free Combinatorial Market Making via Integer Programming”: https://arxiv.org/abs/1606.02825
[4] Giải thích LMSR: https://www.cultivatelabs.com/crowdsourced-forecasting-guide/how-does-logarithmic-market-scoring-rule-lmsr-work
[5] Giới thiệu về độ lệch Bregman: https://mark.reid.name/blog/meet-the-bregman-divergences.html
[6] Độ lệch KL - Wikipedia: https://en.wikipedia.org/wiki/Kullback%E2%80%93Leibler_divergence
[7] Thuật toán Frank-Wolfe - Wikipedia: https://en.wikipedia.org/wiki/Frank%E2%80%93Wolfe_algorithm
[8] Gurobi Optimizer: https://www.gurobi.com/
[9] Tài liệu API CLOB của Polymarket: https://docs.polymarket.com/
[10] Giải thích VWAP - Investopedia: https://www.investopedia.com/terms/v/vwap.asp
[11] Công thức Kelly - Investopedia: https://www.investopedia.com/articles/trading/04/091504.asp
[12] Bài Decrypt “The $40 Million Free Money Glitch”: https://decrypt.co/339958/40-million-free-money-glitch-crypto-prediction-markets





