Bài viết này trình bày một lộ trình kỹ thuật toàn diện về kinh doanh chênh lệch giá trên thị trường dự đoán Polymarket. Tác giả chỉ ra rằng cạnh tranh chênh lệch giá thực sự đã chuyển từ các phép tính cộng cơ bản sang một cuộc chạy đua toán học ở cấp độ cao. Cụ thể, quá trình này tận dụng Lập trình Số nguyên để xử lý sự bùng nổ phụ thuộc logic ở quy mô $2^{63}$, sử dụng phép chiếu Bregman và độ lệch KL nhằm xác định bất đối xứng thông tin trong các tình huống xác suất cực đoan, đồng thời ứng dụng thuật toán Frank-Wolfe để xấp xỉ nhanh chóng các lộ trình giao dịch tối ưu trong vài mili giây. Bài viết cũng phân tích chi tiết toàn bộ kiến trúc hệ thống, từ khâu thu thập dữ liệu, sàng lọc logic ban đầu cho đến kiểm soát rủi ro đối với các trường hợp thực thi không nguyên tử.

Lời nói đầu

Trong quá trình phát triển @insidersdotbot, tôi đã có nhiều cuộc trao đổi sâu với các đội tạo lập thị trường và đội giao dịch chênh lệch giá tần suất cao. Câu hỏi lớn nhất tôi nhận được là làm thế nào để thiết kế chiến lược giao dịch chênh lệch giá hiệu quả.

Người dùng, bạn bè và đối tác của chúng tôi đều đang khám phá con đường giao dịch chênh lệch giá đa chiều, phức tạp trên @Polymarket. Nếu bạn thường xuyên sử dụng Twitter, chắc hẳn bạn đã từng thấy các bài đăng như: “Tôi kiếm được X từ thị trường dự đoán nhờ chiến lược giao dịch chênh lệch giá Y.”

Tuy nhiên, phần lớn các bài viết đều đơn giản hóa quá mức bản chất của giao dịch chênh lệch giá, chỉ còn lại thông điệp “ai cũng làm được” hoặc “chỉ cần dùng Clawdbot”, mà không hề đưa ra cách xây dựng hệ thống giao dịch chênh lệch giá cho riêng bạn.

Nếu bạn muốn hiểu thực sự các công cụ giao dịch chênh lệch giá trên Polymarket tạo ra lợi nhuận như thế nào, tôi đề xuất đọc bài viết của @RohOnChain—đây là phân tích toàn diện nhất tôi từng thấy.

Tương tự như các bài trước, vì bản gốc tiếng Anh có nhiều phần kỹ thuật cao cần đào sâu, tôi đã tái cấu trúc và bổ sung nội dung để bạn có thể nắm được tất cả các điểm chính mà không cần phải dừng lại tra cứu thêm.

Giao dịch chênh lệch giá trên Polymarket: Không chỉ là một bài toán số học

Giả sử bạn bắt gặp một thị trường trên Polymarket:

Giá YES là 0,62 USD, giá NO là 0,33 USD.

Bạn nghĩ: 0,62 + 0,33 = 0,95, nhỏ hơn 1—đây là cơ hội giao dịch chênh lệch giá! Mua cả YES và NO với 0,95 USD, và dù kết quả ra sao, bạn nhận lại 1,00 USD, lãi ròng 0,05 USD.

Đúng là như vậy.

Nhưng vấn đề ở đây—khi bạn còn đang cộng các con số thủ công, thì các hệ thống định lượng đã vận hành một quy trình hoàn toàn khác.

Chúng quét đồng thời 17.218 điều kiện với 2^63 tổ hợp kết quả có thể, phát hiện mọi điểm bất thường về giá chỉ trong vài mili giây. Khi bạn đặt lệnh, mức chênh lệch đã biến mất. Hệ thống đã phát hiện các điểm bất thường tương tự ở hàng chục thị trường liên quan, tính toán quy mô vị thế tối ưu dựa vào độ sâu sổ lệnh và phí, thực hiện đồng thời tất cả giao dịch và chuyển vốn sang cơ hội tiếp theo [1].

Vấn đề không chỉ là tốc độ. Đó là nền tảng toán học.

Chương 1: Vì sao “cộng số” là chưa đủ—Bài toán đa diện biên

Ngụy biện thị trường đơn

Hãy xét một ví dụ đơn giản.

Thị trường A: “Trump có thắng Pennsylvania không?”

Giá YES là 0,48 USD, giá NO là 0,52 USD. Tổng đúng 1,00 USD.

Có vẻ hoàn hảo—không có chênh lệch giá, đúng không?

Sai.

Thêm một thị trường nữa, mọi thứ thay đổi.

Bây giờ, thị trường B: “Đảng Cộng hòa có thắng Pennsylvania với cách biệt hơn 5 điểm phần trăm không?”

Giá YES là 0,32 USD, giá NO là 0,68 USD. Lại tổng 1,00 USD.

Mỗi thị trường đều “bình thường”. Nhưng có một quan hệ logic:

Bầu cử tổng thống Mỹ quyết định theo từng bang. Mỗi bang là một “chiến trường”, ai nhiều phiếu hơn sẽ giành toàn bộ phiếu đại cử tri của bang đó (người thắng được tất cả). Trump là ứng viên Đảng Cộng hòa. Vì vậy, “Cộng hòa thắng Pennsylvania” và “Trump thắng Pennsylvania” là cùng một sự kiện. Nếu Đảng Cộng hòa thắng với cách biệt trên 5 điểm, Trump không chỉ thắng Pennsylvania mà còn thắng áp đảo.

Nói cách khác, YES của thị trường B (Cộng hòa thắng áp đảo) là tập con của YES thị trường A (Trump thắng)—thắng áp đảo chắc chắn thắng, nhưng thắng chưa chắc áp đảo.

Quan hệ logic này tạo ra cơ hội giao dịch chênh lệch giá.

Giống như đặt cược “Ngày mai có mưa không?” và “Ngày mai có giông bão không?” Nếu có giông bão thì chắc chắn có mưa (giông bão ⊆ mưa). Vì vậy, giá “Giông bão YES” không bao giờ được cao hơn “Mưa YES”. Nếu thị trường định giá sai, bạn có thể mua thấp bán cao đồng thời để thu lợi nhuận không rủi ro. Đó chính là giao dịch chênh lệch giá.

Bùng nổ hàm mũ: Vì sao vét cạn thất bại

Với bất kỳ thị trường nào có n điều kiện, sẽ có 2^n tổ hợp giá có thể.

Nghe có vẻ kiểm soát được? Xem ví dụ thực tế.

Thị trường NCAA 2010 [2]: 63 trận, mỗi trận có kết quả thắng/thua. Nghĩa là 2^63 = 9.223.372.036.854.775.808 tổ hợp—hơn 9 tỷ tỷ. Thị trường có hơn 5.000 sổ lệnh.

2^63 lớn cỡ nào? Dù kiểm tra 1 tỷ tổ hợp mỗi giây cũng mất khoảng 292 năm để duyệt hết. Vì vậy, vét cạn là bất khả thi.

Kiểm tra từng tổ hợp một? Không khả thi về mặt tính toán.

Bây giờ, xem bầu cử Mỹ 2024. Các nhà nghiên cứu phát hiện 1.576 cặp thị trường có thể phụ thuộc [2]. Nếu mỗi cặp có 10 điều kiện, tức 2^20 = 1.048.576 tổ hợp mỗi cặp. Nhân với 1.576 cặp. Khi máy tính của bạn xử lý xong, cuộc bầu cử đã kết thúc từ lâu.

Quy hoạch nguyên: Dùng ràng buộc thay vì liệt kê

Các hệ thống định lượng không giải quyết bằng “liệt kê nhanh hơn”, mà bằng cách không liệt kê.

Chúng dùng quy hoạch nguyên [3] để mô tả “kết quả nào là hợp lệ”.

Ví dụ thực tế: thị trường Duke vs. Cornell—mỗi đội có 7 sổ lệnh (0 đến 6 trận thắng), tổng cộng 14 điều kiện, tức 2^14 = 16.384 tổ hợp.

Nhưng có một ràng buộc: cả hai đội không thể cùng thắng quá 5 trận, vì họ sẽ gặp nhau ở bán kết (chỉ một đội đi tiếp).

Quy hoạch nguyên giải quyết thế nào? Chỉ cần ba ràng buộc:

Ràng buộc 1: Chính xác một trong 7 sổ lệnh của Duke đúng (Duke chỉ có một số trận thắng cuối cùng).

Ràng buộc 2: Chính xác một trong 7 sổ lệnh của Cornell đúng.

Ràng buộc 3: Duke thắng 5 + Duke thắng 6 + Cornell thắng 5 + Cornell thắng 6 ≤ 1 (không thể cả hai cùng thắng nhiều như vậy).

Ba ràng buộc tuyến tính thay cho 16.384 phép kiểm tra vét cạn.

Vét cạn vs. Quy hoạch nguyên

Nói cách khác, vét cạn giống như đọc từng từ trong từ điển để tìm một từ. Quy hoạch nguyên giống như lật đúng trang cần thiết. Bạn không cần kiểm tra mọi khả năng—chỉ cần mô tả “đáp án hợp lệ” và để thuật toán tìm kết quả định giá sai.

Dữ liệu thực: 41% thị trường có chênh lệch giá

Bài viết gốc ghi nhận nhóm nghiên cứu đã phân tích dữ liệu từ tháng 4/2024 đến tháng 4/2025 [2]:

• 17.218 điều kiện được kiểm tra

• 7.051 điều kiện có chênh lệch giá một thị trường (41%)

• Sai lệch giá trung vị: 0,60 USD (lẽ ra là 1,00 USD)

• 13 cơ hội chênh lệch giá xác nhận được giữa các thị trường

Sai lệch trung vị 0,60 USD nghĩa là thị trường thường lệch 40%. Đây không phải “gần hiệu quả”—mà là “rất dễ bị khai thác”.

Chương 2: Phép chiếu Bregman—Tính toán giao dịch chênh lệch giá tối ưu

Tìm ra chênh lệch giá là một chuyện. Tính toán giao dịch tối ưu lại là chuyện khác.

Bạn không thể chỉ “lấy trung bình” hay “chỉnh giá một chút”. Bạn cần chiếu trạng thái thị trường hiện tại lên không gian không có chênh lệch giá, bảo toàn cấu trúc thông tin trong giá.

Vì sao “khoảng cách đường thẳng” không hiệu quả

Cách trực quan là tìm “giá hợp lệ gần nhất” và giao dịch phần chênh lệch.

Về toán học, nghĩa là tối thiểu hóa khoảng cách Euclid: ||μ - θ||²

Nhưng cách này coi mọi thay đổi giá là như nhau.

Chuyển từ 0,50 USD lên 0,60 USD và từ 0,05 USD lên 0,15 USD đều là thay đổi 0,10 USD—nhưng ý nghĩa thông tin lại hoàn toàn khác biệt.

Vì sao? Vì giá thể hiện xác suất ngầm định. Tăng từ 50% lên 60% là điều chỉnh vừa phải. Tăng từ 5% lên 15% là bước nhảy lớn—một sự kiện gần như bất khả thi thành “có thể xảy ra”.

Hãy tưởng tượng cân nặng: từ 70 kg lên 80 kg là “tăng nhẹ”. Nhưng từ 30 kg lên 40 kg (với người lớn) là “từ gần chết tới suy dinh dưỡng nặng”. Cùng thay đổi 10 kg, nhưng ý nghĩa hoàn toàn khác. Thay đổi giá gần 0 hoặc 1 mang nhiều thông tin hơn.

Độ lệch Bregman: “khoảng cách” đúng

Bộ định giá thị trường của Polymarket dùng LMSR (Logarithmic Market Scoring Rule) [4], trong đó giá thể hiện phân phối xác suất.

Ở đây, thước đo khoảng cách đúng không phải Euclid, mà là độ lệch Bregman [5].

Với LMSR, độ lệch Bregman trở thành độ lệch KL (Kullback-Leibler divergence) [6]—một phép đo “khoảng cách thông tin” giữa hai phân phối xác suất.

Bạn không cần nhớ công thức. Chỉ cần biết:

Độ lệch KL tự động gán trọng số lớn hơn cho các thay đổi gần cực biên. Chuyển từ 0,05 USD lên 0,15 USD là “xa” hơn nhiều dưới độ lệch KL so với từ 0,50 USD lên 0,60 USD. Điều này phù hợp trực giác—thay đổi giá cực đoan nghĩa là cú sốc thông tin lớn hơn.

Một ví dụ điển hình: trên thị trường dự đoán của @zachxbt, Axiom vượt Meteora vào phút cuối, do biến động giá cực mạnh.

Phép chiếu Bregman vs. phép chiếu Euclid

Lợi nhuận chênh lệch giá = Khoảng cách phép chiếu Bregman

Kết luận then chốt từ bài báo tham khảo:

Lợi nhuận đảm bảo tối đa từ mọi giao dịch bằng khoảng cách phép chiếu Bregman từ trạng thái thị trường hiện tại tới không gian không chênh lệch giá.

Nói đơn giản: giá thị trường càng lệch khỏi “không gian hợp lệ”, bạn càng kiếm được nhiều. Phép chiếu Bregman cho bạn biết:

Mua/bán gì (hướng chiếu = hướng giao dịch)

Mua/bán bao nhiêu (tính đến độ sâu sổ lệnh)

Có thể kiếm được bao nhiêu (khoảng cách chiếu = lợi nhuận tối đa)

Nhà giao dịch chênh lệch giá hàng đầu đã kiếm 2.009.631,76 USD trong một năm [2]. Chiến lược của họ chỉ đơn giản là giải bài toán tối ưu này nhanh và chính xác hơn bất kỳ ai.

Đa diện biên và giao dịch chênh lệch giá

Hãy tưởng tượng bạn đứng trên đỉnh núi, dưới chân là con sông (không gian không chênh lệch giá). Vị trí hiện tại của bạn (giá thị trường) cách con sông một đoạn.

Phép chiếu Bregman giúp bạn tìm “đường ngắn nhất từ vị trí của bạn xuống sông”—không phải đường thẳng, mà là đường ngắn nhất tính tới địa hình (cấu trúc thị trường). Độ dài đường này là lợi nhuận tối đa bạn có thể đạt được.

Chương 3: Thuật toán Frank-Wolfe—Biến lý thuyết thành hiện thực

Giờ bạn đã biết: để tính giao dịch chênh lệch giá tối ưu, cần phép chiếu Bregman.

Nhưng vấn đề là—không thể tính trực tiếp phép chiếu Bregman.

Vì sao? Vì không gian không chênh lệch giá (đa diện biên M) có số đỉnh tăng hàm mũ. Tối ưu lồi chuẩn cần truy cập toàn bộ tập ràng buộc, tức liệt kê mọi kết quả hợp lệ. Điều này bất khả thi ở quy mô lớn.

Ý tưởng cốt lõi của Frank-Wolfe

Điểm mạnh của thuật toán Frank-Wolfe [7] là không cố giải tất cả một lần, mà hội tụ từng bước.

Quy trình như sau:

Bước 1: Khởi đầu với một tập hợp nhỏ các kết quả hợp lệ đã biết.

Bước 2: Tối ưu trên tập này để tìm nghiệm hiện tại tốt nhất.

Bước 3: Dùng quy hoạch nguyên để tìm kết quả hợp lệ mới, thêm vào tập.

Bước 4: Kiểm tra đã đủ gần tối ưu chưa. Nếu chưa, quay lại Bước 2.

Mỗi vòng chỉ thêm một đỉnh. Dù sau 100 vòng, bạn chỉ theo dõi 100 đỉnh—không phải 2^63.

Lặp Frank-Wolfe

Tưởng tượng bạn đang tìm lối ra trong mê cung khổng lồ.

Cách vét cạn là đi hết mọi ngả. Cách Frank-Wolfe là chọn đại một đường, rồi tại mỗi ngã rẽ, hỏi “hướng dẫn viên” (bộ giải quy hoạch nguyên): “Từ đây, hướng nào dễ ra nhất?” Sau đó đi một bước theo hướng đó. Bạn không cần khám phá toàn bộ mê cung—chỉ cần chọn đúng ở mỗi điểm quyết định.

Bộ giải quy hoạch nguyên: “hướng dẫn viên” mỗi bước

Mỗi vòng Frank-Wolfe cần giải một bài toán quy hoạch nguyên tuyến tính. Về lý thuyết, đây là bài toán NP-khó (chưa có thuật toán tổng quát nhanh).

Nhưng các bộ giải hiện đại như Gurobi [8] có thể xử lý hiệu quả các bài toán có cấu trúc tốt.

Nhóm nghiên cứu dùng Gurobi 5.5. Thời gian giải thực tế [2]:

• Các vòng đầu (ít trận kết thúc): dưới 1 giây

• Giai đoạn giữa (30–40 trận kết thúc): 10–30 giây

• Giai đoạn cuối (trên 50 trận kết thúc): dưới 5 giây

Vì sao càng về sau càng nhanh? Vì càng nhiều kết quả xác định, không gian nghiệm hợp lệ càng thu hẹp. Ít biến hơn, ràng buộc chặt hơn, giải nhanh hơn.

Nổ gradient và Barrier Frank-Wolfe

Frank-Wolfe chuẩn có một vấn đề kỹ thuật: khi giá tiến gần 0, gradient LMSR tiến về âm vô cùng, gây bất ổn.

Giải pháp là Barrier Frank-Wolfe: tối ưu không trên toàn đa diện M, mà trên phiên bản “co lại” M’. Tham số co ε giảm dần theo mỗi vòng—khởi đầu xa biên (ổn định), rồi dần tiến sát biên thực (chính xác).

Nghiên cứu cho thấy thực tế cần 50 đến 150 vòng để hội tụ [2].

Hiệu suất thực tế

Bài báo tiết lộ phát hiện then chốt [2]:

16 trận đầu của giải NCAA, bộ định giá Frank-Wolfe (FWMM) và bộ định giá tuyến tính đơn giản (LCMM) hiệu quả tương đương—vì bộ giải quy hoạch nguyên còn chậm.

Nhưng sau 45 trận, phép chiếu 30 phút đầu tiên thành công.

Từ đó, FWMM vượt LCMM về định giá 38%.

Điểm bứt phá: khi không gian kết quả đủ nhỏ để quy hoạch nguyên giải kịp trong thời gian giao dịch.

FWMM giống như thí sinh khởi động chậm nửa đầu bài thi, nhưng vào guồng thì vượt lên. LCMM là thí sinh ổn định nhưng giới hạn. Khác biệt then chốt: FWMM có “vũ khí” mạnh hơn (phép chiếu Bregman), nhưng cần thời gian “nạp đạn” (chờ bộ giải).

Chương 4: Thực thi—Vì sao bạn vẫn có thể lỗ dù đã tính toán xong

Bạn đã phát hiện chênh lệch giá. Bạn đã dùng phép chiếu Bregman để tính giao dịch tối ưu.

Giờ bạn cần thực thi.

Đây là nơi hầu hết chiến lược thất bại.

Thực thi không nguyên tử

Polymarket dùng CLOB (Central Limit Order Book) [9]. Khác với sàn phi tập trung, giao dịch trên CLOB thực hiện tuần tự—bạn không thể đảm bảo mọi lệnh đều khớp cùng lúc.

Kế hoạch giao dịch chênh lệch giá của bạn:

Mua YES giá 0,30 USD. Mua NO giá 0,30 USD. Tổng chi phí: 0,60 USD. Dù kết quả nào, nhận 1,00 USD. Lãi: 0,40 USD.

Thực tế:

Gửi lệnh YES → khớp giá 0,30 USD ✓

Lệnh của bạn làm dịch chuyển giá thị trường.

Gửi lệnh NO → khớp giá 0,78 USD ✗

Tổng chi phí: 1,08 USD. Nhận về: 1,00 USD. Kết quả thực: lỗ 0,08 USD.

Một bên khớp, bên kia không. Bạn bị rủi ro.

Đó là lý do bài báo chỉ tính những cơ hội có biên lợi nhuận trên 0,05 USD [2]. Biên nhỏ hơn sẽ bị rủi ro thực thi xóa sạch.

Rủi ro thực thi không nguyên tử

VWAP: Giá thực thi thực tế

Đừng mặc định bạn luôn khớp đúng giá niêm yết. Bạn cần tính Giá trung bình theo khối lượng (VWAP) [10].

Phương pháp của nhóm nghiên cứu: với mỗi block trên chuỗi Polygon (khoảng 2 giây/block), tính VWAP cho tất cả giao dịch YES và NO trong block đó. Nếu |VWAP_yes + VWAP_no - 1,0| > 0,02, ghi nhận là cơ hội chênh lệch giá [2].

VWAP là “giá trung bình bạn thực sự trả”. Nếu bạn muốn mua 10.000 token nhưng sổ lệnh có giá 0,30 USD cho 2.000, 0,32 USD cho 3.000, 0,35 USD cho 5.000—VWAP là (2000×0,30 + 3000×0,32 + 5000×0,35) / 10000 = 0,326 USD. Cao hơn nhiều so với “giá tốt nhất” 0,30 USD bạn thấy.

Hạn chế thanh khoản: Lợi nhuận phụ thuộc độ sâu sổ lệnh

Dù giá lệch, lợi nhuận của bạn bị giới hạn bởi thanh khoản sẵn có.

Ví dụ thực tế [2]:

Thị trường cho thấy chênh lệch giá: tổng giá YES là 0,85 USD. Lợi nhuận tiềm năng: 0,15 USD mỗi đô la. Nhưng độ sâu sổ lệnh ở các mức giá đó chỉ 234 USD. Lợi nhuận tối đa rút được: 234 × 0,15 = 35,10 USD.

Với giao dịch chênh lệch giá giữa các thị trường, bạn cần thanh khoản đủ ở tất cả vị thế cùng lúc. Thanh khoản nhỏ nhất quyết định trần lợi nhuận.

Đó là lý do trên các nền tảng định lượng hiện nay, tác động của giá lệnh lên giá thực thi là yếu tố sống còn.

insiders.bot

Đây là đáp án cho vấn đề này trong giai đoạn Beta công khai.

Chương 5: Hệ thống hoàn chỉnh—Thực tế triển khai thế nào

Lý thuyết thì gọn gàng. Thực tế vận hành thì phức tạp.

Dưới đây là một hệ thống giao dịch chênh lệch giá thực tế [2].

Pipeline dữ liệu

Dữ liệu thời gian thực: kết nối WebSocket tới API của Polymarket [9], nhận cập nhật sổ lệnh (thay đổi giá/số lượng), thông báo giao dịch và sự kiện tạo/kết thúc thị trường.

Dữ liệu lịch sử: truy vấn sự kiện hợp đồng qua API node Alchemy Polygon—OrderFilled (giao dịch khớp), PositionSplit (mint token mới), PositionsMerge (đốt token).

Nhóm nghiên cứu đã phân tích 86 triệu giao dịch [2]. Quy mô này đòi hỏi hạ tầng thực sự, không chỉ script đơn lẻ.

P.S. Hiện tại, chúng tôi

insiders.bot

dự định mã nguồn mở API giao dịch tốc độ cao. Nếu bạn định dùng mô hình giao dịch tương tự và muốn truy cập sớm, cứ nhắn tin cho tôi.

Lớp phát hiện phụ thuộc

Với 305 thị trường bầu cử Mỹ, có 46.360 cặp tiềm năng cần kiểm tra. Phân tích thủ công là bất khả thi.

Nhóm nghiên cứu dùng cách tiếp cận thông minh: tận dụng mô hình ngôn ngữ lớn DeepSeek-R1-Distill-Qwen-32B để sàng lọc ban đầu [2].

Input: mô tả điều kiện của hai thị trường. Output: JSON các tổ hợp kết quả hợp lệ.

Sau đó, ba lớp xác thực: mỗi thị trường có đúng một điều kiện đúng? Số tổ hợp hợp lệ có nhỏ hơn n × m (chứng tỏ có phụ thuộc)? Tập con phụ thuộc có thỏa điều kiện chênh lệch giá?

Kết quả: 40.057 cặp độc lập (không có chênh lệch giá) → 1.576 cặp phụ thuộc (có khả năng chênh lệch giá) → 374 cặp đáp ứng tiêu chí nghiêm ngặt → 13 cặp xác nhận có thể khai thác thực tế [2].

Độ chính xác LLM với thị trường đa điều kiện phức tạp là 81,45%. Khá tốt cho sàng lọc ban đầu, nhưng cần xác minh thủ công trước khi thực thi.

Bộ máy tối ưu ba lớp

Lớp 1: Ràng buộc tuyến tính đơn giản (LCMM). Kiểm tra nhanh các quy tắc cơ bản—“tổng xác suất bằng 1”, “nếu A kéo theo B thì P(A) không được lớn hơn P(B)”. Hoàn thành trong mili giây, loại bỏ lỗi định giá rõ ràng.

Lớp 2: Phép chiếu quy hoạch nguyên (Frank-Wolfe + Gurobi). Đây là lõi hệ thống. Tham số: Alpha = 0,9 (rút ít nhất 90% chênh lệch giá sẵn có), ε khởi tạo = 0,1 (co 10%), ngưỡng hội tụ = 1e-6, giới hạn thời gian = 30 phút. Số vòng lặp điển hình: 50–150. Thời gian giải mỗi vòng: 1–30 giây [2].

Lớp 3: Xác thực thực thi. Trước khi gửi lệnh, mô phỏng khớp lệnh trên sổ lệnh hiện tại. Kiểm tra: thanh khoản đủ không? Dự kiến trượt giá bao nhiêu? Lợi nhuận đảm bảo sau trượt giá là bao nhiêu? Lợi nhuận có vượt ngưỡng tối thiểu (0,05 USD) không? Chỉ khi mọi tiêu chí đạt mới thực thi.

Quản lý vị thế: Công thức Kelly điều chỉnh

Công thức Kelly chuẩn [11] cho biết nên phân bổ bao nhiêu phần vốn cho một giao dịch. Với chênh lệch giá, cần điều chỉnh theo rủi ro thực thi:

f = (b×p - q) / b × √p

Trong đó b là phần trăm lợi nhuận chênh lệch giá, p là xác suất thực thi đầy đủ (ước tính từ độ sâu sổ lệnh), q = 1 - p.

Giới hạn: 50% độ sâu sổ lệnh. Vượt mức này, lệnh của bạn gây biến động mạnh thị trường.

Kết quả cuối cùng

Từ tháng 4/2024 đến tháng 4/2025, tổng lợi nhuận rút được [2]:

Chênh lệch giá đơn điều kiện: Mua cả hai phía giá thấp 5.899.287 USD + bán cả hai phía giá cao 4.682.075 USD = 10.581.362 USD

Cân bằng thị trường: Mua tất cả YES giá thấp 11.092.286 USD + bán tất cả YES giá cao 612.189 USD + mua tất cả NO 17.307.114 USD = 29.011.589 USD

Chênh lệch giá tổng hợp giữa các thị trường: 95.634 USD

Tổng cộng: 39.688.585 USD

Top 10 nhà giao dịch chênh lệch giá thu 8.127.849 USD (20,5% tổng số). Nhà giao dịch dẫn đầu: 2.009.632 USD từ 4.049 giao dịch, trung bình 496 USD/giao dịch [2].

Không phải xổ số. Không phải may mắn. Đây là thực thi hệ thống, chính xác về mặt toán học.

Thực tế cuối cùng

Khi các nhà giao dịch đang đọc “10 mẹo thị trường dự đoán”, các hệ thống định lượng đang làm gì?

Họ dùng quy hoạch nguyên phát hiện phụ thuộc giữa 17.218 điều kiện. Họ dùng phép chiếu Bregman để tính giao dịch chênh lệch giá tối ưu. Họ chạy thuật toán Frank-Wolfe để xử lý nổ gradient. Họ dùng VWAP để ước lượng trượt giá và thực thi lệnh song song. Họ khai thác có hệ thống 40 triệu USD lợi nhuận đảm bảo.

Khác biệt không phải may mắn. Đó là hạ tầng toán học.

Bài báo đã công khai [1]. Thuật toán đã biết. Lợi nhuận là thật.

Câu hỏi thực sự: Bạn có thể xây dựng nó trước khi 40 triệu USD tiếp theo bị rút không?

Tham khảo nhanh

• Đa diện biên → Tập hợp tất cả giá hợp lệ. Giá phải nằm trong vùng này mới không có chênh lệch giá.

• Quy hoạch nguyên → Mô tả kết quả hợp lệ bằng ràng buộc tuyến tính, tránh liệt kê vét cạn. Nén 2^63 phép kiểm tra thành vài ràng buộc [3].

• Độ lệch Bregman / Độ lệch KL → Đo “khoảng cách” giữa hai phân phối xác suất, phù hợp hơn Euclid cho tình huống giá/xác suất. Gán trọng số lớn hơn cho thay đổi gần cực biên [5][6].

• LMSR (Logarithmic Market Scoring Rule) → Cơ chế định giá mà bộ định giá thị trường Polymarket sử dụng; giá thể hiện xác suất ngầm định [4].

• Thuật toán Frank-Wolfe → Thuật toán tối ưu lặp, mỗi vòng thêm một đỉnh mới, tránh liệt kê hàm mũ các kết quả hợp lệ [7].

• Gurobi → Bộ giải quy hoạch nguyên hàng đầu ngành, “hướng dẫn viên” cho mỗi vòng Frank-Wolfe [8].

• CLOB (Central Limit Order Book) → Cơ chế giao dịch của Polymarket; lệnh thực thi tuần tự, không nguyên tử [9].

• VWAP (Volume Weighted Average Price) → Giá trung bình thực tế bạn trả, tính tới độ sâu sổ lệnh. Thực tế hơn “giá chào tốt nhất” [10].

• Công thức Kelly → Xác định tỷ lệ vốn nên phân bổ cho một giao dịch, cân bằng lợi nhuận và rủi ro [11].

• Thực thi không nguyên tử → Vấn đề không đảm bảo các lệnh khớp đồng thời. Một bên khớp, bên kia không—rủi ro vị thế.

• DeepSeek → Mô hình ngôn ngữ lớn dùng sàng lọc phụ thuộc thị trường, chính xác 81,45%.

Tài liệu tham khảo

[1] Bài đăng gốc: https://x.com/RohOnChain/status/2017314080395296995

[2] Bài báo nghiên cứu “Unravelling the Probabilistic Forest: Arbitrage in Prediction Markets”: https://arxiv.org/abs/2508.03474

[3] Nền tảng lý thuyết “Arbitrage-Free Combinatorial Market Making via Integer Programming”: https://arxiv.org/abs/1606.02825

[4] Giải thích LMSR: https://www.cultivatelabs.com/crowdsourced-forecasting-guide/how-does-logarithmic-market-scoring-rule-lmsr-work

[5] Giới thiệu về độ lệch Bregman: https://mark.reid.name/blog/meet-the-bregman-divergences.html

[6] Độ lệch KL - Wikipedia: https://en.wikipedia.org/wiki/Kullback%E2%80%93Leibler_divergence

[7] Thuật toán Frank-Wolfe - Wikipedia: https://en.wikipedia.org/wiki/Frank%E2%80%93Wolfe_algorithm

[8] Gurobi Optimizer: https://www.gurobi.com/

[9] Tài liệu API CLOB của Polymarket: https://docs.polymarket.com/

[10] Giải thích VWAP - Investopedia: https://www.investopedia.com/terms/v/vwap.asp

[11] Công thức Kelly - Investopedia: https://www.investopedia.com/articles/trading/04/091504.asp

[12] Bài Decrypt “The $40 Million Free Money Glitch”: https://decrypt.co/339958/40-million-free-money-glitch-crypto-prediction-markets

Lưu ý

Bài viết này được tái bản từ [mrryanchi], bản quyền thuộc về tác giả gốc [@RohOnChain]. Nếu bạn có ý kiến về việc tái bản, vui lòng liên hệ đội ngũ Gate Learn, chúng tôi sẽ xử lý kịp thời theo quy trình liên quan.
Lưu ý: Quan điểm và ý kiến trong bài viết chỉ thuộc về tác giả, không phải là lời khuyên đầu tư.
Các phiên bản ngôn ngữ khác của bài viết này do đội ngũ Gate Learn dịch. Nếu không đề cập rõ Gate, nghiêm cấm tái bản, phân phối hoặc sao chép nội dung dịch.

Mời người khác bỏ phiếu

Nội dung

Lời nói đầu

Giao dịch chênh lệch giá trên Polymarket: Không chỉ là một bài toán số học

Chương 1: Vì sao “cộng số” là chưa đủ—Bài toán đa diện biên

Chương 2: Phép chiếu Bregman—Tính toán giao dịch chênh lệch giá tối ưu

Chương 3: Thuật toán Frank-Wolfe—Biến lý thuyết thành hiện thực

Chương 4: Thực thi—Vì sao bạn vẫn có thể lỗ dù đã tính toán xong

Chương 5: Hệ thống hoàn chỉnh—Thực tế triển khai thế nào

Pipeline dữ liệu

Tin nhanh

Bitcoin Tăng Lên $77,4K, Kích Hoạt Việc Thanh Lý $2,6M Cho Ba Vị Thế Short Của Cá Voi Trên Hyperliquid

2026-04-29 05:01

Thẩm phán Kaplan Từ Chối Yêu Cầu Mở Phiên Tòa Mới của Sam Bankman-Fried, Gọi Bằng Chứng 'Mang Tính Âm Mưu Một Cách Hoang Đường'

2026-04-29 04:56

Canaan Nhận Được Đơn Hàng Mới Từ Tether Cho Phần Cứng Khai Thác Bitcoin Làm Mát Nhúng

2026-04-29 04:40

Các mô hình OpenAI sẽ dần chuyển sang chip Trainium do Amazon tùy chỉnh, Altman cho biết anh ấy đã 'mong chờ' điều đó

2026-04-29 04:33

Altman: Định giá theo token sắp trở nên lỗi thời khi GPT-5.5 chuyển trọng tâm sang hoàn thành tác vụ thay vì đếm token

2026-04-29 04:29

Bài viết liên quan

Người mới bắt đầu

Mô hình kinh tế token ONDO: Cơ chế thúc đẩy tăng trưởng nền tảng và gia tăng sự tham gia của người dùng?

ONDO là token quản trị trung tâm và công cụ ghi nhận giá trị của hệ sinh thái Ondo Finance. Mục tiêu trọng tâm của ONDO là ứng dụng cơ chế khuyến khích bằng token nhằm gắn kết các tài sản tài chính truyền thống (RWA) với hệ sinh thái DeFi một cách liền mạch, qua đó thúc đẩy sự mở rộng quy mô lớn cho các sản phẩm quản lý tài sản và lợi nhuận trên chuỗi.

2026-03-27 13:53:10

Người mới bắt đầu

Phân tích chuyên sâu về tokenomics của Morpho: tiện ích, phân phối và khung giá trị của MORPHO

MORPHO là token gốc của giao thức Morpho, đảm nhận vai trò trọng tâm trong quản trị và thúc đẩy các hoạt động của hệ sinh thái. Bằng cách kết hợp phân phối token với các cơ chế khuyến khích, Morpho gắn kết sự tham gia của người dùng, quá trình phát triển giao thức và quyền lực quản trị, từ đó xây dựng nền tảng vững chắc cho giá trị lâu dài trong hệ sinh thái cho vay phi tập trung.

2026-04-03 13:14:14

Người mới bắt đầu

Tronscan là gì và Bạn có thể sử dụng nó như thế nào vào năm 2025?

Tronscan là một trình duyệt blockchain vượt xa những khái niệm cơ bản, cung cấp quản lý ví, theo dõi token, thông tin hợp đồng thông minh và tham gia quản trị. Đến năm 2025, nó đã phát triển với các tính năng bảo mật nâng cao, phân tích mở rộng, tích hợp đa chuỗi và trải nghiệm di động cải thiện. Hiện nền tảng bao gồm xác thực sinh trắc học tiên tiến, giám sát giao dịch thời gian thực và bảng điều khiển DeFi toàn diện. Nhà phát triển được hưởng lợi từ phân tích hợp đồng thông minh được hỗ trợ bởi AI và môi trường kiểm tra cải thiện, trong khi người dùng thích thú với chế độ xem danh mục đa chuỗi thống nhất và điều hướng dựa trên cử chỉ trên thiết bị di động.

2026-04-08 21:21:11

Người mới bắt đầu

Bitcoin là gì?

Bitcoin là hệ thống tiền điện tử phi tập trung, được xây dựng nhằm chuyển giao giá trị trực tiếp giữa các cá nhân và lưu trữ giá trị lâu dài. Satoshi Nakamoto là người sáng lập ra hệ thống này. Bitcoin vận hành mà không cần bất kỳ cơ quan trung ương nào, thay vào đó dựa vào mật mã học và mạng lưới phân tán để duy trì hoạt động chung.

2026-04-09 08:10:21

Người mới bắt đầu

Các trường hợp sử dụng của token ST là gì? Phân tích chuyên sâu về cơ chế khuyến khích của hệ sinh thái Sentio

ST là token tiện ích cốt lõi của hệ sinh thái Sentio, giữ vai trò phương tiện chính để chuyển giá trị giữa nhà phát triển, hạ tầng dữ liệu và thành viên mạng lưới. Với vai trò là thành phần chủ chốt trong mạng dữ liệu trên chuỗi theo thời gian thực của Sentio, ST được dùng để sử dụng tài nguyên, tạo động lực cho mạng lưới và thúc đẩy hợp tác trong hệ sinh thái, từ đó hỗ trợ nền tảng xây dựng mô hình dịch vụ dữ liệu bền vững. Việc triển khai cơ chế token ST cho phép Sentio kết hợp hiệu quả giữa sử dụng tài nguyên mạng và các ưu đãi hệ sinh thái, giúp nhà phát triển truy cập dịch vụ dữ liệu theo thời gian thực tối ưu hơn và củng cố tính bền vững dài hạn cho toàn bộ mạng dữ liệu.

2026-04-17 09:26:07

Người mới bắt đầu

Plasma (XPL) và các hệ thống thanh toán truyền thống: Tái định nghĩa thanh toán xuyên biên giới bằng stablecoin và thay đổi động lực thanh khoản

Plasma (XPL) nổi bật so với các hệ thống thanh toán truyền thống ở nhiều điểm cốt lõi. Về cơ chế thanh toán, Plasma cho phép chuyển tài sản trực tiếp trên chuỗi, trong khi các hệ thống truyền thống lại dựa vào phương thức ghi sổ tài khoản và các quy trình bù trừ qua trung gian. Xét về hiệu suất thanh toán và cấu trúc chi phí, Plasma mang đến giao dịch gần như theo thời gian thực với chi phí cực thấp, còn hệ thống truyền thống thường bị chậm trễ và phát sinh nhiều loại phí. Đối với quản lý thanh khoản, Plasma sử dụng stablecoin để phân bổ thanh khoản trên chuỗi theo nhu cầu thực tế, thay vì phải cấp vốn trước như các khuôn khổ truyền thống. Hơn nữa, Plasma còn hỗ trợ hợp đồng thông minh và mạng lưới mở toàn cầu cho phép lập trình và tiếp cận rộng rãi, trong khi các hệ thống thanh toán truyền thống chủ yếu bị giới hạn bởi kiến trúc cũ và hệ thống ngân hàng.

2026-03-24 11:58:52