Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
TradFi
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Pre-IPOs
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Google phát hành hướng dẫn đào tạo nhà phát triển TPU Ironwood thế hệ thứ bảy, giải thích chi tiết tối ưu hóa hiệu suất cấp hệ thống
Thông tin ME News, ngày 2 tháng 4 (UTC+8), Google chính thức công bố hướng dẫn đào tạo dành cho nhà phát triển về TPU Ironwood thế hệ thứ bảy. Hướng dẫn này nhằm giúp các nhà phát triển tận dụng tối đa hiệu suất hệ thống của TPU Ironwood để đào tạo và triển khai các mô hình AI tiên tiến một cách hiệu quả. TPU Ironwood là hạ tầng AI tùy chỉnh được thiết kế để đáp ứng nhu cầu tính toán của các mô hình có hàng nghìn tỷ tham số, thông qua các công nghệ như liên kết giữa các chip (ICI), bộ chuyển mạch quang (OCS), mạng trung tâm dữ liệu (DCN) và bộ nhớ băng thông cao hợp nhất (HBM), xây dựng hệ thống hoàn chỉnh hỗ trợ lên đến 9.216 chip. Bài viết trình bày chi tiết các chiến lược tối ưu hóa quan trọng dành cho phần cứng này, bao gồm: tận dụng đơn vị nhân ma trận (MXU) hỗ trợ gốc cho huấn luyện FP8 để tăng throughput; sử dụng thư viện lõi JAX tối ưu hóa cho TPU là Tokamax, xử lý các tensor không đều trong các mô hình dài ngữ cảnh và mô hình chuyên gia hỗn hợp bằng “Chú ý bắn tung tóe” và “Nhóm ma trận nhân Megablox”; tận dụng lõi thưa thế hệ thứ tư (SparseCore) để giảm độ trễ bằng cách chuyển tải các thao tác giao tiếp tập thể; tối ưu phân bổ SRAM nhanh trên chip TPU (VMEM) để giảm thiểu thời gian chờ bộ nhớ; và lựa chọn chiến lược phân mảnh tối ưu (như FSDP, TP, EP) dựa trên quy mô mô hình, kiến trúc và độ dài chuỗi. (Nguồn: InFoQ)