DeepSeek Giảm Giá API 90%, Chạy V4 trên Chip Huawei, và Thúc đẩy Trí Tuệ Nhân Tạo Thâm Nhập Vào Cuộc Chiến Giá Cả Toàn Diện


DeepSeek giảm giá API 90% cho các lượt truy cập vào bộ nhớ đệm đầu vào và đang cung cấp giảm giá 75% cho V4-Pro đến ngày 5 tháng 5
Điều này đưa giá truy cập bộ nhớ đệm của V4-Pro xuống khoảng 0,0036 đô la cho mỗi triệu token, trong khi giá đầu ra nằm far below các mô hình frontier phương Tây tính phí 12 đô la–$25 cho mỗi triệu token
V4-Pro có tổng cộng 1,6 nghìn tỷ tham số, với 49 tỷ hoạt động mỗi lượt suy luận. V4-Flash là phiên bản nhỏ hơn với 284 tỷ tham số
V4 chạy trên chip Huawei Ascend, không phải NVIDIA
Nó cũng sử dụng ít hơn nhiều công suất tính toán. Ở cửa sổ ngữ cảnh 1 triệu token, V4-Pro được báo cáo chỉ cần 27% công suất so với V3.2
Hiệu suất vẫn còn hơi kém hơn GPT-5.4 và Gemini 3.1 Pro
Xem bản gốc
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim