GPU não tem 「preço」:quatro grandes índices em conflito, o mercado de poder de processamento é mais confuso do que você pensa

robot
Geração de resumo em curso

Autor: David Lopez Mateos

Tradução: TechFlow

Guia da TechFlow: A comunicação social gosta de usar um único número para resumir as subidas e descidas do preço da capacidade de GPU, mas a realidade é esta: no terminal Bloomberg, as cotações fornecidas por quatro fornecedores de índices divergem entre si em mais de 2 dólares, e a direção e o ritmo também não são consistentes. O autor deste artigo é o fundador da plataforma de trading de capacidade de GPU Compute Desk, David Lopez Mateos. Com base numa mão de dados de trading, ele desagregou a estrutura real de preços do H100 e do B200, revelando um mercado “cru” que não tem um benchmark de consenso, não tem contratos normalizados e não tem uma curva a prazo — a capacidade está a ser acumulada e subarrendada, como se fosse um apartamento de curta duração.

Os títulos da comunicação social fazem-te sentir que o preço da capacidade de GPU está a disparar. Esta narrativa é confortável, encaixa na perfeição na moldura macro de “aperto de oferta + procura de IA sem fundo” e ainda sugere uma coisa tranquilizadora: temos um mercado a funcionar bem, com sinais de preço claros e fáceis de ler.

Mas não temos. Esta narrativa assenta quase totalmente num único índice, e o que ela implica não deveria ser implícito: o mercado de aluguer de capacidade de GPU é já tão eficiente que um único número pode representar o estado global.

O aperto de oferta é real, mas a escassez sentida por pessoas diferentes é completamente distinta — depende de quem és, de onde estás, do contrato que estás a negociar e do ativo de capacidade de GPU com que estás a lidar. Perante esta falta de transparência, a reação natural do mercado não é uma descoberta ordenada de preços, mas a acumulação: garantir tempo de GPU que talvez ainda não precises, porque não tens certeza se, no próximo mês, as conseguirás comprar por qualquer preço. Onde há acumulação e não há benchmarks transparentes, surgem mercados secundários fragmentados. Na Compute Desk, já facilitámos que os inquilinos subarrendem os seus clusters como quem subarrenda apartamentos durante grandes eventos desportivos. Isto não é uma hipótese — está a acontecer.

Índices que não convergem

Nos mercados maduros de mercadorias a granel, os índices construídos com base em diferentes metodologias tendem a convergir. O Brent e o WTI, por exemplo, podem ter algumas diferenças de alguns dólares por causa da localização geográfica e da qualidade do petróleo, mas em termos de direção movem-se em sincronia (Fig. 1). Esta convergência é um sinal de mercado eficiente.

Legenda: Comparação entre a evolução dos preços do Brent e do WTI, com grande consistência na direção

Agora há três fornecedores de índices de preços de GPU no terminal Bloomberg: Silicon Data, Ornn AI e Compute Desk. A SemiAnalysis acabou de divulgar o quarto — um índice mensal de preços de contratos de H100 a 1 ano, construído com base em dados de inquéritos a mais de 100 participantes do mercado. A Silicon Data e a Ornn publicam índices diários de aluguer de H100; a Compute Desk agrega dados no nível da arquitetura Hopper; e a SemiAnalysis capta preços de contratos negociados, e não preços de listagens nem preços “raspados” (web scraping). As metodologias são diferentes, a frequência é diferente e também é diferente o ângulo com que cada um captura a perceção sobre o mesmo mercado. Ao sobrepor tudo para analisar em conjunto, as divergências tornam-se óbvias (Fig. 2).

Legenda: Comparação sobreposta dos quatro índices de GPU; tanto o nível de preços como a trajetória divergem claramente

Onde é que, afinal, acontece o aumento do preço

Com os dados da Compute Desk, podemos decompor as variações de preço do H100 por tipo de fornecedor e por estrutura de contrato e sobrepor o índice SDH100RT da Silicon Data (Fig. 3). Todos os indicadores mostram que os preços estão a subir, mas o ponto de partida e a magnitude diferem de forma muito grande, consoante o índice e o tipo de contrato.

Legenda: Trajetória de preços do H100 por tipo de contrato, sobreposta ao índice SDH100RT

Os dados de new cloud (neocloud) do H100 da Compute Desk contam uma história mais específica do que a dos índices agregados. A precificação “on demand” manteve-se relativamente estável ao longo do inverno, cerca de 3,00 dólares por hora, e depois disparou em março para 3,50 dólares. A precificação spot é mais “barulhenta” e mais baixa, com tendência de subida apenas ligeira até março. Já o SDH100RT da Silicon Data mostra uma subida mais suave e estável: no mesmo período, subiu de 2,00 dólares para 2,64 dólares. Os dois índices permanecem continuamente em níveis de preços diferentes e descrevem de forma distinta o ritmo temporal: a Compute Desk fala de um salto em março; a Silicon Data fala de uma subida lenta.

O preço reservado a 1 ano esteve praticamente estável antes de fevereiro e depois; no fim de março, subiu abruptamente de 1,90 dólares para 2,64 dólares — não foi uma perseguição gradual, mas uma redefinição súbita de preços. Isto parece mais um ajuste concentrado das taxas contratuais por parte dos fornecedores após se apertar o mercado “on demand”, e não uma procura estrutural contínua como motor.

A história de março do B200 é ainda mais intensa (Fig. 4). O índice “on demand” da Compute Desk explodiu em poucas semanas, passando de 5,70 dólares para acima de 8,00 dólares. O SDB200RT da Silicon Data subiu de 4,40 dólares para 6,11 dólares e depois voltou a descer para 5,47 dólares. Ambos os índices registam esta fase do mercado, mas a diferença no ponto de partida é superior a 2 dólares, e as formas de subida e de recuo também são diferentes. O B200 tem menos de 5 meses de dados, menos fornecedores e um spread de preços maior; os dois índices estão a observar o mesmo acontecimento através de lentes muito diferentes.

Legenda: Trajetórias de preços “on demand” e de reserva do B200; dados da Compute Desk e da Silicon Data sobrepostos

Problemas de infraestrutura — mais do que diferenças geográficas

No mercado de mercadorias a granel, existe um basis differential. O gás natural na Appalachia é o caso clássico: enormes reservas ficam retidas numa capacidade de gasodutos estruturalmente limitada; a taxa de utilização do corredor Pensilvânia–Ohio ultrapassa frequentemente 100% e projetos novos como o Borealis Pipeline só entram em funcionamento no final da década de 2020.

No mercado de GPUs, há uma situação semelhante: um H100 num local na Virgínia e um H100 em Frankfurt não são o mesmo bem económico. Mas só com diferenças geográficas não se explica porque é que os índices que medem o mesmo mercado divergem tanto. O desalinhamento no mercado de GPUs é mais profundo do que no gás natural da Appalachia. O problema do gás natural é uma falha única e em falta: a capacidade de gasodutos para ligar os lados da oferta e da procura. No mercado de capacidade, as lacunas de infraestrutura existem tanto do lado da oferta como do lado da procura. A infraestrutura física — redes consistentes necessárias para distribuir capacidade de forma fiável, configurações previsíveis e disponibilidade previsível — ainda não está madura e, por vezes, nem sequer funciona. A infraestrutura financeira — apesar de as diferenças físicas existirem e poderem comprimir spreads de preços com contratos normalizados, benchmarks transparentes e mecanismos de arbitragem — também não existe.

Os dados contam uma história. A experiência real de tentar comprar capacidade no início de 2026 conta uma história ainda mais dolorosa. A capacidade “on demand” de todos os tipos de GPU está, na prática, esgotada. Conseguir 64 H100 é difícil: a Compute Desk mostra que 90% da quantidade disponível de clusters “on demand” para os fornecedores é zero. O mercado reservado também não vai muito melhor. Num mercado a funcionar bem, este nível de escassez teria levado os preços para um novo ponto de equilíbrio há muito tempo. Mas não aconteceu. Isto mostra que os próprios fornecedores também não dispõem de informação de preços em tempo real para ajustarem. Os preços estão a subir, mas sobem demasiado devagar para limpar o mercado. A diferença entre os preços de tabela e a verdadeira disposição para pagar está a ser preenchida por acumulação, subarrendamento e transações em mercados secundários informais.

O que precisa de mudar

Neste momento, o mercado de capacidade de GPU tem 7 problemas centrais:

Não existe um benchmark de consenso. Existem vários índices, com metodologias diferentes, e as conclusões contradizem-se.

A narrativa de agregação esconde a estrutura. Um número “preço do H100” mascara as grandes diferenças entre tipos de fornecedor e prazos dos contratos.

Falta de dados ao nível do trading. Num mercado bilateral, a discrepância entre preços de tabela e preços efetivamente negociados é muito grande.

Ausência de padronização de contratos. A maioria do aluguer de GPUs é negociada bilateralmente, com condições diferentes. Prazos de contrato mais curtos e mais normalizados podem melhorar a liquidez e a descoberta de preços.

Sem garantia de qualidade de entrega. Diferenças enormes na topologia de interconexão, emparelhamento com CPU, stack de rede e duração de execução. Antes de assumirem compromissos, os compradores precisam de saber qual a qualidade da capacidade que estão a adquirir.

Contratos sem liquidez. Se a procura mudar durante o período reservado, a escolha fica muito limitada: ou absorver o custo, ou fazer subarrendamento informal. O mercado precisa de transferir ou revender infraestruturas já comprometidas, para que a capacidade flua para quem dela mais necessita.

Sem curva a prazo. Se não é possível precificar a prazo, não é possível fazer hedge. É por isso que os credores aplicam um desconto de 40%-50% ao colateral de GPU, mantendo o custo de financiamento demasiado elevado.

Construir um mercado normal e a funcionar plenamente para a commodity a granel mais importante deste século não é possível recorrendo apenas a uma linha. A medição, a normalização, a estrutura dos contratos, a qualidade de entrega e a liquidez — tudo isto tem de avançar em simultâneo; até lá, ninguém consegue explicar com verdade quanto vale uma hora de GPU.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar