Desde que o DeepSeek foi lançado, tenho andado a experimentar construir o meu próprio produto.



No início, eu não sabia de nada—então usei um "fluxo de trabalho desacoplado": escrevi um arquivo .md para cada pequeno passo, li-o, confirmei a lógica e, em seguida, passei para o próximo passo.

Então aprendi a escrever JSON, tentei colocar dados no LiteSQL e descobri como inspecionar o banco de dados. Mas, uma vez que os dados ficaram maiores, o LiteSQL IO simplesmente não conseguiu acompanhar.

Então, meu colega de equipe e eu mudamos para Redis para aceleração, depois para streaming distribuído de Kafka. Eu até olhei para RisingWave para rodar diretamente em cima do Kafka.

Mas eventualmente a própria computação em streaming tornou-se o gargalo, então passei para o processamento vetorizado com Polars.
E quanto ao armazenamento? Fui até arquivos parquet simples.

Olhando para trás, não consigo deixar de rir—
Se eu tivesse aprendido a ler parquet no início, nada disto teria acontecido 😂
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Fixar

Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)