Meituan lanza pruebas abiertas para el modelo de trillón de parámetros impulsado por clústeres de computación nacionales

El 24 de abril, fuentes de la industria informaron que el modelo fundamental de próxima generación de Meituan, LongCat-2.0-Preview, ha abierto para pruebas, superando una escala total de parámetros de un billón, colocándolo entre los modelos grandes líderes del mundo. Según informantes, DeepSeek también lanzó su modelo de próxima generación V4 el mismo día, que tiene un conteo total de parámetros y un conteo de parámetros activos que son en gran medida consistentes con LongCat-2.0-Preview de Meituan. Más allá de la escala de parámetros, un avance significativo del nuevo modelo fundamental de Meituan radica en que su entrenamiento e inferencia son completamente soportados por clústeres de computación nacionales. Las fuentes indicaron que el número de tarjetas de computación utilizadas durante esta fase de entrenamiento osciló entre 50,000 y 60,000, marcando la mayor tarea de entrenamiento de un modelo grande completada hasta la fecha con recursos de computación nacionales. (Fuente: Jiemian)

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado