Microsoft open-sources the three-tier Harrier text embedding models; the 27B version tops the multilingual MTEB v2 leaderboard.

BlockBeatNews

Según el monitoreo de 1M AI News, Microsoft, en la familia de modelos de incrustación (text embeddings) multilingües de código abierto harrier-oss-v1 en Hugging Face, incluye tres versiones: 270M, 0.6B y 27B. La ficha del modelo muestra que esta serie utiliza una arquitectura solo-decodificador (decoder-only), pooling del último token (last-token pooling) y normalización L2; la longitud máxima admitida es de 32768 tokens, y puede usarse para recuperación, clustering, similitud semántica, clasificación, minería bilingüe y re-ranking.

Multilingual MTEB v2 es un punto de referencia de incrustación de texto multilingüe de uso común en la industria; principalmente evalúa tareas como recuperación, clasificación, clustering y similitud semántica. La ficha del modelo de Microsoft afirma que, en este benchmark, las puntuaciones de las tres versiones son 66.5, 69.0 y 74.3, respectivamente, y que la versión de 27B llegó al primer puesto el día de su lanzamiento. Las versiones de 270M y 0.6B también usan adicionalmente un modelo de incrustación más grande para la destilación de conocimiento; los tres modelos se publican bajo la licencia MIT.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.
Comentar
0/400
Sin comentarios