La gran actualización de Google Gemini 3 Deep Think: capacidad de razonamiento aplasta a Opus 4.6, GPT-5.2, para convertirse en el "IA más orientada a la investigación"

動區BlockTempo
BTC-1,48%

Google lanza Gemini 3 Deep Think con una actualización importante, logrando un 84.6% en la prueba ARC-AGI-2, superando ampliamente a Claude Opus 4.6 (68.8%) y GPT-5.2 (52.9%), y alcanzando el nivel de «Maestro Legendario» en Codeforces.
(Resumen previo: Nace el modo de aprendizaje de ChatGPT: ¿el ocaso de los tutores o la aurora de una era dorada en la educación?)
(Información adicional: ¡Google lanza oficialmente «Gemini 3»! ¿Qué puntos destacados tiene para coronar el modelo de IA más inteligente del mundo?)

Índice del artículo

  • No solo aprueba exámenes, también detecta errores humanos
  • Cambios en la cuota de mercado
  • Efectos en la industria de las criptomonedas
  • La verdadera partida científica apenas comienza

Hoy (13) Google ha lanzado una importante actualización de Gemini 3 Deep Think. En la prueba ARC-AGI-2 (una evaluación de razonamiento diseñada para evitar trampas en bancos de preguntas de IA, que no mide cuánto sabes sino si puedes deducir reglas a partir de ejemplos), Gemini 3 Deep Think obtuvo un 84.6%.

Como referencia, Claude Opus 4.6 (modo Thinking Max) alcanzó un 68.8%, GPT-5.2 (modo Thinking xhigh) un 52.9%, y el promedio humano ronda el 60%.

Aún más sorprendente, en la versión original ARC-AGI-1, Deep Think logró un 96%, prácticamente llevando esta prueba, considerada una de las más difíciles para IA, a su límite máximo.

Actualmente, Deep Think está disponible para suscriptores de Google AI Ultra, y su API se ofrece en acceso temprano a empresas.

No solo aprueba exámenes, también detecta errores humanos

Más allá de los resultados, Google mencionó en su anuncio un detalle interesante: Deep Think, al revisar un artículo matemático sometido a revisión por pares humanos, logró identificar una laguna lógica que todos los revisores anteriores pasaron por alto. La confirmación vino de matemáticos de la Universidad Rutgers.

La importancia de este caso radica en que no se trata solo del rendimiento en pruebas estándar, sino de la capacidad en escenarios científicos reales y abiertos. La revisión por pares es uno de los mecanismos de control de calidad más fundamentales en la academia; si la IA puede ofrecer ayuda valiosa en este proceso de forma estable, su impacto en la aceleración de la investigación científica será mucho mayor que cualquier puntuación en tests.

Deep Think también alcanzó nivel de medalla de oro en las pruebas escritas de la Olimpiada Internacional de Física y Química 2025, y en Codeforces tiene un puntaje Elo de 3,455, equivalente a un nivel de «Maestro Legendario», una categoría alcanzada por muy pocos programadores humanos en todo el mundo.

En la «Última Prueba de la Humanidad» (Humanity’s Last Exam), diseñada por expertos en diferentes campos para ser difícil para la IA, Deep Think obtuvo un 48.4% (sin usar herramientas), estableciendo un nuevo récord.

Cambios en la cuota de mercado

La competencia entre los tres gigantes de la IA está transformando el mapa del mercado. La cuota de ChatGPT ha caído del 87% en su pico a aproximadamente el 68%, mientras Gemini ha subido de menos del 5% a más del 18%, y Claude de Anthropic continúa ganando terreno en el mercado empresarial.

La ventaja única de Google en esta carrera es su capacidad de distribución. Gemini está integrado en Android, Chrome, Google Workspace y en su motor de búsqueda, lo que significa que incluso si en capacidades de modelo está igualado con la competencia, Google puede captar usuarios a través de sus canales.

Pero la ventaja en distribución también es un arma de doble filo. Si la experiencia con Gemini no es buena, podría perder la confianza de los usuarios más rápidamente que cualquier competidor, ya que estos son «usuarios pasivos» que reciben la IA en lugar de elegirla activamente. Los usuarios de OpenAI, en cambio, pagan de forma activa y tienen mayor tolerancia y fidelidad.

Efectos en la industria de las criptomonedas

Cada actualización en la carrera armamentística de la IA aumenta la demanda de infraestructura computacional. El costo de entrenar un modelo de vanguardia ha pasado de cientos de millones de dólares en 2024 a varios miles de millones en 2026. Esto impacta directamente en dos aspectos:

Primero, la transformación de los mineros de Bitcoin. Cuando las ganancias de minería se reducen (JPMorgan estima que el costo de producción de BTC cayó a 77,000 dólares, mientras que el precio ronda los 66,000), los mineros con infraestructura a gran escala están acelerando su transición hacia servicios de computación de IA.

No es que abandonen, sino que cambian de actividad: de minar Bitcoin a ofrecer capacidad de cálculo mediante contratos de servicios de IA.

Segundo, la narrativa de los tokens de IA. Cada vez que Google, OpenAI o Anthropic lanzan una actualización importante, los tokens relacionados con IA en cadenas de bloques (como protocolos de computación descentralizada) suelen experimentar especulación a corto plazo.

Pero los fundamentos de estos tokens no cambian: la computación descentralizada todavía está lejos de satisfacer las necesidades de entrenamiento de IA a nivel empresarial en términos de latencia y throughput. La narrativa puede avanzar rápido, pero la infraestructura aún no acompaña ese ritmo.

La verdadera partida científica apenas comienza

La actualización de Deep Think ha puesto a Google nuevamente en la posición de liderazgo en la carrera de IA, al menos en razonamiento y ciencia. Pero si observamos cuidadosamente el lenguaje del anuncio, detectamos un cambio sutil en su enfoque: ya no se centra en ser «la IA más inteligente y general», sino en reiterar que «nació para la ciencia».

A medida que las pruebas de referencia de IA general se vuelven más saturadas y las diferencias más difíciles de distinguir, una propuesta de valor más convincente será «mi IA te ayuda en la investigación científica» en lugar de «mi IA obtiene las puntuaciones más altas». Si Deep Think logra apoyar de forma estable la revisión por pares, acelerar descubrimientos de medicamentos o encontrar soluciones que los humanos han pasado por alto en simulaciones físicas, eso tendrá un impacto mucho más profundo que cualquier lista de rankings.

El problema es que la distancia entre «obtener altas puntuaciones en pruebas de referencia» y «apoyar de forma confiable a los humanos en escenarios científicos reales» puede ser mayor de lo que Google insinúa, ya que las pruebas estándar tienen respuestas correctas, pero en ciencia no siempre es así.

Ver originales
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Irán anuncia "tránsito selectivo" en el Estrecho de Ormuz, Blinken declara la guerra: cambiaría 50 días de inflación estadounidense por 50 años de paz en Oriente Medio

El Ministerio de Asuntos Exteriores de Irán declaró que el Estrecho de Ormuz no está bloqueado, pero interceptará barcos estadounidenses e israelíes, lo que ha provocado un aumento vertiginoso de los precios del petróleo en el mercado y una revisión al alza de las expectativas de inflación. El Secretario del Tesoro de Estados Unidos indicó que el aumento de precios a corto plazo es el precio que se debe pagar por la paz a largo plazo en Oriente Medio. El mercado de criptomonedas también ha sufrido un fuerte golpe, con caídas significativas tanto en Bitcoin como en Ethereum.

動區BlockTempoHace19m

Mastercard gasta $1.8 mil millones en seguros de monedas estables, el rey de los pagos transfronterizos comienza a defenderse

Mastercard adquiere BVNK, empresa de infraestructura de stablecoins, por hasta 1.800 millones de dólares. Esta acción tiene como objetivo proteger su posición de mercado en transacciones transfronterizas, ya que los stablecoins amenazan el 37% de sus ingresos. BVNK ayudará a Mastercard a integrar pagos en stablecoins, mejorar la eficiencia de liquidación y reducir costos, además de abordar desafíos regulatorios. La experiencia del usuario podría permanecer sin cambios en el futuro, pero se espera que mejoren la velocidad de liquidación y los costos.

MarketWhisperhace1h

Hyperliquid supera la posición de precios de CME, el volumen de transacciones de materias primas en cadena supera los 173400 millones de dólares

El sector HIP-3 de Hyperliquid registró un volumen de transacciones de 143.9 mil millones de dólares en los últimos 7 días, impulsado principalmente por contratos de petróleo crudo WTI, demostrando una fuerte actividad del mercado. Bajo el impulso del conflicto entre EE.UU. e Irán, la funcionalidad de transacciones 24/7 de la plataforma la ha convertido en una fuente importante de descubrimiento de precios, sustituyendo a los intercambios tradicionales. Con la adaptación a la regulación de la CFTC, Hyperliquid se propone mantener la neutralidad financiera, pero el equilibrio entre los requisitos de cumplimiento y las ventajas del comercio descentralizado sigue siendo un desafío.

MarketWhisperhace1h

NYSE cancela límite de opciones de ETF de criptomonedas, entra en vigor estándar unificado en todas las bolsas estadounidenses

Las bolsas NYSE Arca y NYSE American del New York Stock Exchange han presentado cambios de reglas ante la Comisión de Bolsa y Valores de EE.UU. para eliminar los límites de posiciones abiertas en contratos de opciones de ETF de Bitcoin y Ethereum spot. Este cambio alinea las normas comerciales de ETF de criptomonedas con los estándares de otros ETF de productos básicos, y permite que las instituciones diseñen productos de opciones personalizados para expandir sus estrategias de mercado y capacidades de ejecución. De acuerdo con los estándares del mercado, los límites de posiciones abiertas para ETF grandes pueden superar 250000 contratos.

MarketWhisperhace1h

Reporte Diario Gate (23 de marzo): MicroStrategy publica señal de compra de Bitcoin; MakerDAO ETH vuelve a sufrir liquidación con pérdidas de 30.35 millones

El Bitcoin ha continuado cayendo recientemente a aproximadamente 67,950 dólares estadounidenses, y Michael Saylor, fundador de MicroStrategy, ha reiterado su estrategia de compra en las caídas. La posición de ETH con alto apalancamiento de Huang Lixuan fue completamente liquidada, con pérdidas superiores a 30.35 millones de dólares estadounidenses. Fidelity ha instado a la SEC estadounidense a mejorar el marco regulatorio de los activos criptográficos. El mercado de valores estadounidenses se ha desplomado en general, y el sentimiento del mercado sigue siendo cauteloso.

MarketWhisperhace1h

Alerta de Bajada de TradFi: AUDCAD (AUD/CAD) baja más del 0.5%

Gate News: según los últimos datos de Gate TradFi, AUDCAD (AUD/CAD) ha bajado un 0.5% en poco tiempo. La volatilidad actual es significativamente mayor que las medias recientes, lo que indica un aumento de la actividad del mercado.

GateNewshace1h
Comentar
0/400
Sin comentarios