Google ha lanzado Gemini 2.5 Pro, su modelo de inteligencia artificial más avanzado hasta la fecha, diseñado para abordar tareas complejas con un mayor nivel de precisión y rendimiento optimizado. Este modelo, desarrollado por Google DeepMind, incorpora capacidades de razonamiento integradas que le permiten analizar información en profundidad, extraer conclusiones lógicas y tomar decisiones informadas antes de generar respuestas123.
Características clave de Gemini 2.5 Pro:
- Razonamiento avanzado: Supera los estándares habituales en matemáticas, ciencias e ingeniería de software, liderando en evaluaciones como GPQA y AIME 2025 45.
- Capacidades de programación: Destaca en la creación de aplicaciones web, edición de código y desarrollo de agentes autónomos, con un salto significativo respecto a su predecesor, Gemini 2.0 67.
- Multimodalidad: Puede procesar y comprender texto, audio, imágenes, vídeos y grandes conjuntos de datos, lo que lo hace ideal para proyectos complejos89.
- Contexto ampliado: Inicialmente maneja 1 millón de tokens, con planes de ampliar a 2 millones, permitiendo la gestión de información masiva y repositorios completos de código 56.
Gemini 2.5 Pro ya está disponible en Google AI Studio y en la aplicación de Gemini para usuarios de Gemini Advanced, con planes de integración en Vertex AI en el futuro cercano14. Este modelo representa un avance significativo en la capacidad de comprensión, razonamiento y generación de respuestas complejas, posicionándose como líder en el campo de la inteligencia artificial 23.
Gemini 2.5 Pro se posiciona como uno de los modelos de inteligencia artificial más avanzados en el mercado, superando a competidores clave en varias métricas de rendimiento. Aquí se presenta una comparativa detallada con otros modelos líderes:
Razonamiento y Conocimientos Generales
- El Último Examen de la Humanidad (sin herramientas): Gemini 2.5 Pro logra un 18.8%, superando a o3-mini (14%), Claude 3.7 (8.9%) y DeepSeek R1 (8.6%)1.
- GPQA Diamond (pass@1): Con un 84.0%, lidera sobre Grok 3 Beta (80.2%), o3-mini (79.7%) y Claude 3.7 Sonnet (78.2%)1.
Matemáticas y Lógica
- AIME 2024 (pass@1): Gemini 2.5 Pro alcanza un 92.0%, por encima de o3-mini (87.3%) y Grok 3 Beta (83.9%)1.
- AIME 2025 (pass@1): Con un 86.7%, supera a o3-mini (86.5%) y Grok 3 Beta (77.3%)1.
Programación
- LiveCodeBench v5: Obtiene un 70.4%, comparado con o3-mini (74.1%) y Grok 3 Beta (70.6%)1.
- SWE-bench Verificado: Con un 63.8%, está por debajo de Claude 3.7 (70.3%)1.
Comprensión Multimodal
- MMMU (pass@1): Gemini 2.5 Pro logra un 81.7%, superando a Grok 3 Beta (76.0%) y Claude 3.7 Sonnet (75%)1.
Ventana de Contexto
- Gemini 2.5 Pro maneja inicialmente 1 millón de tokens, con planes de ampliación a 2 millones, superando a modelos como GPT-4.5 y o3-mini en tareas que requieren contextos largos12.
En resumen, Gemini 2.5 Pro destaca en razonamiento, matemáticas y programación, aunque en algunas métricas de programación es superado por Claude 3.7. Su capacidad multimodal y ventana de contexto ampliada lo posicionan como un modelo líder en el mercado actual de IA123.
Google lanza Gemini 2.5 Pro