El Gemini 1.5 Pro es un modelo de inteligencia artificial multimodal desarrollado por Google, lanzado inicialmente el 24 de mayo de 2024 (versión estable inicial gemini-1.5-pro-001) y actualizado posteriormente el 24 de septiembre de 2024 (versión gemini-1.5-pro-002).
Este modelo destaca por su capacidad para procesar y comprender entradas de texto, código, imágenes, audio y video, incluyendo video con audio, y generar salidas de texto.
Una de sus características más destacadas es su habilidad para manejar contextos extensos, con un límite máximo de tokens de entrada significativamente amplio, lo que le permite analizar documentos largos, conversaciones extensas o fragmentos de código complejos.
Está especialmente optimizado para tareas que requieren un alto nivel de comprensión y razonamiento, como el análisis de documentos extensos, donde puede resumir información, extraer datos clave y responder preguntas complejas basadas en el contenido.
Además, es eficaz en tareas de razonamiento lógico y deductivo, generación de código complejo en múltiples lenguajes de programación, y en la comprensión de contenido multimodal, integrando información de diversas fuentes como texto, imágenes y video para ofrecer una visión holística de un tema.
La principal forma de acceder y utilizar Gemini 1.5 Pro es a través de la suscripción a Gemini Advanced. Esta suscripción ofrece acceso a modelos de IA más potentes, incluyendo Gemini 1.5 Pro con su ventana de contexto extendida de 1 millón de tokens.