El modelo de próxima generación de inteligencia artificial (IA) de Google, Gemini 1.5 se dio a conocer a finales del año pasado. En este sentido, la firma presentó para pruebas iniciales Gemini 1.5 Pro, un modelo multimodal de tamaño mediano que optimiza ciertas tareas.
Es decir, está diseñado para escalar una amplia gama de cargas de trabajo además funciona a un nivel similar al 1.0 Ultra, el modelo más grande de la firma. También introduce una característica experimental, la cual consiste en una mejorada comprensión de contextos.
Sin embargo, Gemini 1.5 Pro integra una ventana de contexto estándar de 128,000 tokens pero sólo está abierto a un grupo limitado de desarrolladores. Además, algunos clientes empresariales también tienen acceso, mediante AI Studio y Vertex AI en vista previa privada.
En términos generales, se trata de un modelo multimodal optimizado para escalar en una amplia gama de tareas utilizando menor capacidad de cómputo. Otro valor agregado, es la ventana de contexto ampliada que permite absorber, además de procesar más información.
A causa de esto, la plataforma brinda resultados más consistentes, relevantes y útiles, además de la inteligencia artificial de Gemini 1.5 Pro. Google anunció la disponibilidad general para clientes, de las versiones Gemini 1.0 Pro y Ultra, su modelo más avanzado.
La plataforma tiene la capacidad de analizar con precisión una biblioteca de código completa. Esto en un solo mensaje pero sin la necesidad de ajustar el modelo, adicionalmente incluye, tanto la comprensión como razonamiento sobre pequeños detalles.
Inteligencia artificial de Google evoluciona con Gemini 1.5 Pro
La nueva versión permite razonar documentos muy extensos, desde comparar detalles de contratos hasta resumir o analizar temas y opiniones. Tanto en informes de analistas, estudios de investigación e incluso series de libros y puede evaluar contenido en video.
Ya sea encontrar detalles específicos en imágenes deportivas u obtener información detallada de resúmenes de reuniones en video. Así, los chatbots pueden establecer conversaciones largas sin olvidar detalles, esto incluso atendiendo múltiples interacciones.
Por ello, es posible habilitar experiencias hiper personalizadas incorporando información relevante del usuario en el mensaje. Pero sin la complejidad de ajustar un modelo, además la “ventana contextual” está formada por tokens, componentes básicos de procesamiento.
Cuanto más grande sea la ventana de contexto de un modelo, más información podrá absorber y procesar en un mensaje determinado. A causa de esto, el modelo brinda un resultado más consistente, relevante y útil, ya sea una u once horas de contenido en video.
Los esfuerzos de perfeccionamiento y desarrollo del modelo de inteligencia artificial Gemini Pro 1.5 de Google se alínea con los principios de ética. Por su parte, la seguridad es otro aspecto clave de la iniciativa porque, se realizan investigaciones novedosas sobre riesgos.
Dichas iniciativas tienen como objetivo evaluar una variedad de daños potenciales. Finalmente Gemini 1.0 Pro, el mejor modelo para escalar tareas de IA, está disponible de forma general para clientes de Vertex AI y los desarrolladores pueden crear con Gemini Pro.