Hace unos días Google anunció emocionantes novedades en el campo de la inteligencia artificial, presentando PaliGemma y Gemma 2, junto con un kit de herramientas de IA responsable actualizado. Este lanzamiento, realizado por Tris Warkentin, Director de Gestión de Productos, Xiaohua Zhai, Científico Investigador Senior, y Ludovic Perán, Gerente de Producto, subraya el compromiso de Google con la innovación abierta y colaborativa en el desarrollo de soluciones de IA.
La familia Gemma: Innovación y colaboración
La respuesta de la comunidad a los modelos Gemma ha sido abrumadora, con millones de descargas en pocos meses. Los desarrolladores han utilizado estos modelos para crear una amplia gama de proyectos innovadores, como Navarasa, una variante multilingüe para lenguas índicas, y Octopus v2, un modelo de acción en dispositivos. Estas iniciativas han demostrado el potencial de Gemma para generar contenido impactante y accesible.
El desarrollo de CodeGemma, con sus capacidades avanzadas de generación y finalización de código, y RecurrentGemma, que ofrece eficiencias en inferencia e investigación, refleja el espíritu de exploración y creatividad que impulsa a la comunidad de desarrolladores.
Gemma 2: Rendimiento y eficiencia de próxima generación
Gemma 2, la próxima generación de modelos Gemma, se distingue por su arquitectura innovadora y su rendimiento eficiente. Con 27 mil millones de parámetros, Gemma 2 ofrece un rendimiento comparable al Llama 3 70B con menos de la mitad del tamaño, estableciendo un nuevo estándar en el panorama de los modelos abiertos.
Entre los beneficios de Gemma 2 se encuentran:
- Rendimiento líder en su clase: Gemma 2 destaca por su eficiencia revolucionaria, permitiendo un rendimiento superior con menos recursos.
- Costos de implementación reducidos: El diseño eficiente de Gemma 2 facilita su ejecución en GPU de NVIDIA y en un único host de TPU en Vertex AI, haciendo que la implementación sea más accesible y rentable.
- Cadenas de herramientas de ajuste versátiles: Gemma 2 proporciona capacidades robustas de ajuste en diversas plataformas y herramientas, garantizando una integración perfecta con Google Cloud, Axolotl, Hugging Face, NVIDIA TensorRT-LLM, JAX y Keras.
Presentamos PaliGemma: Modelo abierto de visión y lenguaje
PaliGemma es un potente modelo de visión y lenguaje (VLM) abierto, inspirado en PaLI-3. Construido con componentes abiertos, como el modelo de visión SigLIP y el modelo de lenguaje Gemma, PaliGemma está diseñado para ofrecer un rendimiento de ajuste fino líder en su clase en una amplia gama de tareas de visión y lenguaje. Estas tareas incluyen subtitulación de imágenes y videos cortos, respuesta visual a preguntas, comprensión de texto en imágenes, detección de objetos y segmentación de objetos.
PaliGemma está disponible en múltiples plataformas y recursos, incluyendo GitHub, Hugging Face models, Kaggle, Vertex AI Model Garden y ai.nvidia.com, con integración a través de JAX y Hugging Face Transformers. La integración con Keras estará disponible próximamente.
Ampliando el conjunto de herramientas de IA generativa responsable
Google también ha actualizado su kit de herramientas de IA generativa responsable, lanzando LLM Comparator en código abierto. Esta nueva herramienta interactiva y visual permite realizar evaluaciones efectivas en paralelo para evaluar la calidad y seguridad de las respuestas del modelo. LLM Comparator está diseñado para ayudar a los desarrolladores a crear aplicaciones de IA innovadoras y seguras.
A medida que Google continúa ampliando la familia Gemma de modelos abiertos, la empresa se mantiene dedicada a fomentar un entorno colaborativo donde la tecnología de inteligencia artificial de vanguardia y el desarrollo responsable vayan de la mano. La introducción de PaliGemma y Gemma 2, junto con el kit de herramientas de IA generativa responsable, promete impulsar nuevas innovaciones y aplicaciones seguras en el campo de la inteligencia artificial. Estamos emocionados de ver cómo la comunidad de desarrolladores utilizará estas herramientas para dar forma al futuro de la IA.