Gemma

Gemma est le modèle de langage large (LLM) de Google, conçu pour offrir une intelligence conversationnelle avancée accessible gratuitement. Comme Llama, il est destiné aux chercheurs, aux développeurs et aux entreprises qui cherchent à intégrer une IA performante sans coûts d'accès prohibitifs.

Gemma a été lancé avec l’objectif de rendre l’intelligence artificielle plus ouverte et collaborative. Bien que Google possède déjà d’autres IA, Gemma se distingue par son orientation open-source, permettant aux utilisateurs de personnaliser et de déployer le modèle selon leurs besoins spécifiques, tout en bénéficiant d’améliorations constantes de la communauté.

Google a mis en avant la capacité de Gemma à traiter des tâches variées avec une flexibilité et une précision remarquables. Les versions de Gemma sont entraînées sur des données récentes et diversifiées, optimisées pour la compréhension du contexte, la génération de texte créatif et la réponse aux questions complexes. Pour assurer une grande accessibilité, Google propose Gemma en plusieurs tailles, adaptées aux différentes capacités de traitement, de l’ordinateur personnel aux infrastructures de serveurs robustes.

Le développement de Gemma a été conçu pour un usage modulable et ouvert aux intégrations d'outils extérieurs. Comme les modèles "Tool" d'Ollama, Gemma peut également se connecter à des services externes pour offrir des réponses enrichies et adaptées à des situations en temps réel. Par exemple, grâce à cette capacité d'intégration, il est possible pour Gemma de donner des recommandations d’activités adaptées à la météo locale ou de répondre à des requêtes spécifiques nécessitant des mises à jour régulières, comme les nouvelles ou les informations de circulation.

Avec Gemma, Google vise à étendre l’accessibilité et la capacité d’innovation en matière d’IA conversationnelle, offrant un outil gratuit, flexible, et particulièrement utile pour les développeurs, les créateurs et les entreprises de toutes tailles.

Pour plus de détails sur Gemma, vous pouvez consulter la documentation officielle de Google.

Google offre également des formations sur l'intelligence artificielle en français sur cette page

En plus de Gemma, Google promose le modèle Gemini qui est gratuit dans l'interface studio si vous avez un compte Google Workspace. Google annonce en décembre 2024 que le modèle Gemini-exp-1206 obtient le meilleur score dans toutes les catégories. Ce modèle à un "Context size" de plus de 2 millions de tokens et peut analyser jusqu'à une heure de vidéo depuis ce lien.

Vous avez des prompts qui vous permettent de faire les requêtes les plus courantes :

A/V captions qui signifie "Audio/Visual captions" et cela fait référence aux sous-titres ou légendes générés pour décrire chaque scène de la vidéo chargée. Paragraph donne un court descriptif du déroulé de la vidéo. Key moments donne un récapitulatif des moments clés de la vidéo. Table donne ce récapitulatif sous forme d'un tableau. Chart graphique des moments les plus intéressant de la vidéo.