Aller au contenu principal

Les LLM

LLM est l'acronyme de Large Language Model.

Qu'est-ce qu'un LLM ?

Par analogie, on peut comparer un LLM à un documentaliste - écrivain public avec une encyclopédie. On peut lui poser des questions, et en fonction de ce qui est écrit dans son dictionnaire, il va vous répondre et vous pouvez entamer une discussion avec lui et il vous répond. Le LLM peut être multi-langue, c'est à dire qu'on peut lui poser des questions en français, en anglais ou dans d'autres langues et il répond plus ou moins bien dans la langue demandée en fonction de ce qui est écrit dans son encyclopédie.

D'un point de vue technique, un LLM est une somme de connaissance entrainée qui sait deviner les caractères à afficher selon les questions que vous lui posez. C'est très étonnant car donne l'impression qu'i y a une intelligence, mais elle n'est qu'artificielle.

pourquoi plusieurs LLM ?

Il y a plusieurs LLM comme il y a plusieurs encyclopédie. Chaque éditeur de LLM essai de faire le meilleur selon ses critères. certains répondent plus rapidement aux questions, d'autres maîtrisent mieux le français et mes données qui les composent varient aussi d'un LLM à l'autre.

Ils sont également entrainés de façon différentes, donc même si deux LLM partaient de la même base de connaissance, la façon dont ils sont entrainés les rendra différents.

Cela permet à certains LLM d'être spécialisés dans l'assistance à la programmation, dans le droit ou dans la résolution de problèmes mathématiques.

combien en existe-t-il ?

sur le site Ollama.com, il existe plus d'une centaine de LLM. Il y a ceux qui sont officiellement affichés sur le site et ceux qui sont mis à disposition par des utilisateurs d'Ollama et qu'on ne retrouve qu'en faisant une recherche. Tout ceux-là s'installent très facilement.

sur le site Hugging face, il en existe des centaines de milliers, mais qui sont dans des formats pas directement exploitables par Ollama, il faut les importer au paravents comme expliqué ici et là.

combien de variations de chaque LLM ?

En plus d'être très nombreux, chaque LLM est disponible en plusieurs variations. La première consiste dans le corpus utilisé. Par exemple le modèle Llama3.1 exite dans une version 8B qui prend 8 Go en mémoire vive et dans une version 70B qui utilise 70 Go de mémoire vive et donc qui nécessite un ordinateur avec plus de mémoire pour le faire tourner. La version 70B est moins rapide, mais plus précise dans ses réponses. Llama3.1 est aussi disponible dans une version 240B qui nécessite 240 Go pour le faire tourner ce qui n'est pas possible sur un seul mac à date, il faut donc plusieurs Mac en cluster pour faire tourner ce modèle.

Si on privilégie la qualité des réponses, il est préférables d'utiliser un LLM plus puissant, s'il s'agit de réaliser des tâches plus simples, la version 8B est plus rapide et est suffisante.

Les modèles varient aussi

Comment choisir le LLM qui convient à chaque besoin ?