Qwen
Qwen est un modèle de langage large (LLM) développé par Alibaba, spécifiquement conçu pour répondre aux besoins des utilisateurs en Asie et dans d’autres régions nécessitant des capacités avancées en langues asiatiques et dans un contexte multiculturel. Ce modèle comprend et traite le mandarin, ainsi que de nombreux dialectes et langues asiatiques comme le cantonais, le japonais et le coréen, tout en étant optimisé pour l'anglais et d'autres langues occidentales. Qwen prend en charge plus de 29 langues, y compris le chinois, l'anglais, le français, l'espagnol, le portugais, l'allemand, l'italien, le russe, le vietnamien, le thaï et l'arabe.
Destiné aux applications commerciales, Qwen s'intègre dans des secteurs tels que le commerce en ligne, l’éducation et le service client, en offrant des fonctionnalités multilingues pour une gestion de contenu et des interactions clients adaptées à des nuances culturelles et linguistiques spécifiques. Grâce à ses capacités multimodales avancées, Qwen analyse aussi bien les images que les textes, enrichissant ainsi l'expérience des utilisateurs dans des contextes e-commerce ou de service client.
Qwen Coder Qwen propose également le modèle Qwen2.5 Coder Instruct en 0,5b pour faire de l'autocomplétion très rapidement, en 1.5b, 3b, 7b, 14b et 32b, qui se distinguent dans les tâches de génération et de réparation de code. Le modèle de 32 milliards de paramètres surpasse les performances des modèles open-source dans des benchmarks de génération de code comme EvalPlus, LiveCodeBench et BigCodeBench, et rivalise avec des modèles propriétaires tels que GPT-4o. En termes de réparation de code, Qwen2.5 Coder 32B dit atteindre un score remarquable de 73,7 sur le benchmark Aider, se positionnant ainsi au même niveau que des modèles de pointe.
Performance Multilingue et Préférence Humaine Qwen2.5 Coder 32B Instruct excelle dans plus de 40 langages de programmation, avec un score de 65,9 sur McEval, et montre des résultats particulièrement bons pour des langages tels que Haskell et Racket. En réparation de code, il atteint un score de 75,2 sur MdEval, marquant ainsi des performances de pointe. Enfin, pour aligner ses réponses sur les préférences humaines, Qwen utilise une évaluation interne appelée Code Arena, démontrant son efficacité en alignement de préférences face aux meilleurs modèles open-source.