Le dernier modèle d’IA d’OpenAI, GPT-5, lancé durant l’été 2025, enregistre une baisse notable dans le classement LMArena d’octobre. Cette évaluation, issue des votes des utilisateurs, révèle une dynamique concurrentielle intense. Anthropic, notamment avec ses modèles Claude et la gamme Gemini consolident leur position en tête.
L’arène des modèles de langage à grande échelle est en constante effervescence, marquée par l’arrivée de puissants outils comme GPT-5. Dévoilé avec une forte attente durant l’été 2025, ce nouveau produit d’OpenAI a rapidement été scruté par les utilisateurs et les experts. Le classement LMArena se basant sur le jugement direct du public, sert de baromètre pour mesurer la performance des IA sur le terrain.
Or, les données d’octobre 2025 indiquent un bouleversement inattendu dans la hiérarchie mondiale de l’IA générative. Alors que l’éditeur historique peine à maintenir son rang, d’autres compétiteurs (Anthropic, Google) tirent leur épingle du jeu, redéfinissant la performance selon une évaluation participative et en temps réel.
Anthropic et Google dominent le classement général de la LMArena
En octobre 2025, cette méthode met en lumière la dégringolade continue de GPT-5. Après avoir occupé la sixième place le mois précédent, le modèle d’OpenAI chute de deux rangs pour se retrouver en huitième position. Ce recul peut ne pas échapper aux professionnels en statut freelance, souvent attentifs à la fiabilité des outils à utiliser.
Cette rétrogradation est d’autant plus significative que GPT-5 se voit dépassé non seulement par les offres concurrentes, mais également par ses propres versions antérieures. Les modèles GPT-4.5 Preview (4e) et ChatGPT-4o (5e) se classent devant la nouvelle itération.
Anthropic s’installe solidement en première et deuxième positions avec deux de ses modèles Claude. Google complète le trio de tête grâce à sa solution Gemini 2.5 Pro. Le classement démontre une emprise majoritaire des acteurs américains, à l’exception d’une seule entrée asiatique.
Voici les 10 modèles d’IA les mieux notés en octobre 2025 :
- – Claude Opus 4.1 « thinking » (Anthropic)
- – Claude Sonnet 4.5 « thinking » (Anthropic)
- – Gemini 2.5 Pro (Google)
- – GPT-4.5 Preview (OpenAI)
- – ChatGPT-4o (OpenAI)
- – Claude Opus 4.1 (Anthropic)
- – Claude Sonnet 4.5 (Anthropic)
- – GPT-5 « high » (OpenAI)
- – o3 (OpenAI)
- – Qwen3 Preview (Alibaba)
En dehors des États-Unis, seulement deux autres acteurs parviennent à se signaler dans le classement général. Le modèle chinois Qwen3 d’Alibaba réussit à se hisser à la dixième place. Un autre modèle de Chine, DeepSeek, se positionne plus loin, au 16e rang, tandis que la solution française de Mistral AI occupe la 34e place.
La performance des modèles variée selon les tâches spécifiques
Au-delà du classement général, LMArena propose diverses performances selon des capacités distinctes, offrant un aperçu des forces et faiblesses de chaque modèle. Une donnée précieuse pour les professionnels en statut freelance, souvent amenés à choisir l’IA la plus adaptée à leurs missions.
Dans la production de contenu textuel, Google conserve sa suprématie : Gemini 2.5 Pro se maintient en tête, suivi des deux déclinaisons « thinking » de Claude. À l’inverse, l’outil GPT-5 ne parvient qu’au huitième rang, dominé par trois modèles plus anciens d’OpenAI. Pour la recherche web, Grok-4 s’impose, devançant Gemini 2.5 Pro et o3, tandis que le spécialiste Perplexity chute à la cinquième position.
Curieusement, GPT-5 obtient sa seule première place dans la catégorie du développement web. La version « high » du modèle d’OpenAI est leader, s’imposant face à trois solutions d’Anthropic. Pour la création d’images à partir de texte, c’est Tencent qui crée la surprise, devançant Google dans cette catégorie.
|
Capacité spécifique |
Modèle en première position |
Place de GPT-5/GPT Image |
|
Développement web |
GPT-5 « high » (OpenAI) |
1ère place |
|
Génération d’images (text-to-image) |
Hunyuan Image 3.0 (Tencent) |
GPT-Image est 7ème |
|
Génération de texte |
Gemini 2.5 Pro (Google) |
8ème place |
|
Recherche web |
Grok-4 |
N/A (o3 est 3ème) |
Cet article vous a-t-il été utile ?
Note moyenne 0 / 5. Votants: 0
