LongCat-2.0 : modèle open source formé sur puces chinoises

Le 30 juin 2026, Meituan — le géant chinois de la livraison et des services locaux — a ouvert le code source de LongCat-2.0, un modèle de langage de 1,6 trillion de paramètres. La révélation contient un rebondissement : depuis deux mois, ce même modèle opérait anonymement sous l'alias Owl Alpha sur OpenRouter, occupant la première position des classements de performance pour les développeurs sans que personne ne sache d'où il venait.

Ce qui distingue LongCat-2.0 de presque tous ses concurrents est son histoire de fabrication : la totalité de l'entraînement a été réalisée sur des puces chinoises, sans aucun composant américain. À l'heure où les contrôles à l'exportation américains sur les GPU Nvidia A100 et H100 font l'objet d'une attention croissante, ce résultat change la donne sur ce que la Chine peut produire avec ses propres ressources matérielles.

Pour les équipes techniques françaises, trois questions pratiques se posent immédiatement : ce modèle peut-il remplacer GPT-5.5 ou Claude Sonnet 5 sur les tâches de codage ? La licence MIT autorise-t-elle un usage commercial sans restriction ? Et quels risques géopolitiques ou réglementaires faut-il anticiper avant d'intégrer un modèle d'origine chinoise dans votre SI ?

Qu'est-ce que LongCat-2.0 ?

LongCat-2.0 est un modèle MoE (Mixture-of-Experts) de 1,6 trillion de paramètres, avec environ 48 milliards de paramètres activés par token (la plage dynamique va de 33 à 56 milliards selon la complexité de la requête). Cette architecture permet de combiner la capacité d'un très grand modèle avec les coûts d'inférence d'un modèle de taille intermédiaire.

Ses caractéristiques clés :

Fenêtre de contexte native de 1 million de tokens, ce qui le place au niveau de Gemini 1.5 Pro et au-dessus de la plupart des modèles open source concurrents.
Licence MIT, la plus permissive possible : usage commercial autorisé, modifications sans obligation de divulgation, intégration dans des produits propriétaires sans restriction.
Spécialisation codage et agents : Meituan l'a conçu comme un « cerveau » pour des agents autonomes de développement — édition de dépôts entiers, exécution de tâches multi-étapes, compréhension de bases de code larges.
Tarification API : environ 0,75 $ par million de tokens en entrée et 2,95 $ en sortie au tarif standard. Au lancement, une promotion divise ces prix par 2,5 (0,30 $ / 1,20 $), ce qui le place sous le prix de Claude Sonnet 5 et de GPT-5.5 sur des volumes équivalents.

Le modèle est disponible sur Hugging Face (comme d'autres modèles open source que nous avons analysés), et via l'API officielle de Meituan.

L'exploit technique : formé sans puce américaine

LongCat-2.0 a été entraîné de zéro sur un cluster de 50 000 puces Ascend 910 de Huawei, le processeur IA domestique le plus avancé de Chine. Aucun GPU Nvidia, aucun composant soumis aux contrôles à l'exportation américains n'a été utilisé — ni pour le pré-entraînement, ni pour l'inférence.

Ce point mérite d'être précisé : même DeepSeek V4-Pro, pourtant salué comme un exemple de l'efficacité chinoise en IA, avait eu recours à des puces occidentales pour la phase de pré-entraînement, n'utilisant les puces domestiques que pour l'inférence. LongCat-2.0 va un cran plus loin en revendiquant une chaîne complète sans dépendance matérielle externe.

Pour y parvenir, Meituan a développé des optimisations propriétaires au niveau du parallélisme (distribution du calcul sur les 50 000 puces) et s'est appuyé sur la bibliothèque HCCL (Huawei Collective Communication Library), l'équivalent maison de NCCL de Nvidia.

Ce que ça signifie au-delà du cas Meituan

L'enjeu n'est pas que Meituan. C'est que, malgré plusieurs années de restrictions sur les exportations de puces GPU avancées vers la Chine, il existe désormais un modèle public, auditable, aux performances comparables aux meilleurs modèles occidentaux, développé intégralement avec des ressources chinoises. Les contrôles à l'exportation n'ont pas produit l'écart de capacité escompté — du moins sur les tâches de codage.

Pour les entreprises européennes qui réfléchissent à leur stratégie logicielle à long terme, cette réalité redessine le paysage des fournisseurs disponibles, indépendamment de toute considération géopolitique : l'offre de modèles frontier open source ne se résume plus à des acteurs américains.

Performances et benchmarks

Sur SWE-bench Pro — la référence industrielle pour évaluer la résolution autonome de bugs sur de vrais dépôts GitHub — LongCat-2.0 obtient 59,5 %, contre 58,6 % pour GPT-5.5 et des scores comparables à Claude Sonnet 5 selon les benchmarks publiés par Meituan.

Points de nuance importants :

Ces chiffres sont publiés par Meituan elle-même — une validation indépendante par des tiers est encore en cours au moment de la publication de cet article.
SWE-bench Pro mesure la résolution de problèmes de codage sur des dépôts réels, ce qui est nettement plus représentatif que les benchmarks académiques classiques. Mais il ne couvre pas toutes les dimensions d'un modèle : raisonnement général, multilingue, sécurité, etc.
La fenêtre de contexte d'un million de tokens est un avantage réel sur les tâches qui impliquent de parcourir de grands dépôts ou de longues conversations de debugging.

En pratique, pour une équipe qui utilise un agent de codage connecté à ses dépôts, LongCat-2.0 se présente comme une alternative crédible aux modèles propriétaires sur la dimension purement technique. La question n'est pas uniquement de savoir s'il performe aussi bien, mais dans quelles conditions et avec quelles contraintes organisationnelles.

Licence MIT : ce que ça ouvre concrètement

La licence MIT autorise un usage commercial complet, sans obligation de publier vos modifications ni de mentionner LongCat-2.0 dans votre produit final. Concrètement, une DSI peut embarquer le modèle dans un outil interne, un éditeur de logiciels peut l'intégrer à son produit SaaS, et une PME peut s'en servir comme base d'un assistant propriétaire — le tout sans frais de licence et sans contrainte légale liée au modèle lui-même.

Auto-hébergement et RGPD

La licence MIT ouvre également la voie à l'auto-hébergement complet, ce qui est le seul moyen de garantir que vos données ne transitent pas vers des serveurs tiers. Pour les organisations traitant des données sensibles (données médicales, données financières, informations contractuelles), c'est souvent la condition sine qua non d'une adoption.

L'auto-hébergement d'un modèle de 1,6 trillion de paramètres reste techniquement exigeant : en mode complet, il requiert plusieurs centaines de Go de VRAM. En pratique, la plupart des équipes utiliseront une version quantisée (4 ou 8 bits) qui divise les besoins par 4 à 8 au prix d'une légère dégradation des performances, ou s'appuieront sur un fournisseur d'infrastructure spécialisé qui héberge déjà le modèle.

Pour une PME ou une ETI, l'arbitrage se résume souvent à : coût de l'API Meituan × volume de tokens versus coût de l'infrastructure d'hébergement. Sur des volumes modérés, l'API reste moins chère. Sur des volumes élevés avec des contraintes de confidentialité fortes, l'auto-hébergement devient pertinent.

Quatre points de vigilance avant d'adopter

LongCat-2.0 est techniquement solide et la licence est excellente. Mais avant d'en faire un composant critique de votre infrastructure, quatre questions méritent une réponse claire.

1. Risque juridictionnel et accès aux données via l'API

Meituan est une société cotée à Hong Kong, soumise au droit chinois. Si vous utilisez l'API cloud de Meituan, vos données de requêtes transitent par des serveurs soumis à cette juridiction. Selon la nature de vos données et votre secteur d'activité, cela peut être incompatible avec le RGPD ou avec vos propres politiques de conformité. Ce risque disparaît en cas d'auto-hébergement, mais il convient de le clarifier avant tout pilote.

2. Auditabilité des données d'entraînement

Meituan a publié les poids du modèle, mais pas le détail exhaustif des données d'entraînement. Pour des équipes travaillant sur des domaines réglementés (santé, finance, droit), la question de ce sur quoi le modèle a été entraîné est pertinente, notamment pour évaluer les biais potentiels ou les risques de génération de contenus non conformes.

3. Risque de restriction réglementaire future

L'Union européenne surveille de près les fournisseurs d'IA issus de pays tiers, notamment dans le cadre de l'AI Act et des discussions sur la souveraineté technologique. Un modèle dont l'éditeur est soumis à une juridiction non européenne n'est pas interdit à ce stade, mais la trajectoire réglementaire est incertaine. Miser sur LongCat-2.0 comme infrastructure critique sur 3-5 ans comporte ce risque-là.

4. Dépendance à un écosystème de support limité

Contrairement à OpenAI, Anthropic ou Mistral, Meituan n'est pas un éditeur d'IA dont c'est le cœur de métier. L'engagement sur la durée (mises à jour, correctifs de sécurité, documentation) est moins établi. Pour une automatisation métier critique, ce facteur compte autant que la performance brute sur les benchmarks.

FAQ — Meituan open-source LongCat-2.0 : le modèle de codage qui devançait GPT-5.5 en silence depuis deux mois — formé entièrement sur puces chinoises

Qu'est-ce que LongCat-2.0 exactement ?

LongCat-2.0 est un modèle de langage open source de 1,6 trillion de paramètres (architecture MoE avec environ 48 milliards actifs par token), publié par la société chinoise Meituan le 30 juin 2026 sous licence MIT. Il dispose d'une fenêtre de contexte native d'un million de tokens et est conçu principalement pour les tâches de codage et les agents autonomes.

LongCat-2.0 peut-il être utilisé commercialement sans restriction ?

Oui. La licence MIT autorise un usage commercial complet : vous pouvez l'intégrer dans un produit propriétaire, le modifier sans obligation de publier vos changements, et le redistribuer. La seule obligation formelle est de conserver l'avis de copyright original dans la documentation.

Comment LongCat-2.0 se compare-t-il à GPT-5.5 sur le code ?

Selon les résultats publiés par Meituan, LongCat-2.0 obtient 59,5 % sur SWE-bench Pro contre 58,6 % pour GPT-5.5. Cet écart est faible et les chiffres émanent de l'éditeur lui-même. Une validation indépendante est en cours. Sur la pratique quotidienne, les deux modèles sont dans la même gamme de performance pour le codage agentic.

Utiliser l'API LongCat-2.0 est-il compatible avec le RGPD ?

L'utilisation de l'API cloud de Meituan soulève des questions de conformité RGPD : vos données transitent vers des serveurs soumis à la juridiction chinoise, sans accord de traitement des données équivalent au standard EU. La solution la plus propre pour les données sensibles est l'auto-hébergement, qui élimine ce risque. Consultez votre DPO avant tout pilote impliquant des données personnelles.

Est-il réaliste d'auto-héberger LongCat-2.0 pour une PME ?

En version complète, LongCat-2.0 nécessite plusieurs centaines de Go de VRAM, ce qui est hors de portée directe pour la plupart des PME. En version quantisée 4 bits, les besoins descendent à 50-80 Go de VRAM, accessibles sur des serveurs GPU loués. Des fournisseurs cloud comme RunPod ou Together AI hébergent déjà des versions prêtes à l'emploi, ce qui simplifie le déploiement.

LongCat-2.0 était-il connu avant le 30 juin 2026 ?

Non, sous ce nom. Le modèle opérait depuis deux mois sur la plateforme OpenRouter sous l'alias « Owl Alpha », en tête des classements de performance pour les développeurs, sans que son identité soit connue. Le 30 juin 2026, Meituan a levé l'anonymat en publiant les poids sous licence MIT.

Meituan open-source LongCat-2.0 : le modèle de codage qui devançait GPT-5.5 en silence depuis deux mois — formé entièrement sur puces chinoises