Alibaba présente HappyHorse-1.0, un autre modèle multimodal à venir
Le 10 avril, Alibaba a officiellement annoncé sur les réseaux sociaux que HappyHorse est son produit de modèle multimodal développé en interne, précisant en même temps que tous les noms de domaine associés circulant sur Internet ne sont pas des sites officiels. Par la suite, la plateforme d’évaluation IA tierce Artificial Analysis a annoncé que l’interface API du modèle HappyHorse prévoyait de s’ouvrir officiellement au public le 30 avril.
Contexte de R&D du modèle et affiliation de l’équipe
Selon des sources proches d’Alibaba chez Yicai “Neocortex”, HappyHorse-1.0 a été développé par l’équipe de l’ancien Laboratoire de Vie Future appartenant au Groupe Taobao Tmall. Dans le dernier cycle de restructuration organisationnelle d’Alibaba, cette équipe a été intégrée au nouveau groupe d’entreprises Alibaba Token Hub (ATH), sous la direction de la “Division Innovation IA”.
La source a également révélé que HappyHorse-1.0 n’est que le premier produit de la matrice de modèles multimodaux développés en interne par l’équipe, et qu’Alibaba lancera prochainement un autre modèle multimodal avec un positionnement différent pour former une gamme de produits avec HappyHorse-1.0.
Performances impressionnantes lors de l’évaluation
La semaine dernière, HappyHorse-1.0 est apparu pour la première fois dans le test de vote anonyme de la plateforme d’évaluation tierce Artificial Analysis. Dans le test à l’aveugle où les utilisateurs ne connaissaient pas l’identité du modèle, HappyHorse-1.0 a reçu plus de votes de préférence des utilisateurs que Seedance 2.0 de ByteDance et Kling 3.0 de Kuaishou parmi les modèles de génération de vidéo.
Performances spécifiques :
- Génération de vidéo pure (sans audio) : HappyHorse-1.0 présente des avantages significatifs, avec des votes d’utilisateurs dépassant largement ceux des concurrents
- Génération intégrée audio et vidéo : Les performances sont comparables à celles de Seedance 2.0, le plaçant dans le premier peloton de l’industrie
Avant cela, la R&D des modèles de génération de vidéo d’Alibaba était principalement dirigée par l’équipe Wanxiang du Laboratoire Tongyi, qui vient d’être promue Division des Modèles à Grande Échelle Tongyi le 8 avril. Le lancement de HappyHorse-1.0 marque que la “Division Innovation IA” est devenue une autre équipe de R&D de modèles multimodaux très compétitive au sein du groupe ATH d’Alibaba.
Stratégie de code fermé et concurrence industrielle
Selon les informations, HappyHorse-1.0 ne sera pas open source pour le moment, ce qui est cohérent avec la stratégie globale d’Alibaba qui passe progressivement au code fermé pour ses modèles ces derniers temps. Depuis fin mars, des produits comme le modèle multimodal complet Qwen3.5-Omni, le premier modèle de la série Qwen3.6 Qwen3.6-Plus, et le modèle de génération de vidéo Wan2.7-Video publiés par Alibaba ne sont pas open source.
Auparavant, Alibaba n’adoptait une stratégie de code fermé que pour sa série Max, les modèles les plus performants, que les utilisateurs ne pouvaient pas déployer indépendamment et devaient payer via des appels API. Cette stratégie s’étend maintenant à d’autres versions en dehors de la série Max, indiquant un ajustement stratégique d’Alibaba dans la commercialisation de l’IA.
L’amélioration des capacités multimodales est l’une des priorités stratégiques actuelles d’Alibaba. Pendant la Fête du Printemps 2026, le modèle de génération de vidéo Seedance 2.0 lancé par ByteDance a été très bien accueilli par le marché, étant décrit par les médias étrangers comme un modèle IA chinois qui “met Hollywood en panique”. Des sources proches d’Alibaba ont révélé que le lancement de ce produit de ByteDance a surpris l’équipe interne d’Alibaba, car lors de la conférence annuelle de Volcano Engine en décembre dernier, le modèle de base Seed1.8 et le modèle de génération de vidéo Seedance 1.5 pro présentés par Byte n’avaient pas de performances exceptionnelles. La mise à jour principale de Seedance 1.5 pro était le lancement de la fonction de “génération intégrée audio et vidéo”, une capacité qu’Alibaba avait déjà implémentée dans Wan2.5, publié en septembre dernier.
Évolution du paysage du marché
Par rapport aux modèles de chat textuel pur, la génération multimodale consomme plus de ressources informatiques et de Tokens, ce qui affectera directement la part de marché des fournisseurs de services de cloud computing sur le marché du MaaS (Modèle en tant que Service). Selon les données publiées par IDC, Volcano Engine occupait déjà 49,2% de la part du marché chinois du MaaS au premier semestre 2025, tandis que la part de marché d’Alibaba Cloud était de 27%.
Le lancement de la série de modèles HappyHorse deviendra une matrice de produits importante pour qu’Alibaba se dispute le marché avec ses concurrents dans le domaine de l’IA multimodale.
Découvrez les capacités de génération IA de HappyHorse
Vous pouvez dès maintenant tester directement les puissantes capacités de génération de vidéo du modèle HappyHorse sur notre plateforme, sans attendre l’ouverture de l’API.