HappyHorse
بلاگ

HappyHorse بر رتبه‌بندی جهانی تسلط یافت و در ۲۷ آوریل راه‌اندازی می‌شود! این اسب سیاه هوش مصنوعی در آستانه ورود به بازار است

تیم HappyHorse
HappyHorse بر رتبه‌بندی جهانی تسلط یافت و در ۲۷ آوریل راه‌اندازی می‌شود! این اسب سیاه هوش مصنوعی در آستانه ورود به بازار است

راه‌اندازی رسمی HappyHorse 1.0

HappyHorse-1.0 برای آزمایش API در ۲۷ آوریل ۲۰۲۶ برنامه‌ریزی شده است

در اوایل این ماه، مدلی با نام رمز HappyHorse به طور ناگهانی در دنیای تولید ویدیو با هوش مصنوعی ظاهر شد. این مدل به صورت ناشناس در چندین بنچمارک معتبر شرکت کرد و بر رتبه‌بندی‌ها تسلط یافت. در ۱۰ آوریل، Alibaba ATH به طور رسمی آن را معرفی کرد: HappyHorse پروژه مدل بزرگ ویدیویی چندوجهی آن‌هاست که توسط بخش نوآوری ATH رهبری می‌شود و توسط تیم‌های Tongyi Lab و Taobao Technology به طور مشترک توسعه یافته است.

اکنون این “اسب سیاه” سرانجام هویت خود را فاش کرده است — در ۲۷ آوریل ۲۰۲۶، HappyHorse-1.0 آزمایش API را از طریق پلتفرم Bailian Alibaba Cloud باز خواهد کرد و به طور رسمی وارد مرحله حیاتی پیش از تجاری‌سازی خواهد شد.


از تسلط ناشناس تا شناسایی رسمی

با نگاهی به گذشته، ظهور HappyHorse واقعاً دراماتیک بوده است:

زمانرویداد
اوایل آوریلمدل ناشناس HappyHorse در رتبه‌بندی آزمون کور جهانی Artificial Analysis AI Video Arena ظاهر شد
متن به ویدیو (T2V)Elo ۱۳۵۷، رتبه اول، Seedance 2.0 را با اختلاف نزدیک به ۶۰ امتیاز شکست داد
تصویر به ویدیو (I2V)رکورد تاریخی بالاترین امتیاز Elo ۱۴۰۶ را ثبت کرد
۱۵ آوریلدوباره در رتبه‌بندی ویرایش ویدیوی LM Arena اول شد
۱۷ آوریلدر هر دو رتبه‌بندی T2V و I2V LM Arena در جایگاه برتر ۲
۱۰ آوریلAlibaba ATH به طور رسمی HappyHorse را معرفی کرد

تسلط پیوسته در آزمون‌های کور ثابت می‌کند که کیفیت تولید HappyHorse مقابل سخت‌ترین مقایسه‌ها دوام می‌آورد. بدون حمایت برند، بدون شهرت تاریخی — تنها خود تصاویر هستند که به طور مداوم آرای ارزیابان را به دست می‌آورند. این نیروی فنی محکمی است.


یک مدل برای صدا و ویدیو: نمای کلی معماری

HappyHorse-1.0 به عنوان “ابزار همه‌کاره تولید ویدیوی دوستانه سازنده” موقعیت‌یابی شده است. فلسفه اصلی آن را می‌توان در سه کلمه خلاصه کرد: یکپارچگی.

سه حالت تولید

  • متن → ویدیو (T2V)

    یک توصیف به زبان طبیعی وارد کنید و مستقیماً ویدیوی سینمایی ۱۰۸۰P (۴–۱۲ ثانیه) دریافت کنید. نور، حرکت و روابط فضایی با دقت قابل توجهی بازتولید می‌شوند.

  • تصویر → ویدیو (I2V)

    یک تصویر یا چند تصویر آپلود کنید تا کلیپ‌های پویا و منسجم تولید شوند. درک معنایی قوی، انتقال حرکات طبیعی و چشمک‌زدن بسیار کم.

  • تولید مشترک بومی صدا-ویدیو

    این قابلیت تمایزدهنده‌ترین ویژگی HappyHorse است. در یک Transformer تک‌لایه ۴۰ لایه‌ای، تصاویر + جلوه‌های صوتی / صداگذاری / همگام‌سازی لب را به طور همزمان تولید می‌کند و از ۷ زبان پشتیبانی می‌کند. نیازی به ترکیب صدا-تصویر پس از تولید نیست — یک مرحله، خروجی نهایی.

مشخصات فنی کلیدی

شاخصمشخصه
تعداد کل پارامترها۱۵B (۱۵ میلیارد)
معماریTransformer یکپارچه، خودتوجه تک‌جریانی
تکنیک تقطیرDMD-2، فقط ۸ مرحله حذف نویز
رزولوشن خروجی۱۰۸۰P پایدار
نسبت‌های تصویر پشتیبانی‌شده۱۶:۹، ۹:۱۶ و سایر نسبت‌های اصلی
زبان‌های Promptپشتیبانی دوزبانه چینی و انگلیسی

۱۵ میلیارد پارامتر یکپارچه برای چهار حالت متن، تصویر، ویدیو و صدا، به همراه تقطیر DMD-۲ که نمونه‌برداری را به ۸ مرحله فشرده می‌کند — این دو تصمیم طراحی مستقیماً سرعت تولید و سازگاری صدا-تصویر HappyHorse را تعیین می‌کنند.


زمان‌بندی راه‌اندازی: آزمایش سازمانی در آوریل، تجاری در مه

بر اساس جدول زمانی رسمی منتشرشده:

نقطه عطفبرنامه
۲۷ آوریل ۲۰۲۶پلتفرم Bailian Alibaba Cloud آزمایش API را باز می‌کند
موج اولمشتریان سازمانی، توسعه‌دهندگان و آزمایش دعوت‌نامه‌ای
مه ۲۰۲۶انتشار رسمی نسخه تجاری

برای سازندگان و توسعه‌دهندگان، باز شدن آزمایش API در ۲۷ آوریل یک پنجره کلیدی است. می‌توانید از قبل یکپارچه‌سازی کنید، گردش کار را تأیید کنید و برای تجاری‌سازی در مه آماده شوید.


این برای سازندگان چه معنایی دارد؟

تجاری‌سازی HappyHorse-1.0 را می‌توان به سه تأثیر عملی برای تولیدکنندگان محتوا، طراحان، ویراستاران و برندها خلاصه کرد:

موانع کمتر: یک جمله یا یک تصویر تبدیل به کلیپ کوتاه با کیفیت بالا می‌شود — نیازی به مهارت‌های پیچیده مدل‌سازی، رندرینگ یا ویرایش نیست.

گردش کار سریع‌تر: بخش قابل توجهی از زمان مدل‌سازی، رندرینگ، صداگذاری و ویرایش در تولید ویدیوی سنتی را حذف می‌کند. چرخه از ایده تا نسخه نهایی به طور چشمگیری کوتاه می‌شود.

هزینه‌های کنترل‌شده: تیم‌های کوچک و حتی سازندگان فردی می‌توانند محتوای ویدیویی با کیفیتی نزدیک به “سطح سینمایی” تولید کنند بدون تجهیزات گران‌قیمت یا مجوز نرم‌افزاری.


همین الان امتحان کنید

اگر می‌خواهید قبل از باز شدن API، کیفیت تولید واقعی HappyHorse را تجربه کنید، می‌توانید مستقیماً از طریق ورودی زیر وارد شوید:

نیازی به انتظار برای باز شدن API در ۲۷ آوریل نیست. همین الان متن وارد کنید یا تصویر آپلود کنید و مستقیماً ویدیوی AI 1080p تولید کنید. هر دو حالت متن به ویدیو و تصویر به ویدیو پشتیبانی می‌شوند، با سرعت تولید و پایداری تصویری اثبات‌شده.