تبدیل متن به ویدئو در رقابت Vidu با Sora چینی شتاب می گیرد

علمی – سایت تجارت ایران و چین: مدل هوش مصنوعی Vidu، مبدل متن به ویدئو و رقیب چینی Sora، رونمایی شد. این مدل هوش مصنوعی با یک کلیک کلیپ‌های ۱۶ ثانیه‌ای با کیفیت ۱۰۸۰p تولید می‌کند.

شرکت نوپای چینی Shengshu Technology و دانشگاه Tsinghua به‌طور رسمی Vidu، رقیب چینی Sora شرکت OpenAI را رونمایی کردند. این مدل هوش مصنوعی که متن را به ویدئو تبدیل می‌کند، می‌تواند با یک کلیک کلیپ‌های ۱۶ ثانیه‌ای با کیفیت ۱۰۸۰p تولید کند.

اگرچه مدت‌زمان ویدئوهای قابل‌ساخت با Vidu از مدت‌زمان ۶۰ ثانیه‌ای ویدئوهای ساخته‌شده با Sora کوتاه‌تر است، این فناوری بهترین دستاورد فعلی چین در این زمینه به‌شمار می‌رود.

گزارش شده است که شرکت Vidu مدل جدید هوش مصنوعی خود به نام «تبدیل دیداری فراگیر» (U-ViT) را نیز توسعه داده است که دو مدل هوش مصنوعی مهم، یعنی «انتشار» (Diffusion) و «تبدیلگر» (Transformer) را ترکیب می‌کند. به‌گزارش گلوبال تایمز، توسعه‌دهندگان ادعا می‌کنند این مدل توانایی تبدیل متن به ویدئو را به‌صورت پیشرفته‌ دارد.

طبق گزارش Medium، این معماری امکان ساخت ویدئوهای واقع‌گرایانه با حرکات پویای دوربین و حالات چهره دقیق و نورپردازی و سایه‌های طبیعی را فراهم می‌کند. با‌این‌حال، برخلاف انبوهی از کپی‌های چینی از ChatGPT که در نوامبر ۲۰۲۰ منتشر شدند، Sora تاکنون رقیب چینی هم‌ترازی نداشته است.

کارشناسان این صنعت کمبود توان محاسباتی را به‌عنوان مانعی بزرگ بر سر راه پیشرفت شرکت‌های چینی ذکر کرده‌اند. دولت ایالات متحده محدودیت‌های صادراتی بر تراشه‌های پیشرفته‌ای مانند پردازنده‌های گرافیکی A100 و H100 ساخت انویدیا را افزایش داده و صادرات آن‌ها به چین را ممنوع کرده است.

 

منبع: تکنو

انتهای پیام/

این مقاله رو با بقیه به اشتراک بذار:

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *