تیم تحقیقاتی شرکت چینی علیبابا از یک مدل هوش مصنوعی برای تبدیل تصاویر به ویدئو رونمایی کرده که AtomoVideo نام دارد. این تیم، مقالات و نمونههایی از تبدیل تصویر به ویدیو توسط AtomoVideo را بههمراه نمونههایی از نتایج هوشهای مصنوعی نسل دوم Runway و همچنین نسل اول Pika بهاشتراک گذاشته است.
نمونههای ارائهشدهی AtomoVideo با توجه به اینکه یک محصول نسل اول است، امیدوارکننده بهنظر میرسند، هرچند که چندان واقعگرایانه نیستند. جالب اینجا است که مقایسهی آنها با مدل نسل دوم Runway (نسل اول در اوایل ۲۰۲۳ منتشر شد) نشان میدهد که این مدلِ تازهرونماییشده نتایج بهتری در کاهش برخی تغییرات عجیب و غریب بین فریمها ارائه داده است.
از ویژگیهای AtomoVideo میتوان به توانایی بالای آن در حفظ وفاداری به تصویر ورودی، حرکت روان کاراکترها و پیشبینی فریمهای بعدی اشاره کرد. علاوهبر این، AtomoVideo با مدلهای مختلف T2I (متن به تصویر) سازگار است و قابلیت کنترل معنایی بالایی را ارائه میدهد. این قابلیت به کاربران اجازه میدهد محتوای ویدئویی را بر اساس اولویتهای خاص خود شخصیسازی کنند.
AtomoVideo با استفاده از مدلهای ازپیشآموزشدیدهی T2I و تقویت آنها با ماژولهای انحراف فضا-زمانیِ تکبعدی و ماژولهای توجه، توانسته به چنین عملکرد قابلتوجهی دست یابد. این لایههای اضافی AtomoVideo را قادر میسازد تا جزئیات و سبکهای پیچیده را ثبت و در عین حال ثبات زمانی را در سراسر ویدئوها تضمین کند.
با وجود قابلیتهای چشمگیر AtomoVideo، تیم تحقیقاتی هنوز نتوانسته بستری آنلاین برای تجربهی شخصی کاربران فراهم کند. بااینحال، مدل هوش مصنوعی AtomoVideo علیبابا نشاندهندهی یک پیشرفت قابل توجه در زمینه تبدیل تصویر به ویدئو است.
اخبار و مطالب مرتبط:
-ساخت و طراحی سایت با هوش مصنوعی در یک چشم بر هم زدن!
-هوش مصنوعی ادوبی Adobe تولید و ویرایش موسیقی می کند
-استارتاپ Particle به رهبری سارا بیکپور، با هوش مصنوعی خبر می سازد
-هوش مصنوعی Genie گوگل بازی ویدئویی دو بعدی میسازد
-هوش مصنوعی Sora متن را به ویدیو تبدیل میکند (خبری هیجان انگیز از ChatGPT)
مشاوره در واتساپ