مدل جدید ویدیوساز Kling O1 معرفی شد؛ این هوش مصنوعی چینی برخلاف رقبا که برای هر کاری (تولید، ویرایش، تغییر لباس) ابزار جداگانهای دارند، همه چیز را در یک مدل واحد ترکیب کرده است. این یعنی شما میتوانید با یک پرامپت ساده، هم ویدیو بسازید، هم آن را ویرایش کنید و هم شخصیت را تغییر دهید.
تفاوت اصلی Kling O1 در معماری آن است که MVL (زبان بصری چندوجهی) نامیده میشود. درحالیکه ابزارهای فعلی برای درک متن، تصویر و ویدیو از مدلهای جداگانه استفاده میکنند، Kling O1 همه این ورودیها را در یک «فضای استدلالی واحد» ترکیب میکند.
این مدل میتواند متن، تصویر، ویدیو و حتی حرکت را همزمان درک کند. نتیجه این یکپارچگی چیست؟ شما دیگر نیازی به جابهجایی بین ابزارهای مختلف ندارید؛ تمام مراحل تولید، ویرایش، گسترش و تغییر استایل ویدیو در یک مرحله و توسط یک هوش مصنوعی انجام میشود.
این مدل یکی از منعطفترین سیستمهای تبدیل تصویر به ویدیو در جهان است. هدف آن تبدیل ایدههای انتزاعی به شاتهای سینمایی با ثبات بالاست. با Kling O1 میتوانید تا ۷ تصویر مرجع را آپلود کنید تا هوش مصنوعی دقیقاً همان کاراکتر، لباس یا فضا را در ویدیو حفظ کند.
همچنین با آپلود فریم آغازین و پایانی، هوش مصنوعی حرکت بین این دو نقطه را به نرمی و با حفظ هویت سوژهها میسازد. البته طول ویدیوها حدکثر ۱۰ ثانیهای هستند. علاوهبراین، میتوانید با دستور متنی، کاراکتر ویدیو را عوض کنید یا لباس او را تغییر دهید.
بخش ویرایش Kling O1 جایی است که قدرت واقعی موتور یکپارچه این هوش مصنوعی را میبینید. دیگر نیازی به ماسکگذاری فریمبهفریم نیست. شما میتوانید با یک دستور متنی ساده، تغییرات مختلفی را اعمال کنید: هر شی، فرد یا پسزمینهای را در چند ثانیه حذف یا اضافه کنید.
علاوهبراینها، میتوانید یک ویدیوی مرجع آپلود کنید تا Kling O1 حرکت دوربین و ریتم آن را استخراج و روی صحنه جدید شما اعمال کند؛ در ویدیو پایین این قابلیت جذاب را میبینید:
بزرگترین چالش مدلهای هوش مصنوعی ویدیویی معمولاً عدم ثبات بوده است؛ یعنی چهره کاراکتر در طول ویدیو تغییر میکرد. اما Kling O1 ثبات بینظیری در چهره، لباس و اشیا ارائه میدهد. این ویژگی به کارگردانان فرصتی میدهد تا استوریبوردهای متحرک بسازند و صحنههای مختلف فیلم خود را تست کنند.
بهتازگی مدل ویدیوساز Runway Gen-4.5 نیز معرفی شد که در بنچمارکهای مختلف مدلهای گوگل و OpenAI را پشت سر گذاشته است.