هوش مصنوعی Kling O1 معرفی شد؛ مدلی واحد برای خلق و ویرایش ویدیو [تماشا کنید]

دیجیاتو سه شنبه 11 آذر 1404 - 12:32
هوش مصنوعی ویدیوساز Kling O1 همه ابزارهای کاربردی را در یک مدل یکپارچه کرده است. The post هوش مصنوعی Kling O1 معرفی شد؛ مدلی واحد برای خلق و ویرایش ویدیو [تماشا کنید] appeared first on دیجیاتو.

مدل جدید ویدیوساز Kling O1 معرفی شد؛ این هوش مصنوعی چینی برخلاف رقبا که برای هر کاری (تولید، ویرایش، تغییر لباس) ابزار جداگانه‌ای دارند، همه چیز را در یک مدل واحد ترکیب کرده است. این یعنی شما می‌توانید با یک پرامپت ساده، هم ویدیو بسازید، هم آن را ویرایش کنید و هم شخصیت را تغییر دهید.

تفاوت اصلی Kling O1 در معماری آن است که MVL (زبان بصری چندوجهی) نامیده می‌شود. درحالی‌که ابزارهای فعلی برای درک متن، تصویر و ویدیو از مدل‌های جداگانه استفاده می‌کنند، Kling O1 همه این ورودی‌ها را در یک «فضای استدلالی واحد» ترکیب می‌کند.

این مدل می‌تواند متن، تصویر، ویدیو و حتی حرکت را هم‌زمان درک کند. نتیجه این یکپارچگی چیست؟ شما دیگر نیازی به جابه‌جایی بین ابزارهای مختلف ندارید؛ تمام مراحل تولید، ویرایش، گسترش و تغییر استایل ویدیو در یک مرحله و توسط یک هوش مصنوعی انجام می‌شود.

معرفی مدل هوش مصنوعی ویدیوساز Kling O1

این مدل یکی از منعطف‌ترین سیستم‌های تبدیل تصویر به ویدیو در جهان است. هدف آن تبدیل ایده‌های انتزاعی به شات‌های سینمایی با ثبات بالاست. با Kling O1  می‌توانید تا ۷ تصویر مرجع را آپلود کنید تا هوش مصنوعی دقیقاً همان کاراکتر، لباس یا فضا را در ویدیو حفظ کند.

همچنین با آپلود فریم آغازین و پایانی، هوش مصنوعی حرکت بین این دو نقطه را به نرمی و با حفظ هویت سوژه‌ها می‌سازد. البته طول ویدیوها حدکثر ۱۰ ثانیه‌ای هستند. علاوه‌براین، می‌توانید با دستور متنی، کاراکتر ویدیو را عوض کنید یا لباس او را تغییر دهید.

بخش ویرایش Kling O1 جایی است که قدرت واقعی موتور یکپارچه این هوش مصنوعی را می‌بینید. دیگر نیازی به ماسک‌گذاری فریم‌به‌فریم نیست. شما می‌توانید با یک دستور متنی ساده، تغییرات مختلفی را اعمال کنید: هر شی، فرد یا پس‌زمینه‌ای را در چند ثانیه حذف یا اضافه کنید.

علاوه‌براین‌ها، می‌توانید یک ویدیوی مرجع آپلود کنید تا Kling O1 حرکت دوربین و ریتم آن را استخراج و روی صحنه جدید شما اعمال کند؛ در ویدیو پایین این قابلیت جذاب را می‌بینید:

بزرگ‌ترین چالش مدل‌های هوش مصنوعی ویدیویی معمولاً عدم ثبات بوده است؛ یعنی چهره کاراکتر در طول ویدیو تغییر می‌کرد. اما Kling O1 ثبات بی‌نظیری در چهره، لباس و اشیا ارائه می‌دهد. این ویژگی به کارگردانان فرصتی می‌دهد تا استوری‌بوردهای متحرک بسازند و صحنه‌های مختلف فیلم خود را تست کنند.

به‌تازگی مدل ویدیوساز Runway Gen-4.5 نیز معرفی شد که در بنچمارک‌های مختلف مدل‌های گوگل و OpenAI را پشت سر گذاشته است.

منبع خبر "دیجیاتو" است و موتور جستجوگر خبر تیترآنلاین در قبال محتوای آن هیچ مسئولیتی ندارد. (ادامه)
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت تیترآنلاین مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویری است، مسئولیت نقض حقوق تصریح شده مولفان از قبیل تکثیر، اجرا و توزیع و یا هرگونه محتوای خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.