استفاده از قابلیت VEO3 جمینای گوگل

رکنا سه شنبه 28 مرداد 1404 - 08:49
استفاده از قابلیت VEO3 جمینای گوگل

جمینای چیست؟

مدل Gemini محصول شرکت Google هست که دسامبر ۲۰۲۳ معرفی شد. این مدل در واقع نسل بعدی مدل PaLM 2 محسوب می‌شه و با تمرکز روی چند وجه بودن (multimodal) ساخته شده؛ یعنی می‌تونه همزمان با متن، تصویر، صدا و حتی ویدئو کار کنه. یکی از مهم‌ ترین ویژگی‌ های اکانت جمینای، توانایی پردازش و درک متن و تصویر، همراه با قابلیت تولید متن و کد است.

چند ویژگی مهم جمینای

چند ویژگی مهم جمینای

  • پردازش و تولید متن: شامل نگارش مقاله، خلاصه‌سازی، ترجمه و پاسخ به پرسش‌ها.
  • درک و تحلیل تصویر: شامل تحلیل محتوای تصویری، استخراج اطلاعات و ارائه توضیحات مرتبط.
  • تولید و اشکال‌زدایی کد: با پشتیبانی از زبان‌های برنامه‌نویسی گوناگون.
  • تحلیل فایل ها: با بارگذاری فایل مورد نظر، جمینای این قابلیت را دارد که محتوای فایل را پردازش کرده و با ارائه توضیحات لازم، در حل مشکل شما کمک کند.

مقایسه نسخه رایگان و پریمیوم Gemini

قابلیت / ویژگی نسخه رایگان (Free) نسخه پولی Pro (AI Pro) نسخه پولی Ultra (AI Ultra)
مدل مورد استفاده Gemini 2.5 Flash Gemini 2.5 Pro Gemini 2.5 Deep Think
محدوده متنی (Context Window) ۳۲,۰۰۰ توکن (حدود ۵۰ صفحه) ۱,۰۰۰,۰۰۰ توکن (حدود ۱۵۰۰ صفحه یا ۳۰هزار خط کد) ۱,۰۰۰,۰۰۰ توکن (با امکانات ویژه و پیشرفته)
بارگذاری فایل‌ها محدود (متن، اسلاید، تصویر، ویدئو تا ۵ دقیقه) پشتیبانی از فایل‌های گسترده (Excel، CSV) و پوشه‌های کد مشابه Pro
بارگذاری ویدئو تا ۵ دقیقه تا ۱ ساعت + قابلیت تولید ویدئو (۳ کلیپ ۸ ثانیه‌ای 720p در روز) تولید ویدئو با کیفیت بالا (Veo 3)
تاریخچه مکالمات ندارد دارد (امکان استفاده در گفتگوهای جدید) دارد
تحقیق عمیق (Deep Research) محدود گسترده‌تر کامل و پیشرفته
توضیحات صوتی (Audio Overviews) محدود گسترده‌تر کامل و پیشرفته
تولید تصویر دارد دارد (کیفیت بالاتر) دارد
تولید ویدئو ندارد دارد (محدود) دارد (با کیفیت بالا)
Google Workspace ندارد دارد (Gmail، Docs، Slides و...) دارد
فضای ذخیره‌سازی معمولی ۲ ترابایت ۳۰ ترابایت
خدمات اضافی ندارد ندارد YouTube Premium، Agent Mode، امکانات آزمایشی

Veo3 چیست؟

Veo 3 یک هوش مصنوعی پیشرفته در حوزه تولید ویدئو است که توانایی ساخت ویدئوهایی با کیفیت بسیار بالا، حتی در سطح سینمایی را دارد. یکی از ویژگی‌های برجسته این فناوری، پشتیبانی از زبان فارسی است که امکان تولید ویدئو با متن و دستورهای فارسی را فراهم می‌کند. Veo 3 قابلیت تولید ویدئو همراه با صدا را دارد؛ به‌عنوان نمونه، اگر از آن بخواهید ویدئویی از پرندگان در حال پرواز بسازد، می‌تواند نه‌تنها تصویر پرندگان را خلق کند، بلکه نوع پرنده و صدای آن‌ها را نیز به‌طور دقیق شبیه‌سازی کند.

نحوه کار با هوش مصنوعی Veo3

نحوه کار با هوش مصنوعی Veo3

مراحل کار با Veo 3

مرحله اول: نوشتن پرامپت

ابتدا باید یک متن کوتاه و واضح به‌عنوان پرامپت بنویسید.

مثال: «یک پسر در حال بازی فوتبال در کوچه‌های ایران». این متن همان دستوری است که Veo 3 بر اساس آن ویدئو تولید می‌کند.

مرحله دوم: درک دستور توسط هوش مصنوعی

Veo 3 محتوای پرامپت را پردازش کرده و به‌طور کامل متوجه می‌شود چه چیزی از آن خواسته‌اید.

مرحله سوم: تولید تصاویر اولیه

هوش مصنوعی بر اساس متن دریافتی، فریم‌ها یا تصاویر اولیه‌ای را می‌سازد. این تصاویر در ابتدا ثابت هستند، مانند صحنه‌های جداگانه.

مرحله چهارم: ایجاد ویدئو نهایی

Veo 3 با اتصال هوشمندانه این فریم‌ها، یک ویدئو روان و منسجم تولید می‌کند.

در پایان، شما می‌توانید ویدئو را مستقیماً ویرایش کنید (با استفاده از Gemini) یا آن را دانلود کرده و به‌صورت شخصی‌سازی‌شده ادیت کنید.

فعال کردن حالت 30روزه رایگان جمینای

نوع آزمون رایگان توضیحات
۳۰ روز رایگان برای همه کاربران می‌توانند پس از ثبت‌نام در پلن AI Pro، از ۳۰ روز اول به‌صورت رایگان استفاده کنند؛ بدون نیاز به پرداخت در این مدت
۱۲ ماه رایگان برای دانشجویان شامل دسترسی کامل به ویژگی‌های Pro از جمله Veo 3، Deep Research و فضای ذخیره‌سازی ۲ ترابایتی خواهد بود؛ مشروط به واجد شرایط بودن و ثبت‌نام تا مهلت تعیین‌شده.

در صفحه رسمی اشتراک‌های گوگل برای Gemini ذکر شده که پس از انتخاب پلن Google AI Pro، یک ماه اول رایگان است. این شامل دسترسی به ویژگی‌هایی مانند مدل 2.5 Pro، Deep Research، تولید ویدیو با Veo 3 Fast و فضای ذخیره‌سازی ۲ ترابایتی است. همچنین برای دانشجویان مجاز در برخی کشور ها، پلن پرو برای یک سال کامل به‌صورت رایگان ارائه می‌شود.

نحوه دسترسی و استفاده از Veo 3 در Gemini

ورود به حساب گوگل : وارد حساب Google شوید. دقت بکنید وارد حسابی بشوید که در آن پلن پرو فعال شده باشد

انتخاب مدل Veo 3 در رابط کاربری: مدلی که مد نظر شماست برای استفاده را انتخاب بکنید برای مثال: Veo2 یا Veo3

استفاده از ابزار Video در Gemini : در نسخه وب شما میتوانید با کلیک روی گزینه Video کنارباکس پرامپت را انتخاب تصویر مد نظر آپلود و پرامپت را ارسال بکنید تا ویدیو شما ساخته بشود.

دریافت ویدیو نهایی: بعد از دریافت پرامپت و پردازش تصویر منتظر ساخت ویدیو باشیدو پایان ویدیو دانلود و استفاده بکنید.

تفاوت Veo3 با klingai

تفاوت Veo3 با klingai

  • Veo3 
  • یک فناوری تولید ویدئو از متن است که در قالب ابزارهایی مانند Gemini یا Flow عرضه شده.
  • توانایی ساخت ویدئوهای کوتاه سینمایی با تصاویر واقع‌ گرا، نورپردازی حرفه ای ، حرکات آهسته و صداهای همگام‌شده (مانند دیالوگ و افکت) و پشتیبانی زبان فارسی را دارد.
  • Kling AI 
  • هوش مصنوعی kling AI یک مدل مولتی‌مدیای قوی برای تولید ویدئو از متن و تصویر (Text-to-Video و Image-to-Video) است. قادر به تولید ویدئوهایی تا مدت ۳ دقیقه با کیفیت 1080p و سرعت 30fps می‌باشد.
  • از ویژگی‌هایی مانند انیمیشن حرکتی (Motion Brush)، هماهنگی لب با صدا (lip-sync)، و قالب‌های آماده (templates) نیز بهره‌مند است.

نحوه نصب جمینای

جمینای قابلیت فعال‌سازی و استفاده روی تلفن همراه را دارد. این اپلیکیشن به‌صورت پیش‌فرض بر روی برخی گوشی‌های پیشرفته نصب است، با این حال کاربران می‌توانند آن را از فروشگاه‌های رسمی نیز دریافت و نصب کنند. لازم به ذکر است که سیستم‌عامل مورد نیاز برای اجرای جمینای، اندروید نسخه ۱۰ به بالا می‌باشد.

آشنایی با محیط کاربری جمینای

  • گزینه‌ی مخفی Ask Gemini

    در بالای محیط کاربری، گزینه‌ای با عنوان Ask Gemini وجود دارد که از طریق آن می‌توانید پرسش خود را مستقیماً وارد کنید.

  • نمایش نسخه (مثال: 2.5)

    در پایین صفحه، کنار علامت Gemini، نسخه‌ی فعال برنامه نمایش داده می‌شود. به‌عنوان نمونه، اگر عدد 2.5 درج شده باشد، نشان‌دهنده‌ی استفاده از نسخه‌ی Gemini 2.5 است.

  • دکمه‌های اقدام زیر کادر ورودی:
  • Research: با فعال‌سازی این حالت، جمینای زمان بیشتری صرف پردازش کرده و پاسخ دقیق‌تر و عمیق‌تری ارائه می‌دهد.
  • Canvas: محیطی یکپارچه برای ساخت و ویرایش اسناد و کدنویسی فراهم می‌کند. توجه داشته باشید که پروژه‌های Canvas در موبایل قابل مشاهده‌اند، اما ویرایش کامل تنها در نسخه‌ی وب (دسکتاپ) امکان‌پذیر است.
  • علامت میکروفون (Voice):

    این دکمه برای ارسال پرسش یا دستور به‌صورت صوتی مورد استفاده قرار می‌گیرد.

  • علامت + (آپلود):

    از طریق این گزینه می‌توانید فایل دلخواه خود (متن، تصویر یا سایر فرمت‌ها) را بارگذاری کنید تا توسط جمینای پردازش شود.

آیا ساخت ویدیو با Veo3 باعث افزایش بازدید در شبکه های اجتماعی میشود؟

«بله، استفاده از Veo 3 می‌تواند باعث افزایش بازدید در شبکه‌ های اجتماعی شود. دلیل اصلی آن، امکان به‌کارگیری خلاقیت در پرامپت‌ نویسی است. شما می‌توانید با تولید ویدئوهای خلاقانه و متفاوت، محتوایی جذاب و منحصربه‌فرد ارائه دهید و در نتیجه توجه و بازدید بیشتری از مخاطبان دریافت کنید.

نتیجه‌ گیری

در دنیای امروز که بسیاری از فعالیت‌ها با هوش مصنوعی انجام می‌شود، یادگیری ساخت ویدئو با استفاده از فناوری‌های هوشمند اهمیت ویژه‌ای دارد. دلیل این موضوع روشن است؛ هرچه بهتر بتوانیم با نسل جدید ابزارهای هوش مصنوعی همراه شویم، فرصت‌های بیشتری برای پیشرفت خواهیم داشت. اکنون با معرفی فناوری Veo 3 در بستر جمینای توسط گوگل، صنعت تولید ویدئو دچار تحول بزرگی شده است. این ابزار با ارائه بهترین افکت‌ها و کیفیت سینمایی، سطح تازه‌ای از خلاقیت و نوآوری را به کاربران عرضه می‌کند.نکته‌ی ارزشمند دیگر این است که جمینای از زبان فارسی نیز پشتیبانی می‌کند؛ موضوعی که باعث خوشحالی و سهولت استفاده‌ی کاربران فارسی‌زبان شده.

منبع: beiten.ir

  • فیلم لحظه ترسناک سقوط جرثقیل در اتوبان

اخبار تاپ حوادث

وبگردی

منبع خبر "رکنا" است و موتور جستجوگر خبر تیترآنلاین در قبال محتوای آن هیچ مسئولیتی ندارد. (ادامه)
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت تیترآنلاین مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویری است، مسئولیت نقض حقوق تصریح شده مولفان از قبیل تکثیر، اجرا و توزیع و یا هرگونه محتوای خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.