تیم هوش مصنوعی شرکت چینی علیبابا از مدل هوش مصنوعی جدیدی با نام Qwen-Image رونمایی کرده است که برای تولید تصویر کاربرد دارد. این مدل از زبانهای انگلیسی و چینی پشتیبانی میکند.
به گزارش ونچربیت، مدل Qwen-Image به دلیل تمرکز ویژه بر رندر دقیق متن درون تصاویر خود را از رقبا متمایز میکند. همچنین به لطف پشتیبانی از هر دو نوع خط الفبایی و تصویری، این مدل بهویژه در مدیریت تایپوگرافیهای پیچیده، چیدمانهای چندخطی، درک معنا در سطح پاراگراف و محتوای دوزبانه توانایی بالایی دارد.
این قابلیت به کاربران امکان میدهد تا با استفاده از مدل Qwen-Image محتواهایی مانند پوستر فیلم، اسلایدهای ارائه، بنر برای ویترین فروشگاه، اشعار دستنویس و اینفوگرافی حاوی متن تولید کنند.
کاربران با انتخاب حالت Image Generation از میان آپشنهای زیر کادر ورود پرامپت در وبسایت Qwen Chat میتوانند با این مدل تعامل داشته باشند.
البته بررسیهای اولیه نشان میدهد که دقت و کیفیت Qwen-Image در تولید تصاویر در مقایسه با رقبایی مانند میدجرنی پایینتر است. همچنین این مدل در آزمایشهای ابتدایی خطاهایی در درک پرامپت و عدم وفاداری به متن خواستهشده از خود نشان داده است.
اما با میدجرنی تنها میتوان تعداد محدودی تصویر رایگان تولید کرد و برای تولید تصاویر بیشتر باید اشتراک آن را بخرید. یکی از مزیتهای Qwen-Image این است که به لطف مجوز متنباز و انتشار مدل در پلتفرم Hugging Face، این امکان را فراهم کرده که هر سازمان یا ارائهدهنده ثالثی بتواند بهصورت رایگان از آن استفاده کند.
Qwen-Image تحت مجوز Apache 2.0 منتشر شده که اجازه استفاده تجاری و غیرتجاری، بازتوزیع و اصلاح را میدهد. البته ذکر منبع و ضمیمهکردن متن مجوز برای آثار مشتقشده الزامی خواهد بود.
مدل هوش مصنوعی جدید علیبابا میتواند برای سازمانهایی که بهدنبال یک هوش مصنوعی تولید تصویر برای تولید محتوای داخلی یا خارجی مانند تراکتها، تبلیغات، اطلاعیهها، خبرنامهها و سایر محتواهای مرتبط با ارتباطات دیجیتال هستند، بسیار کاربردی باشد.