پیشرفته‌ترین مدل هوش مصنوعی تولیدکننده تصویر Stability AI منتشر شد

Stability AI جدیدترین مدل هوش مصنوعی مولد تصویر خود با عنوان Stable Diffusion XL 1.0 را منتشر کرده که از آن به‌عنوان «پیشرفته‌ترین» مدل این استارتاپ تا به امروز یاد شده است.

Stable Diffusion XL 1.0 که به‌صورت متن‌باز در GitHub و در برنامه‌های ClipDrop و DreamStudio موجود است، حاوی 3.5 میلیارد پارامتر است و می‌تواند در چندین نسبت تصویر، تصاویر یک مگاپیکسلی تولید کند. Stability AI مدعی است که مدل آن در مقایسه با نسخه قبلی خود می‌تواند عکس‌هایی با رنگ‌های «جذاب‌تر» و «دقیق‌تر» و کنتراست، سایه‌پردازی و نور بهتر ارائه کند.

تفاوت مدل جدید هوش مصنوعی Stability AI

طبق گزارش آماج، نسخه قبلی این مدل، یعنی Stable Diffusion XL 0.9، می‌توانست تصاویری با وضوح بالاتر نیز تولید کند، اما به قدرت محاسباتی بیشتری نیاز داشت. «جو پنا»، رئیس بخش یادگیری ماشین Stability AI به این نشریه می‌گوید:

«Stable Diffusion XL 1.0 قابل تنظیم است و برای تنظیم دقیق مفاهیم و سبک‌ها آمادگی دارد. همچنین استفاده از آن آسان‌تر است و می‌تواند براساس درخواست‌های ساده طرح‌های پیچیده‌ای تولید کند.»

Stable Diffusion XL 1.0 علاوه‌براین، درزمینه تولید متن نیز بهبود یافته است. پنا توضیح می‌دهد که هرچند بسیاری از بهترین مدل‌های تبدیل متن به تصویر تلاش می‌کنند تا تصاویری با لوگوهای خوانا و نوشته کمتر برای کاربران تولید کنند، Stable Diffusion XL 1.0 به‌طور پیشرفته‌ای قادر به تولید متن و خواندن است.

درنهایت، این مدل از قابلیت‌های Inpainting (بازسازی قسمت‌های ازدست‌رفته یک تصویر) و Outpainting (گسترش تصویر) نیز پشتیبانی می‌کند.

اما درست مانند نسخه‌های قبلی Stable Diffusion، مدل جدید نیز چالش‌ها و مشکلات اخلاقی مهمی را مطرح می‌کند. از نظر تئوری، هکرها می‌توانند از نسخه منبع‌باز Stable Diffusion XL 1.0 برای تولید محتوای مضر مانند دیپ فیک استفاده کنند و این موضوع در چند وقت گذشته مورد توجه زیادی قرار گرفته است.