Stability AI جدیدترین مدل هوش مصنوعی مولد تصویر خود با عنوان Stable Diffusion XL 1.0 را منتشر کرده که از آن بهعنوان «پیشرفتهترین» مدل این استارتاپ تا به امروز یاد شده است.
Stable Diffusion XL 1.0 که بهصورت متنباز در GitHub و در برنامههای ClipDrop و DreamStudio موجود است، حاوی 3.5 میلیارد پارامتر است و میتواند در چندین نسبت تصویر، تصاویر یک مگاپیکسلی تولید کند. Stability AI مدعی است که مدل آن در مقایسه با نسخه قبلی خود میتواند عکسهایی با رنگهای «جذابتر» و «دقیقتر» و کنتراست، سایهپردازی و نور بهتر ارائه کند.
تفاوت مدل جدید هوش مصنوعی Stability AI
طبق گزارش آماج، نسخه قبلی این مدل، یعنی Stable Diffusion XL 0.9، میتوانست تصاویری با وضوح بالاتر نیز تولید کند، اما به قدرت محاسباتی بیشتری نیاز داشت. «جو پنا»، رئیس بخش یادگیری ماشین Stability AI به این نشریه میگوید:
«Stable Diffusion XL 1.0 قابل تنظیم است و برای تنظیم دقیق مفاهیم و سبکها آمادگی دارد. همچنین استفاده از آن آسانتر است و میتواند براساس درخواستهای ساده طرحهای پیچیدهای تولید کند.»
Stable Diffusion XL 1.0 علاوهبراین، درزمینه تولید متن نیز بهبود یافته است. پنا توضیح میدهد که هرچند بسیاری از بهترین مدلهای تبدیل متن به تصویر تلاش میکنند تا تصاویری با لوگوهای خوانا و نوشته کمتر برای کاربران تولید کنند، Stable Diffusion XL 1.0 بهطور پیشرفتهای قادر به تولید متن و خواندن است.
درنهایت، این مدل از قابلیتهای Inpainting (بازسازی قسمتهای ازدسترفته یک تصویر) و Outpainting (گسترش تصویر) نیز پشتیبانی میکند.
اما درست مانند نسخههای قبلی Stable Diffusion، مدل جدید نیز چالشها و مشکلات اخلاقی مهمی را مطرح میکند. از نظر تئوری، هکرها میتوانند از نسخه منبعباز Stable Diffusion XL 1.0 برای تولید محتوای مضر مانند دیپ فیک استفاده کنند و این موضوع در چند وقت گذشته مورد توجه زیادی قرار گرفته است.