هوش مصنوعی تولید تصویر Ideogram معرفی شد؛ رقیب میدجرنی و Dall-E 3

این مدل توسط استارتاپی معرفی شده که مدیرعامل آن یک مهندس ایرانی به‌نام «محمد نوروزی» است.

استارتاپ حوزه هوش مصنوعی Ideogram AI که توسط مهندسان سابق گوگل تأسیس شده است و مدیرعامل آن یک مهندس ایرانی به‌نام «محمد نوروزی» است، اولین نسخه کامل از مدل تولید تصویر خود با نام Ideogram را معرفی کرد. از Ideogram به‌عنوان پیشرفته‌ترین مدل تبدیل متن به تصویر یاد شده است که از نظر عملکرد، به‌خصوص در بخش نمایش نوشته‌ها، ظاهراً برخی از بزرگ‌ترین رقبای خود مانند میدجرنی (MidJourney) و Dall-E 3 را شکست می‌دهد.

Ideogram AI در پست رسمی وبلاگ خود نوشت:

«ما از انتشار Ideogram 1.0، پیشرفته‌ترین مدل تبدیل متن به تصویر تا به امروز، بسیار هیجان‌زده هستیم. Ideogram 1.0 که مانند تمام مدل‌های Ideogram از پایه آموزش داده شده است، پیشرفته‌ترین رندر متن، فوتورئالیسم بی‌سابقه و پایبندی سریع را ارائه می‌دهد و با ویژگی جدیدی که Magic Prompt نام دارد، به شما کمک می‌کند تا دستورات متنی دقیقی برای تصاویر زیبا و خلاقانه خود بنویسید.»

همچنین در این پست از جمع‌آوری کمک مالی 80 میلیون دلاری به‌رهبری شرکت Andreessen Horowitz خبر داده شده است.

مقایسه هوش مصنوعی تولید تصویر Ideogram با میدجرنی و DALL-E 3

نشریه Decrypt موفق‌شده این مدل را آزمایش می‌کند و در گزارش خود می‌گوید که ادعاهای این استارتاپ درباره مدل هوش مصنوعی تولید تصویر Ideogram اغراق‌آمیز نیستند. در واقع طبق این گزارش، نسخه یک مدل Ideogram نسبت به نسخه‌های قبلی آن پیشرفت واضحی در زمینه‌های تولید سریع تصویر و کیفیت داشته است.

در تصویر زیر خروجی‌های این مدل و دو مدل تولید تصویر محبوب آمده است. تصویر تولیدشده توسط Ideogram در سمت چپ، تصویر تولیدشده توسط MidJourney در وسط و نتیجه ارائه‌شده توسط Dall-E 3 در سمت راست آمده است.

Ideogram

البته مدل Ideogram منبع باز نیست و هیچ مقاله تحقیقاتی برای ارزیابی آن وجود ندارد. اما براساس نتایج به‌دست آمده از آن، Decrypt ادعا کرده که احتمالا با بهترین مدل موجود درحال‌حاضر برای تولید تصویر روبه‌رو هستیم (حداقل تا زمانی که Stable Diffusion 3 به‌صورت عمومی منتشر شود).

یکی از مهم‌ترین نکات مربوط به این مدل جدید، قابلیت‌های متنی پیشرفته است که در آن می‌توان از متن‌های طولانی‌تری استفاده کرد که حتی با این وجود، ضریب خطای آن نسبت به DALL-E 3 و میدجرنی کمتر است. سطح رایگان فعلی آن نیز باعث برتری مدل نسبت به رقبای خود می‌شود. ویژگی Prompt Magic که به آن اشاره کردیم نیز درخواست متنی کاربران را تجزیه‌وتحلیل می‌کند تا بتواند تصاویر با کیفیت بهتر و دقیق‌تری تولید کند.

Ideogram همچنین دو طرح اشتراکی ماهانه 7 دلار و 15 دلار را به کاربران ارائه می‌کند که مزایایی ازجمله ویرایشگر تصویر، دانلود با کیفیت بهتر و امکان تولید 400 تصویر در روز را فراهم می‌کند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

13 − یازده =

آخرین اخبار