این مدل توسط استارتاپی معرفی شده که مدیرعامل آن یک مهندس ایرانی بهنام «محمد نوروزی» است.
استارتاپ حوزه هوش مصنوعی Ideogram AI که توسط مهندسان سابق گوگل تأسیس شده است و مدیرعامل آن یک مهندس ایرانی بهنام «محمد نوروزی» است، اولین نسخه کامل از مدل تولید تصویر خود با نام Ideogram را معرفی کرد. از Ideogram بهعنوان پیشرفتهترین مدل تبدیل متن به تصویر یاد شده است که از نظر عملکرد، بهخصوص در بخش نمایش نوشتهها، ظاهراً برخی از بزرگترین رقبای خود مانند میدجرنی (MidJourney) و Dall-E 3 را شکست میدهد.
Ideogram AI در پست رسمی وبلاگ خود نوشت:
«ما از انتشار Ideogram 1.0، پیشرفتهترین مدل تبدیل متن به تصویر تا به امروز، بسیار هیجانزده هستیم. Ideogram 1.0 که مانند تمام مدلهای Ideogram از پایه آموزش داده شده است، پیشرفتهترین رندر متن، فوتورئالیسم بیسابقه و پایبندی سریع را ارائه میدهد و با ویژگی جدیدی که Magic Prompt نام دارد، به شما کمک میکند تا دستورات متنی دقیقی برای تصاویر زیبا و خلاقانه خود بنویسید.»
همچنین در این پست از جمعآوری کمک مالی 80 میلیون دلاری بهرهبری شرکت Andreessen Horowitz خبر داده شده است.
مقایسه هوش مصنوعی تولید تصویر Ideogram با میدجرنی و DALL-E 3
نشریه Decrypt موفقشده این مدل را آزمایش میکند و در گزارش خود میگوید که ادعاهای این استارتاپ درباره مدل هوش مصنوعی تولید تصویر Ideogram اغراقآمیز نیستند. در واقع طبق این گزارش، نسخه یک مدل Ideogram نسبت به نسخههای قبلی آن پیشرفت واضحی در زمینههای تولید سریع تصویر و کیفیت داشته است.
در تصویر زیر خروجیهای این مدل و دو مدل تولید تصویر محبوب آمده است. تصویر تولیدشده توسط Ideogram در سمت چپ، تصویر تولیدشده توسط MidJourney در وسط و نتیجه ارائهشده توسط Dall-E 3 در سمت راست آمده است.
البته مدل Ideogram منبع باز نیست و هیچ مقاله تحقیقاتی برای ارزیابی آن وجود ندارد. اما براساس نتایج بهدست آمده از آن، Decrypt ادعا کرده که احتمالا با بهترین مدل موجود درحالحاضر برای تولید تصویر روبهرو هستیم (حداقل تا زمانی که Stable Diffusion 3 بهصورت عمومی منتشر شود).
یکی از مهمترین نکات مربوط به این مدل جدید، قابلیتهای متنی پیشرفته است که در آن میتوان از متنهای طولانیتری استفاده کرد که حتی با این وجود، ضریب خطای آن نسبت به DALL-E 3 و میدجرنی کمتر است. سطح رایگان فعلی آن نیز باعث برتری مدل نسبت به رقبای خود میشود. ویژگی Prompt Magic که به آن اشاره کردیم نیز درخواست متنی کاربران را تجزیهوتحلیل میکند تا بتواند تصاویر با کیفیت بهتر و دقیقتری تولید کند.
Ideogram همچنین دو طرح اشتراکی ماهانه 7 دلار و 15 دلار را به کاربران ارائه میکند که مزایایی ازجمله ویرایشگر تصویر، دانلود با کیفیت بهتر و امکان تولید 400 تصویر در روز را فراهم میکند.