
اوپنایآی از مدل جدید تولید تصویر خود با نام GPT Image 1.5 رونمایی کرد؛ مدلی که از دیروز در اختیار تمام کاربران ChatGPT قرار گرفته و از طریق API نیز قابل استفاده است. این بهروزرسانی در شرایطی منتشر میشود که رقابت میان اوپنایآی و گوگل در حوزه هوش مصنوعی مولد وارد فاز جدیتری شده و جمینای ۳ توانسته بخشی از سهم بازار را به خود اختصاص دهد.
عرضه GPT Image 1.5 را میتوان در امتداد یادداشت افشاشده «کد قرمز» سم آلتمن، مدیرعامل اوپنایآی، تحلیل کرد؛ یادداشتی که ماه گذشته منتشر شد و از برنامههای شرکت برای بازپسگیری جایگاه رهبری در بازار هوش مصنوعی خبر میداد. آلتمن در این یادداشت بهطور تلویحی به فشار رقابتی ناشی از محصولات جدید گوگل، از جمله جمینای ۳، اشاره کرده بود.
تمرکز بر ویرایش دقیق و ثبات بصری
GPT Image 1.5 در زمانی عرضه میشود که تولیدکنندگان تصویر و ویدئو بهدنبال فراتر رفتن از نمونههای اولیه و دستیابی به ابزارهایی با کنترل و سرعت بالاتر هستند. این مدل، مشابه برخی قابلیتهای ارائهشده در محصولات رقیب، امکاناتی ویژه برای مرحله «پس از تولید» فراهم میکند؛ از جمله کنترلهای دقیقتر برای حفظ ثبات بصری در ویرایشهای متعدد.
به گفته اوپنایآی، این مدل امکان حفظ شباهت چهره، نورپردازی، ترکیببندی و تناژ رنگ را در تغییرات متوالی فراهم میکند؛ قابلیتی که یکی از ضعفهای رایج ابزارهای تولید تصویر با هوش مصنوعی به شمار میرفت. بسیاری از این ابزارها هنگام اعمال تغییرات جزئی، کل تصویر را دگرگون میکنند و در نتیجه، هماهنگی بصری از بین میرود؛ مشکلی که GPT Image 1.5 قصد دارد آن را برطرف کند.
تجربه کاربری جدید؛ استودیوی خلاق در ChatGPT
بهروزرسانی جدید تنها به قابلیتهای فنی محدود نمیشود. اوپنایآی یک نقطه ورودی اختصاصی برای تصاویر در نوار کناری ChatGPT اضافه کرده است؛ فضایی که بهنوعی نقش یک «استودیوی خلاق» را ایفا میکند و دسترسی به تصاویر تولیدشده و ویرایش آنها را سادهتر میسازد.
فیجی سیمو، مدیر ارشد بخش اپلیکیشنهای اوپنایآی، در یک پست وبلاگی اعلام کرد قابلیتهای جدید نمایش و اصلاح تصویر، فرایند خلق تصاویری نزدیکتر به ایده ذهنی کاربر را آسانتر میکند و امکان الهام گرفتن از دستورهای پرطرفدار و فیلترهای از پیش تعیینشده را فراهم میآورد.
گام بعدی: عناصر بصری بیشتر در جستجو
اوپنایآی همچنین قصد دارد تجربه کار با ChatGPT را با عناصر بصری غنیتر توسعه دهد. به گفته سیمو، در نسخههای آینده، نتایج جستجو با تصاویر بیشتر و منابع شفافتری نمایش داده خواهند شد؛ تغییری که میتواند برای کاربردهایی مانند تبدیل واحدها، بررسی نتایج ورزشی یا درک سریعتر دادهها مفید باشد.
به نظر میرسد GPT Image 1.5 نهتنها یک بهروزرسانی فنی، بلکه بخشی از استراتژی گستردهتر اوپنایآی برای تثبیت دوباره جایگاه خود در رقابت فشرده هوش مصنوعی مولد باشد؛ رقابتی که حالا بیش از هر زمان دیگری به تجربه کاربری، سرعت و دقت ابزارها گره خورده است.



