اخبار هوش مصنوعی

اوپن‌ای‌آی مدل GPT Image 1.5 را منتشر کرد؛ پاسخ جدید به پیشروی جمینای گوگل

اوپن‌ای‌آی از مدل جدید تولید تصویر خود با نام GPT Image 1.5 رونمایی کرد؛ مدلی که از دیروز در اختیار تمام کاربران ChatGPT قرار گرفته و از طریق API نیز قابل استفاده است. این به‌روزرسانی در شرایطی منتشر می‌شود که رقابت میان اوپن‌ای‌آی و گوگل در حوزه هوش مصنوعی مولد وارد فاز جدی‌تری شده و جمینای ۳ توانسته بخشی از سهم بازار را به خود اختصاص دهد.

عرضه GPT Image 1.5 را می‌توان در امتداد یادداشت افشا‌شده «کد قرمز» سم آلتمن، مدیرعامل اوپن‌ای‌آی، تحلیل کرد؛ یادداشتی که ماه گذشته منتشر شد و از برنامه‌های شرکت برای بازپس‌گیری جایگاه رهبری در بازار هوش مصنوعی خبر می‌داد. آلتمن در این یادداشت به‌طور تلویحی به فشار رقابتی ناشی از محصولات جدید گوگل، از جمله جمینای ۳، اشاره کرده بود.

تمرکز بر ویرایش دقیق و ثبات بصری

GPT Image 1.5 در زمانی عرضه می‌شود که تولیدکنندگان تصویر و ویدئو به‌دنبال فراتر رفتن از نمونه‌های اولیه و دستیابی به ابزارهایی با کنترل و سرعت بالاتر هستند. این مدل، مشابه برخی قابلیت‌های ارائه‌شده در محصولات رقیب، امکاناتی ویژه برای مرحله «پس از تولید» فراهم می‌کند؛ از جمله کنترل‌های دقیق‌تر برای حفظ ثبات بصری در ویرایش‌های متعدد.

به گفته اوپن‌ای‌آی، این مدل امکان حفظ شباهت چهره، نورپردازی، ترکیب‌بندی و تناژ رنگ را در تغییرات متوالی فراهم می‌کند؛ قابلیتی که یکی از ضعف‌های رایج ابزارهای تولید تصویر با هوش مصنوعی به شمار می‌رفت. بسیاری از این ابزارها هنگام اعمال تغییرات جزئی، کل تصویر را دگرگون می‌کنند و در نتیجه، هماهنگی بصری از بین می‌رود؛ مشکلی که GPT Image 1.5 قصد دارد آن را برطرف کند.

تجربه کاربری جدید؛ استودیوی خلاق در ChatGPT

به‌روزرسانی جدید تنها به قابلیت‌های فنی محدود نمی‌شود. اوپن‌ای‌آی یک نقطه ورودی اختصاصی برای تصاویر در نوار کناری ChatGPT اضافه کرده است؛ فضایی که به‌نوعی نقش یک «استودیوی خلاق» را ایفا می‌کند و دسترسی به تصاویر تولیدشده و ویرایش آن‌ها را ساده‌تر می‌سازد.

فیجی سیمو، مدیر ارشد بخش اپلیکیشن‌های اوپن‌ای‌آی، در یک پست وبلاگی اعلام کرد قابلیت‌های جدید نمایش و اصلاح تصویر، فرایند خلق تصاویری نزدیک‌تر به ایده ذهنی کاربر را آسان‌تر می‌کند و امکان الهام گرفتن از دستورهای پرطرفدار و فیلترهای از پیش تعیین‌شده را فراهم می‌آورد.

گام بعدی: عناصر بصری بیشتر در جستجو

اوپن‌ای‌آی همچنین قصد دارد تجربه کار با ChatGPT را با عناصر بصری غنی‌تر توسعه دهد. به گفته سیمو، در نسخه‌های آینده، نتایج جستجو با تصاویر بیشتر و منابع شفاف‌تری نمایش داده خواهند شد؛ تغییری که می‌تواند برای کاربردهایی مانند تبدیل واحدها، بررسی نتایج ورزشی یا درک سریع‌تر داده‌ها مفید باشد.

به نظر می‌رسد GPT Image 1.5 نه‌تنها یک به‌روزرسانی فنی، بلکه بخشی از استراتژی گسترده‌تر اوپن‌ای‌آی برای تثبیت دوباره جایگاه خود در رقابت فشرده هوش مصنوعی مولد باشد؛ رقابتی که حالا بیش از هر زمان دیگری به تجربه کاربری، سرعت و دقت ابزارها گره خورده است.

نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *