پژوهشگران هوش مصنوعی مدعی اولین کشف علمی جهان با استفاده از یک مدل زبان بزرگ شده اند. یک پیشرفت که نشان می دهد فناوری پشت ChatGPT و برنامه های مشابه می توانند اطلاعاتی فراتر از دانش معمول انسانی تولید کند.
این یافته از Google DeepMind نشأت گرفته است. در حال حاضر، دانشمندان در حال بررسی هستند که آیا مدلهای زبان بزرگ، که اساس چتباتهای مدرن مانند ChatGPT از شرکت OpenAI و Bard از گوگل را تشکیل میدهند، میتوانند با اعمال تغییراتی جدید به جای بازنویسی اطلاعات یادگیری در فرآیند آموزش، به بهبود و بهبود عملکرد جدیدی دست یابند و به نتایج نوینی برسند؟
«زمانی که ما به اجرای این پروژه پرداختیم، هیچ نشانه ای از اینکه ممکن است نتیجه ای واقعاً نوآورانه به دست آید، مشاهده نشده بود»، پوشمیت کوهلی، رئیس تیم پژوهشگران هوش مصنوعی در DeepMind اظهار می کند: «تا جایی که ما اطلاع داریم، این بار اولین بوده است که یک کشف علمی واقعی و نوآورانه توسط یک مدل زبان بزرگ انجام شده است.»
«مدل های زبان بزرگ یا LLMها، شبکه های عصبی قدرتمندی هستند که الگوهای زبان را، از جمله کدهای کامپیوتری، از میزان زیادی از متون و داده های دیگر یاد می گیرند. با ظهور و پراکندگی ناگهانی ChatGPT در سال گذشته، این فناوری نرم افزارهای خراب را بهبود بخشیده و محتوایی از مقالات دانشگاهی و برنامه های سفر تا شعرهایی درباره تغییرات آب و هوا به سبک شکسپیر را تولید کرده است.
اما هرچند چت بات ها به شدت مورد توجه قرار گرفته اند، آن ها تمایل دارند به جای تولید اطلاعات جدید، به مراتب بیشتر به تکرار داده های یادگیری خود بپردازند و به نظر می رسد که منجر به پاسخ هایی شبیه به بهترین شخصیت های قهوه خانه ها شوند که امکان دارد در ابتدا جذاب و روان به نظر بیایند، اما با مشکلات جدی روبرو شوند.»
برای ساخت سیستم «FunSearch»، که مخفف «searching in the function space» (جستجو در فضای تابع) است، پژوهشگران هوش مصنوعی از یک LLM به منظور نوشتن راه حل های مسائل به صورت برنامه های کامپیوتری بهره بردند. این LLM با یک «ارزیاب» هماهنگ شده است که به طور خودکار برنامه ها را بر اساس عملکرد خود رتبه بندی می کند. بهترین برنامه ها سپس ترکیب می شوند و به LLM باز می گردند تا بهبود یابند. این کار باعث تحریک پیوسته سیستم می شود تا برنامه های ضعیف را به برنامه های قدرتمندتری تبدیل کند که ممکن است دانش جدیدی را کشف کنند.
پژوهشگران هوش مصنوعی از سیستم Funsearch نتیجه ای بهتر از تمام راه حل های موجود دریافت کردند!
پژوهشگران هوش مصنوعی این سیستم را برای حل دو معما به کار بردند. اولین معما یک چالش طولانی مدت و کمی غیرعمومی در ریاضیات خالص بود که به نام مسئله مجموعه کاپ شناخته می شود. این مسئله مربوط به یافتن بزرگترین مجموعه نقاط در فضا است که هیچ سه نقطه ای، یک خط را تشکیل ندهند. FunSearch برنامه هایی را تولید کرد که مجموعه های کاپ جدید بزرگتری تولید می کنند که بهتر از بهترین حل هایی است که ریاضیدانان تاکنون پیدا کرده اند.
معمای دوم مسئله بسته بندی کادرها بود که به دنبال بهترین روش ها برای بسته بندی اجناس با اندازه های مختلف در ظروف است. این مسئله در مورد اشیاء فیزیکی نیز صدق می کند، مانند بهترین روش برای ترتیب جعبه ها در یک کانتینر حمل و نقل، اما همین ریاضیات در حوزه های دیگری نیز مورد استفاده قرار می گیرد، مانند زمانبندی کارهای محاسباتی در مراکز داده. این مشکل معمولاً با استفاده از بسته بندی اجناس در اولین کادر خالی یا در کادر با کمترین فضای موجود که هنوز جا برای اجناس باشد، حل می شود.به گفته نتایج منتشر شده در مجله نیچر، FunSearch روش بهتری پیدا کرد که از ترک کردن فضاهای کوچک که احتمالاً هرگز پر نخواهند شد، جلوگیری می کرد،.
«در دو یا سه سال گذشته، چند نمونه جذاب از همکاری ریاضیدانان با هوش مصنوعی برای پیشرفت در مسائل حل نشده وجود داشته است”، سر تیم گاورز، استاد ریاضیات در دانشگاه کمبریج که در این تحقیق شرکت نداشت میگوید: “این کار ابزار بسیار جالب دیگری را برای چنین همکاری هایی به ما می دهد، امکان می دهد تا ریاضیدانان به طور کارآمد به دنبال ساختارهای زیرکانه و غیرمنتظره بگردند. حتی بهتر، این ساختارها قابل تفسیر انسانی هستند.»
پژوهشگران هوش مصنوعی در حال حاضر محدوده مسائل علمی که FunSearch می تواند با آن ها سر و کار داشته باشد، بررسی می کنند. یکی از محدودیت های اصلی این است که مسائل باید دارای راه حلی باشند که به طور خودکار قابل تأیید باشند. به این ترتیب بسیاری از سوالات در زمینه زیست شناسی از سوی این روش های قابل استفاده نیستند. چرا که فرضیات آن ها اغلب نیاز به آزمایشات آزمایشگاهی دارد.