اخبار استارتاپیایده های استارتاپیمعرفی استارتاپمقالات هوش مصنوعی

معرفی استارتاپ Fairgen: بهبود نتایج نظرسنجی ها با داده های مصنوعی

معرفی شرکت Fairgen، فعال در بهبود نتایج نظرسنجی هایی با داده های ناکفی، با استفاده از  هوش مصنوعی.

از زمان های بسیار قدیم از نظرسنجی ها برای به دست آوردن بینش در مورد جمعیت، محصولات و افکار عمومی استفاده شده است. و در حالی که روش شناسی نظرسنجی ممکن است در طول زمان تغییر کرده باشد، یک چیز ثابت مانده است: نیاز به تعداد بسیار زیادی از مردم.

اما اگر نتوانید افراد کافی برای ایجاد یک نمونه با اندازه کافی برای رسیدن به نتایج معنادار پیدا کنید، چه؟ یا اگر می توانید افراد کافی پیدا کنید، اما تعداد افرادی را که می توانید مصاحبه کنید به دلیل محدودیت بودجه محدود است چه؟ مقاله زیر که ترجمه ای از مقاله ی تک کرانچ است، بخوانید:

اینجاست که Fairgen به داد شرکتها می رسد. این استارتاپ اسرائیلی پلتفرمی را راه اندازی کرده که از هوش مصنوعی آماری برای تولید داده های مصنوعی استفاده می کند. طبق ادعای خود استارتاپ،  این داده ها به مقدار کافی واقعی هستند. این شرکت همچنین اعلام کرده است که از کنسرسیومی از سرمایه گذاران شامل Maverick Ventures Israel، The Creator Fund، Tal Ventures، Ignia و تعدادی از سرمایه گذاران فرشته، ۵.۵ میلیون دلار سرمایه جمع کرده  که مجموع سرمایه جمع آوری شده از زمان آغاز به کار آن ها تا کنون را به ۸ میلیون دلار می رساند.

تمرکز Fairgen: داده های مصنوعی

داده ها ممکن است رگ حیات هوش مصنوعی باشند، اما از همیشه سنگ بنای تحقیقات بازار هم بوده اند. این دو در دنیای Fairgen به هم برخورد می کنند. درست زمانی که نیاز به داده های با کیفیت کمی بیشتر می شود.

Fairgen که در سال ۲۰۲۱ در تل آویو اسرائیل تأسیس شد، قبلاً روی مقابله با سوگیری در هوش مصنوعی متمرکز بود. اما در اواخر سال ۲۰۲۲، این شرکت به محصول جدیدی به نام Fairboost تغییر جهت داد. اکنون این محصول را در حالت بتا عرضه می کند.

Fairboost وعده داده است که مجموعه داده های کوچک تری را تا سه برابر «افزایش» می دهد و بینش های دقیق تری را در مورد داده هایی که ممکن است در غیر این صورت دسترسی به آن ها بسیار دشوار یا پرهزینه باشد، امکان پذیر می سازد. به این ترتیب شرکت ها می توانند یک مدل یادگیری ماشین عمیق برای هر مجموعه داده ای که در پلتفرم Fairgen آپلود می کنند، با الگوهای یادگیری هوش مصنوعی آماری در بخش های مختلف نظرسنجی آموزش دهند.

مفهوم داده های مصنوعی، داده هایی که به طور مصنوعی به جای رویدادهای دنیای واقعی ایجاد شده اند، جدید نیست. ریشه های آن به روزهای اولیه محاسبات باز می گردد، زمانی که برای آزمایش نرم افزارها و الگوریتم ها و شبیه سازی فرآیندها استفاده می شد. اما داده های مصنوعی آن طور که امروزه استفاده می شود، معنا و مفهوم دیگری یافته است. به ویژه با ظهور یادگیری ماشینی، جایی که به طور فزاینده ای برای آموزش مدل ها استفاده می شود. با استفاده از داده های تولید شده مصنوعی که حاوی اطلاعات حساسی نیستند، می توان هم مشکلات کمبود داده و هم نگرانی های مربوط به حریم خصوصی داده ها را برطرف کرد.

Fairgen، آخرین استارت آپی است که داده های مصنوعی را آزمایش کرده و تحقیقات بازار را به عنوان هدف اصلی خود قرار داده است. فعالیت محصولFairgen ، بر اساس تحلیل دقیق و الگوهایی است که از نمونه های کوچک بازار ایجاد می شود. این شرکت می گوید که می تواند حداقل دو برابری رشد نمونه های اصلی را تضمین کند و در میانگین، به تقویت سه برابری دست یابد.

به این ترتیب، Fairgen ممکن است بتواند ثابت کند که فردی با گروه سنی و/یا سطح درآمدی خاص تمایل بیشتری به پاسخ دادن به یک سوال به روشی خاص دارد. همچنین می توان هر تعداد نقطه داده را برای برون یابی از مجموعه داده اصلی ترکیب کرد. این اساساً در مورد تولید آنچه ساموئل کوهن، یکی از بنیان گذاران و مدیر عامل Fairgen می گوید، «بخش های قوی تر و قوی تری از داده ها، با حاشیه خطای کمتر» است.

کوهن به TechCrunch توضیح داد: «تحقیق اصلی این بود که مردم به طور فزاینده ای متنوع شده اند کسب و کارها باید با آن سازگار شوند و باید بخش های مشتریان خود را درک کنند. بخش ها بسیار متفاوت هستند.» نسل زد نسبت به افراد مسن تر، بسیار متفاوت فکر کرده و عمل می کنند. برای اینکه بتوانیم این بخش از بازار را درک کنیم، هزینه های زیادی متحمل می شویم و زمان و منابع عملیاتی زیادی را باید صرف کنیم. اینجا بود که متوجه شدم نقطه درد اینجاست. ما می دانستیم که داده های مصنوعی در آنجا نقشی دارند.»

یک انتقاد آشکار  که شرکت هم در حل آن تلاش دارد، این است که همه این ها مانند یک میانبر بزرگ برای انجام کار میدانی، مصاحبه با افراد واقعی و جمع آوری نظرات واقعی به نظر می رسد.

مطمئناً هر گروهی که کمتر نمایندگی می شود باید نگران باشد که صدای واقعی آنها با صداهای جعلی جایگزین شود؟

فرناندو زاتز، رئیس بخش رشد Fairgen، به تک کرانچ گفت: «هر مشتری که در فضای تحقیقاتی با آنها صحبت کردیم، نقاط کور بزرگی (مخاطبان کاملاً غیرقابل دسترسی) دارد. آنها در واقع پروژه ها را نمی فروشند زیرا افراد کافی در دسترس نیستند، به خصوص در دنیایی که به طور فزاینده ای متنوع است، جایی که بازار شما اجزای بسیار متنوعی دارد. گاهی اوقات آنها نمی توانند به کشورهای خاصی بروند. آنها نمی توانند به آمارهای جمعیتی خاص دسترسی داشته باشند، بنابراین در واقع در پروژه ها ضرر می کنند زیرا نمی توانند به اهداف فروش خود برسند. آنها حداقل تعداد [پاسخ دهندگان] را دارند و اگر به این تعداد نرسند، نمی توانند بینش تولید شده را بفروشند.»

Fairgen تنها شرکتی نیست که از هوش مصنوعی مولد در زمینه تحقیقات بازار استفاده می کند. سال گذشته شرکت کوالتریکس اعلام کرد که در طول چهار سال ۵۰۰ میلیون دلار سرمایه گذاری کرده است تا هوش مصنوعی مولد را با تمرکز اساسی بر تحقیقات کیفی، به پلتفرم خود بیاورد.

اما اعتبارسنجی نتایج نقش مهمی در متقاعد کردن مردم به این موضوع دارد. این که داده های مصنوعی یک راه حل مناسب است و نه یک راهکار برای کاهش هزینه که نتایج نامناسب تولید کند. Fairgen برای اعتبار سنجی راهکار خود، داده های تقویت شده با داده واقعی را با داده های تقویت شده با داده های مصنوعی مقایسه می کند.

کوهن گفت: «دقیقاً همین نوع آزمایش با هر مشتری که ثبت نام می کنیم، را انجام می دهیم.»

بررسی آماری

کوهن دارای مدرک کارشناسی ارشد در علوم آماری از دانشگاه آکسفورد، و دکترای یادگیری ماشین از دانشگاه UCL لندن است که بخشی از آن شامل یک دوره ۹ ماهه به عنوان یک محقق در متا بود.

بنی اشنایدر یکی از بنیانگذاران این شرکت و رئیس هیئت مدیره است که قبلاً در فضای نرم افزاری سازمانی فعالیت داشت. او چهار شرکت فروخته شده به نام خود دارد. Ravello به Oracle با مبلغ ۵۰۰ میلیون دلار گزارش شده در سال ۲۰۱۶. Qumranet به Red Hat به مبلغ ۱۰۷ میلیون دلار در سال ۲۰۰۸; P-Cube به سیسکو برای ۲۰۰ میلیون دلار در سال ۲۰۰۴. و پنتاکام به سیسکو با قیمت ۱۱۸ دلار در سال ۲۰۰۰.

نهایتا امانوئل کاندس، استاد آمار و مهندسی برق در دانشگاه استنفورد، که به عنوان مشاور علمی ارشد Fairgen فعالیت می کند.

این ستون فقرات تجاری و ریاضی یک نقطه قوت عمده برای شرکتی است که تلاش می کند جهان را متقاعد کند که داده های مصنوعی اگر به درستی تولیود و استفاده شوند، می توانند به خوبی داده های واقعی باشند. به همین دلیل است که آنها می توانند آستانه ها و محدودیت های فناوری آن را به وضوح توضیح دهند: یک نمونه باید حداقل چه اندازه ای داشته باشد تا نتیجه مناسب حاصل شود؟

به گفته کوهن، آنها در حالت ایده آل به حداقل ۳۰۰ پاسخ دهنده واقعی برای یک نظرسنجی نیاز دارند و از این طریق Fairboost می تواند اندازه بخش را افزایش دهد که بیش از ۱۵٪ از نظرسنجی گسترده تر را تشکیل نمی دهد.

کوهن گفت: «زیر ۱۵ درصد از یک بررسی بزرگتر، می توانیم افزایش سه برابری تعداد داده ها را با توجه به نتایج صدها آزمایش تضمین کنیم. از نظر آماری، استفاده از محصول ما در داده هایی بزرگتر از ۱۵% کل جامعه، نتیجه چشمگیر نخواهد داشت. داده ها در حال حاضر سطوح اطمینان خوبی را ارائه می دهند، و پاسخ دهندگان مصنوعی ما فقط می توانند به طور بالقوه با آن ها مطابقت داشته باشند یا ارتقای اندکی را داشته باشند.»

عدم استفاده از مدل های بزرگ زبانی (LLM)

شایان ذکر است که Fairgen از مدل های زبان بزرگ (LLM) استفاده نمی کند، و پلتفرم آن پاسخ های «انگلیسی ساده» را در یک سیستم مشابه ChatGPT ایجاد نمی کند. دلیل این امر این است که یک LLM از آموخته های بی شمار منابع داده ای دیگری خارج از پارامترهای مورد مطالعه استفاده می کند، که احتمال معرفی سوگیری ناسازگار با تحقیقات کمی را افزایش می دهد.

Fairgen صرفا در حوزه مدل های آماری و داده های جدولی است و آموزش آن صرفاً بر داده های موجود در مجموعه داده های آپلود شده متکی است. این سیستم به طور موثر به محققان بازار اجازه می دهد تا با برون یابی از داده ها، پاسخ های جدید و مصنوعی تولید کنند.

کوهن گفت: «ما به یک دلیل بسیار ساده از هیچ LLM استفاده نمی کنیم. اگر بخواهیم در مورد بسیاری از نظرسنجی های [دیگر] از قبل مدل را آموزش دهیم، این فقط اطلاعات نادرست را منتقل می کند. ممکن است مدل شما از نظرسنجی دیگری چیزی را یاد بگیرد و این مطلوب ما نیست. همه چیز مربوط به قابلیت اطمینان مدل است.»

از نظر مدل کسب وکار، Fairgen به عنوان SaaS فروخته می شود و شرکت ها نظرسنجی های خود را در هر قالب ساختاری (.CSV، یا .SAV) در پلتفرم ابری Fairgen آپلود می کنند. به گفته کوهن، بسته به تعداد سؤالات، آموزش مدل بر اساس داده هایی که داده می شود، حداکثر ۲۰ دقیقه طول می کشد. سپس کاربر یک بخش از داده ها را انتخاب می کند (زیر مجموعه ای از پاسخ دهندگان که ویژگی های خاصی را به اشتراک می گذارند)  به عنوان مثال. افرادی از نسل زد که در صنعت x مشغول به کار هستند. سپس Fairgen یک فایل جدید را ارائه می دهد که ساختاری مشابه با فایل آموزشی اصلی دارد، دقیقاً با همان سوالات، فقط ردیف های جدید.

Fairgen هم اکنون در BVA و شرکت فرانسوی نظرسنجی و تحقیقات بازار IFOP استفاده می شود که قبلاً فناوری های توسعه داده شده در این استارتاپ را در خدمات خود ادغام کرده اند. IFOP، که کمی شبیه به گالوپ در ایالات متحده است، از Fairgen برای نظرسنجی در انتخابات اروپایی استفاده می کند، اگرچه کوهن فکر می کند ممکن است از این مدل برای انتخابات ایالات متحده در اواخر امسال نیز استفاده شود.

کوهن گفت: «IFOP اساساً مهر تأیید ماست، زیرا حدود ۱۰۰ سال است که فعالیت می کند. آنها این فناوری را تایید کردند و شریک اصلی طراحی ما بودند. ما همچنین در حال آزمایش یا ادغام با برخی از بزرگترین شرکت های تحقیقات بازار در جهان هستیم که هنوز اجازه ندارم در مورد آنها صحبت کنم.»

به این مطلب چه امتیازی می دهید ؟
[Total: ۰ Average: ۰]
نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *