مقالات هوش مصنوعی

صنعت داده های هوش مصنوعی: میلیاردها دلار ماشین و هزاران مهندس

هوش مصنوعی نیازمند صنعت داده هاست تا مثل نفت، چرخ های مدلهای هوش مصنوعی را بچرخاند. این صنعت بزرگ و تا حد خوبی ناشناخته است. با این مقاله از ورج در مورد این صنعت همراه باشید.

برندان فودی در نوزده‌سالگی همراه با دو نفر از دوستان دوران دبیرستانش شرکت مرکور را راه‌اندازی کرد. هدف آن‌ها این بود که دوستان دیگرشان، که خودشان هم استارتاپ داشتند، بتوانند مهندسان نرم‌افزار خارجی استخدام کنند. این شرکت در سال ۲۰۲۳ آغاز به کار کرد و در عمل نوعی شرکت تأمین نیروی انسانی بود، هرچند با سطح بالایی از خودکارسازی. مدل‌های زبانی رزومه‌ها را بررسی می‌کردند و مصاحبه‌ها را انجام می‌دادند. تنها چند ماه پس از شروع فعالیت، مرکور به درآمد سالانه یک میلیون دلار رسیده و سود ده شد.

در اوایل سال ۲۰۲۴، شرکت اسکیل‌اِی‌آی با یک درخواست بزرگ به سراغ مرکور آمد: آن‌ها به ۱۲۰۰ مهندس نرم‌افزار نیاز داشتند. در آن زمان، اسکیل یکی از معدود نام‌های شناخته‌شده در صنعت داده‌هایی است که پشت‌صحنه آموزشی برای هوش مصنوعی هستند. این شرکت با سازمان‌دهی صدها هزار نفر در سراسر جهان برای برچسب‌گذاری داده‌های مربوط به خودروهای خودران، الگوریتم‌های تجارت الکترونیک و چت‌بات‌های مبتنی بر مدل‌های زبانی، به ارزشی نزدیک به ۱۴ میلیارد دلار رسیده بود. اکنون که شرکت‌هایی مانند اوپن‌اِی‌آی و آنتروپیک تلاش می‌کردند چت‌بات‌های خود را به کدنویسی آموزش دهند، اسکیل برای تولید داده‌های آموزشی به مهندسان نرم‌افزار نیاز داشت.

فودی احساس می‌کرد این موضوع می‌تواند نشانه تغییری بزرگ‌تر در صنعت هوش مصنوعی باشد. او پیش‌تر درباره افزایش تقاضا برای کارهای تخصصی مرتبط با داده شنیده بود و حالا اسکیل درخواست هزار برنامه‌نویس را مطرح کرده بود. زمانی که مهندسانی که او جذب کرده بود از تأخیر در پرداخت‌ها شکایت کردند ــ مسئله‌ای که با توجه به شهرت اسکیل در مدیریت آشفته پلتفرم و شکایت‌های حقوقی در کالیفرنیا درباره عدم پرداخت دستمزد بی‌سابقه نبود ــ فودی تصمیم گرفت واسطه را حذف کند.

در ماه سپتامبر، فودی اعلام کرد که درآمد سالانه مرکور به ۵۰۰ میلیون دلار رسیده و این شرکت را به سریع ترین رشد در تاریخ رساند. پیش از آن، این عنوان در اختیار شرکت انیسفر بود؛ شرکتی که ابزار کدنویسی مبتنی بر هوش مصنوعی به نام cursor را تولید می‌کند. در نشانه‌ای از شرایط جدید بازار، کرسر اخیراً اعلام کرده بود که کاربرانش همان نوع داده‌های آموزشی را تولید می‌کنند که آزمایشگاه‌های هوش مصنوعی حاضرند برای آن پول بپردازند. همچنین رسانه The Information گزارش داده بود که اوپن‌اِی‌آی و xAI به خرید این شرکت علاقه‌مند شده‌اند.

در آخرین دور جذب سرمایه، ارزش مرکور به ۱۰ میلیارد دلار رسید. فودی و دو هم‌بنیان‌گذارش که اکنون ۲۲ سال دارند و به‌عنوان جوان‌ترین میلیاردرهای خودساخته شناخته می‌شوند. دست‌کم یکی از کارکنان اولیه شرکت نیز از مرکور جدا شده تا شرکت داده‌محور هوش مصنوعی خودش را تأسیس کند.

در حالی که بحث‌ها درباره زیرساخت هوش مصنوعی معمولاً بر ساخت گسترده مراکز داده متمرکز است، رقابتی مشابه در حوزه داده‌های آموزشی نیز در جریان است. آزمایشگاه‌های هوش مصنوعی تقریباً تمام داده‌های در دسترس و آسان را مصرف کرده‌اند و این موضوع پرسش‌هایی را درباره امکان ادامه روند پیشرفت سریع صرفاً از طریق گسترش مقیاس داده های ورودی ایجاد کرده است. در همین حال، بسیاری از پیشرفت‌های اخیر از طریق روش‌های آموزشی جدید حاصل شده‌اند که بر مجموعه‌داده‌های کوچک‌تر و تخصصی متکی‌اند؛ داده‌هایی که توسط متخصصان حوزه‌هایی مانند برنامه‌نویسی و مالی تهیه می‌شوند و شرکت‌های هوش مصنوعی حاضرند برای آن‌ها مبالغ بالایی بپردازند.

آمار دقیقی درباره میزان هزینه‌کرد آزمایشگاه‌های هوش مصنوعی وجود ندارد، اما برآوردهای تقریبی سرمایه‌گذاران و افراد مطلع صنعت نشان می‌دهد که این رقم امسال از ۱۰ میلیارد دلار فراتر رفته و همچنان در حال افزایش است؛ رقمی که عمدتاً از سوی حدود پنج شرکت بزرگ پرداخت می‌شود. این شرکت‌ها هنوز راهی برای کسب درآمد پایدار از هوش مصنوعی پیدا نکرده‌اند، اما کسانی که داده آموزشی به آن‌ها می‌فروشند، توانسته‌اند سودآور باشند. فعلاً این فروشندگان داده از معدود فعالان سودده در اکوسیستم هوش مصنوعی به شمار می‌آیند.

صنعت داده مدت‌هاست که کم‌ارزش‌ترین و کم‌جاذبه‌ترین بخش توسعه هوش مصنوعی به شمار می‌رود. طبق یک مطالعه در سال ۲۰۲۱ از سوی پژوهشگران گوگل، این کار اغلب به‌عنوان نوعی فعالیت خدماتی ناگزیر تلقی می‌شد که باید هرچه سریع‌تر و ارزان‌تر انجام شود. با این حال، یادگیری ماشین مدرن بدون اکوسیستم تأمین‌کنندگان داده وجود خارجی نداشت و این دو حوزه هم‌زمان با یکدیگر پیش می‌روند.

مجموعه‌داده‌های عظیمی که در اوایل دهه ۲۰۱۰ امکان‌پذیری یادگیری ماشین را ثابت کردند، به لطف ظهور پلتفرم Amazon Mechanical Turk چند سال پیش از آن شکل گرفتند؛ یک پلتفرم اولیه برای جمع‌سپاری که در آن هزاران نفر در ازای مبلغی ناچیز تصاویر سگ‌ها و گربه‌ها را برچسب‌گذاری می‌کردند. تلاش برای توسعه خودروهای خودران نیز به رشد نسل جدیدی از شرکت‌ها کمک کرد؛ از جمله Scale AI که روش جمع‌سپاری را از طریق پلتفرم کاری اختصاصی خود به نام Remotasks بهبود داد. در این پلتفرم، کارگران با استفاده از نرم‌افزارهای نیمه‌خودکار، دور علائم توقف و مخروط‌های ترافیکی کادر می‌کشیدند.

چرخش صنعت به سمت چت‌بات‌های مبتنی بر مدل‌های زبانی پس از انتشار چت جی پی تی، تحول دیگری را رقم زد. ChatGPT توانایی مشابه انسانی خود را از روشی آموزشی به نام «یادگیری تقویتی با بازخورد انسانی» یا RLHF به دست آورد؛ روشی که در آن به پیمانکاران پول پرداخت می‌شد تا کیفیت پاسخ‌های چت‌بات را ارزیابی کنند. سپس مدلی دوم بر اساس همین ارزیابی‌ها آموزش می‌دید و هر زمان ChatGPT کاری انجام می‌داد که این مدل پیش‌بینی می‌کرد مورد پسند انسان‌هاست، به آن پاداش می‌داد. ارائه این ارزیابی‌ها کاری پیچیده‌تر از نسل‌های پیشین داده‌های جمع‌سپاری بود، به‌ویژه با پیشرفته‌تر شدن چت‌بات‌ها؛ برای مثال، ارزیابی کیفیت یک توصیه پزشکی نیازمند فردی با آموزش پزشکی است.

بخش زیادی از این ارزیابی‌های انسانی را شرکت Scale فراهم می‌کرد، اما شرکت جدیدی به نام Surge AI که توسط دانشمند داده‌ای به نام ادوین چن و با سرمایه شخصی او تأسیس شده بود، به‌تدریج به دومین تأمین‌کننده بزرگ این صنعت تبدیل شد. چن در تجربه‌های کاری پیشین خود در گوگل، توییتر و فیس‌بوک از کیفیت پایین داده‌هایی که از فروشندگان دریافت می‌کرد ناراضی بود؛ داده‌هایی پر از برچسب‌گذاری‌های اشتباه که توسط افرادی بدون تخصص لازم و با دستمزد بسیار پایین انجام می‌شد. چن توضیح می‌داد که این فروشندگان در عمل مانند «کارگاه‌های انسانی» عمل می‌کردند؛ یعنی صرفاً تعداد زیادی نیرو را وارد کار می‌کردند و تلاش داشتند کمیت را جایگزین کیفیت کنند.

در حالی که Scale پلتفرم Remotasks را داشت، Surge پلتفرمی به نام Data Annotation Tech ایجاد کرد؛ پلتفرمی کوچک‌تر، هدفمندتر در جذب نیرو و با کنترل کیفیت سخت‌گیرانه‌تر. این شرکت همچنین دستمزد بالاتری پرداخت می‌کرد، حدود ۳۰ دلار در ساعت. با این حال، مانند Scale، شرکت Surge نیز در کالیفرنیا با شکایت‌هایی درباره طبقه‌بندی نادرست شغلی و عدم پرداخت دستمزد روبه‌رو است. تقاضا از سوی OpenAI و سایر آزمایشگاه‌هایی که تلاش داشتند عقب‌ماندگی خود را جبران کنند، بسیار بالا بود. Surge از زمان آغاز فعالیت سودآور بوده و طبق گزارش‌ها سال گذشته بیش از یک میلیارد دلار درآمد داشته است؛ رقمی که از درآمد گزارش‌شده Scale یعنی ۸۷۰ میلیون دلار بیشتر است. اوایل امسال، خبرگزاری رویترز گزارش داد که Surge برای نخستین بار در حال بررسی جذب سرمایه است و به دنبال یک میلیارد دلار سرمایه‌گذاری با ارزش‌گذاری ۱۵ میلیارد دلاری است. طبق گزارش فوربس، چن همچنان حدود ۷۵ درصد سهام شرکت را در اختیار دارد.

با این حال، داده‌هایی که نشان می‌دهند مردم کدام پاسخ‌های چت‌بات را ترجیح می‌دهند، سیگنالی خام و ابتدایی محسوب می‌شوند. مدل‌ها به‌راحتی می‌توانند میان‌بُرهای ساده‌ای یاد بگیرند؛ برای مثال، به‌جای انجام کاری پیچیده مانند «بررسی سازگاری پاسخ با منابع معتبر»، صرفاً به کاربر بگویند «نکته بسیار خوبی مطرح کرده‌اید». حتی زمانی که متخصصان حوزه‌های مختلف ارزیابی را انجام می‌دهند، خروجی‌ها اغلب فقط «متخصصانه‌تر» به نظر می‌رسند اما همچنان آن‌قدر غیرقابل‌اعتماد هستند که نتوان روی آن‌ها حساب کرد. مدل‌ها در آزمون‌های حقوقی نمره عالی می‌گیرند اما قوانین ساختگی تولید می‌کنند؛ در آزمون‌های حسابداری قبول می‌شوند اما سلول‌های اشتباه را در یک صفحه‌گسترده انتخاب می‌کنند. در ماه ژوئیه، پژوهشگران MIT مطالعه‌ای منتشر کردند که نشان می‌داد ۹۵ درصد کسب‌وکارهایی که هوش مصنوعی مولد را به کار گرفته‌اند، هیچ بازدهی دریافت نکرده‌اند.

شرکت‌های هوش مصنوعی امیدوارند که یادگیری تقویتی با معیارهای جزئی‌تر بتواند این وضعیت را تغییر دهد. پیشرفت‌های اخیر در ریاضیات و کدنویسی نشان‌دهنده امکان‌پذیری این رویکرد است. مدل‌های o1 از اوپن‌اِی‌آی و R1 از دیپ‌سیک نشان دادند که اگر مجموعه‌ای از مسائل ریاضی و برنامه‌نویسی همراه با چند نمونه مرحله‌به‌مرحله از نحوه تفکر انسان‌ها برای رسیدن به راه‌حل در اختیار مدل قرار گیرد، مدل‌ها می‌توانند در این حوزه‌ها مهارت قابل‌توجهی پیدا کنند. این مدل‌ها هنگام آزمون و خطا برای رسیدن به پاسخ درست، روش‌های مختلف را می‌سنجند، به عقب برمی‌گردند و تکنیک‌های حل مسئله‌ای را به کار می‌گیرند که توسعه‌دهندگان آن را «استدلال» توصیف کرده‌اند.

مشکل اینجاست که مسائل ریاضی و کدنویسی، وظایفی ایده‌آل و خودبسنده هستند و با چالش‌هایی که یک مهندس نرم‌افزار در دنیای واقعی با آن روبه‌رو می‌شود تفاوت دارند. بنابراین، امتیازهای مدل‌ها در آزمون‌های معیار، عملکرد واقعی آن‌ها را نشان نمی‌دهد. برای اینکه مدل‌ها واقعاً کاربردی شوند، شرکت‌های هوش مصنوعی به داده‌هایی نیاز دارند که بازتاب‌دهنده وظایف واقعی مهندسان باشد؛ به همین دلیل است که این شرکت‌ها با سرعت بالا به دنبال استخدام مهندسان نرم‌افزار هستند.

مشکل دیگر این است که ریاضیات و کدنویسی احتمالاً ساده‌ترین حوزه‌هایی هستند که هوش مصنوعی می‌تواند بر آن‌ها غلبه کند. برای اینکه یادگیری تقویتی کار کند، مدل‌ها به یک سیگنال روشن از موفقیت نیاز دارند تا بتوانند آن را بهینه‌سازی کنند. به همین دلیل این روش برای بازی‌هایی مانند گو بسیار خوب عمل می‌کند: پیروزی نتیجه‌ای کاملاً مشخص و بدون ابهام است، بنابراین مدل‌ها می‌توانند میلیون‌ها راه مختلف را برای رسیدن به آن امتحان کنند. به‌طور مشابه، کد یا اجرا می‌شود یا نمی‌شود. البته این قیاس کامل نیست؛ کد زشت و ناکارآمد هم ممکن است اجرا شود، اما دست‌کم یک معیار قابل‌سنجش برای بهینه‌سازی فراهم می‌کند.

در زندگی واقعی، موارد کمی چنین ویژگی‌ای دارند. هیچ آزمون جهانی‌ای وجود ندارد که تعیین کند یک لایحه حقوقی یا یک تحلیل مشاوره‌ای «خوب» است یا نه. موفقیت به زمینه، هدف، مخاطب و بی‌شمار عامل دیگر بستگی دارد.

ژوئل پینو، مدیر ارشد هوش مصنوعی در شرکت Cohere، توضیح می‌دهد که در جامعه هوش مصنوعی نوعی باور وجود دارد مبنی بر اینکه می‌توان یک تابع پاداش واحد تعریف کرد و اگر دقیقاً مشخص کنیم که از سیستم‌های هوش مصنوعی چه می‌خواهیم، می‌توانیم آن‌ها را طوری آموزش دهیم که همان کار را انجام دهند. اما او تأکید می‌کند که واقعیت بسیار متنوع‌تر و پیچیده‌تر از این تصور ساده است.

او همچنین توضیح می‌دهد که یادگیری تقویتی به یک تابع پاداش واحد نیاز دارد و در یافتن راه‌حل‌هایی که باید میان چند ارزش متضاد تعادل برقرار کنند چندان موفق نیست؛ بنابراین ممکن است یک الگوی کاملاً متفاوت نیاز داشته باشد.

در غیاب چنین الگوی جدیدی، شرکت‌های هوش مصنوعی تلاش می‌کنند مسئله را با روش فشار مستقیم حل کنند: آن‌ها از طریق شرکت‌هایی مانند مرکور و سرج، به هزاران وکیل، مشاور و متخصص حرفه‌ای دیگر پول می‌پردازند تا با جزئیات دقیق، معیارهای یک کار خوب را در هر موقعیت قابل‌تصوری بنویسند. امید آن‌ها این است که این فهرست‌ها ـکه معمولاً روبریک ارزیابی (grading rubrics) نامیده می‌شوند، به مدل‌ها امکان دهند مانند آنچه در مهندسی نرم‌افزار آغاز شده، از طریق یادگیری تقویتی به سطحی از شایستگی در سایر حوزه‌ها نیز برسند.

این وضعیت شبیه آن بود که یک جعبه شکلات میلیارددلاری را بالای سر تمام استارتاپ‌های داده باز کنند: تقاضا برای خدمات شرکت Handshake یک‌شبه سه برابر شد.

 

تهیه روبریک‌ها (فهرست‌های معیار ارزیابی) کاری بسیار زمان‌بر است. افرادی که روی آن‌ها کار می‌کنند می‌گویند صرف ۱۰ ساعت یا حتی بیشتر برای تکمیل و اصلاح یک روبریک کاملاً معمول است؛ روبریکی که ممکن است بیش از دوازده معیار مختلف داشته باشد. شرکت‌ها جزئیات روش‌های آموزشی خود را به‌شدت محرمانه نگه می‌دارند، اما نمونه‌ای که اوپن‌اِی‌آی برای بنچمارک پزشکی اخیر خود منتشر کرده، تصویر خوبی از ماهیت این روبریک‌ها ارائه می‌دهد. در این مثال، وقتی از مدل درباره همسایه‌ای بی‌هوش سؤال می‌شود، مدل در صورتی پاداش می‌گیرد که در پاسخ خود توصیه‌هایی مانند بررسی نبض، یافتن دستگاه شوک قلبی، انجام CPR و ۱۶ معیار دیگر را ذکر کند. در این بنچمارک نزدیک به ۵۰ هزار معیار وجود دارد که هرکدام برای مجموعه‌ای از پرسش‌ها به کار می‌روند. به گفته فعالان صنعت داده، آزمایشگاه‌های هوش مصنوعی در هر دوره آموزش، ده‌ها تا صدها هزار روبریک سفارش می‌دهند که مجموعاً میلیون‌ها معیار را شامل می‌شود.

صنعت داده های هوش مصنوعی: میلیاردها دلار ماشین و هزاران مهندس

به گفته فودی از شرکت مرکور، این روبریک‌ها باید «بسیار جزئی و دقیق» باشند. او توضیح می‌دهد که تهیه روبریک‌های مربوط به مشاوره از اینجا آغاز می‌شود که ابتدا یک طبقه‌بندی جامع از تمام صنایع محل فعالیت یک شرکت مشاوره تهیه شود، سپس انواع خدمات مشاوره‌ای در هر صنعت مشخص شود، و بعد انواع گزارش‌ها و تحلیل‌هایی که یک مشاور ممکن است در هر دسته تولید کند فهرست شود.

انجام این وظایف معمولاً نیازمند کار با رایانه است و هر یک از این کارها نیز به روبریک مخصوص خود نیاز دارد. برای مثال، ارسال یک ایمیل شامل مراحل متعددی است: باز کردن مرورگر، شروع یک پیام جدید، نوشتن متن و غیره. آکاش ساباروال، معاون مهندسی Scale، توضیح می‌دهد که اگر تنها معیار موفقیت این باشد که ایمیل ارسال یا دریافت شده، این کافی نیست و باید مجموعه‌ای از اقدامات میانی نیز بررسی شود.

مدل‌ها یاد می‌گیرند این وظایف را در نسخه‌های ساده‌شده نرم‌افزارها انجام دهند؛ محیط‌هایی که «محیط‌های یادگیری تقویتی» نامیده می‌شوند و اغلب از آن‌ها با عنوان «باشگاه‌های ورزشی هوش مصنوعی» یاد می‌شود. در این محیط‌ها، مدل‌ها می‌توانند با آزمون و خطا یاد بگیرند که چگونه کلیک‌ها و کشیدن‌های لازم را انجام دهند تا در روبریک امتیاز خوبی کسب کنند. بازار این محیط‌ها نیز به سرعت در حال رشد است.

همانند روبریک‌ها، هر محیط یادگیری نیز باید متناسب با کاربردش طراحی شود. الکس رتنر، هم‌بنیان‌گذار و مدیرعامل Snorkel AI، توضیح می‌دهد که گاهی این محیط‌ها نسخه‌ای شبیه‌سازی‌شده از سرویس‌هایی مانند DoorDash یا Salesforce هستند، اما در بسیاری موارد محیط‌هایی کاملاً اختصاصی و ویژه یک سازمان ساخته می‌شود. شرکت Snorkel که پیش‌تر نرم‌افزار برچسب‌گذاری داده تولید می‌کرد، اخیراً یک سرویس داده های انسانی نیز راه‌اندازی کرده است.

رتنر به یک تناقض مشهور در توسعه هوش مصنوعی اشاره می‌کند که «پارادوکس موراوک» نام دارد؛ این پارادوکس برگرفته از مشاهدات پژوهشگری در دهه ۱۹۸۰ است که در حوزه بینایی ماشین کار می‌کرد و متوجه شده بود کارهایی که برای انسان‌ها بسیار ساده‌اند، برای ماشین‌ها اغلب دشوارترین کارها هستند. در آن زمان تصور عمومی این بود که بینایی ماشین زودتر از شطرنج حل خواهد شد؛ زیرا تنها تعداد اندکی از انسان‌ها توانایی و آموزش لازم برای استادبزرگ شدن در شطرنج را دارند، اما حتی کودکان هم می‌توانند ببینند. اکنون مدل‌ها می‌توانند چالش‌های پیچیده و تک‌مرحله‌ای کدنویسی را حل کنند، اما در انجام وظایف ساده‌تر مهندسی در دنیای واقعی، بدون نظارت دقیق انسانی، دچار مشکل می‌شوند، ابزارها را اشتباه به کار می‌گیرند و خطاهای آشکار مرتکب می‌شوند.

رتنر توضیح می‌دهد که این نوع کار واقعی، با معیارهای موفقیت مبهم و میانی که بسیار پیش‌پاافتاده‌تر از یک مسابقه کدنویسی به نظر می‌رسند، همان جایی است که مدل‌ها دچار مشکل می‌شوند. او می‌گوید این حوزه همان مرز غیرمنتظره پیشرفت است و شرکت‌ها ــ از جمله شرکت خودش ــ تلاش می‌کنند با ساخت محیط‌های پیچیده‌تر و روبریک‌های دقیق‌تر، در همین مسیر حرکت کنند.

به گفته فروشندگان خدمات داده، پرتقاضاترین حوزه‌ها آن‌هایی هستند که در نقطه تلاقی «قابلیت راستی‌آزمایی» و «ارزش اقتصادی» قرار می‌گیرند. مهندسی نرم‌افزار همچنان بزرگ‌ترین بخش است و پس از آن مالی و مشاوره قرار دارند. حوزه حقوق نیز محبوب است، اما تاکنون کمتر قابل‌راستی‌آزمایی بوده و بنابراین برای یادگیری تقویتی مناسب‌تر نیست. فیزیک، شیمی و ریاضیات همگی تقاضای بالا دارند. در واقع، تقریباً هر حوزه‌ای که تصور کنید در این بازار حضور دارد؛ حتی آگهی‌هایی برای مهندسان هسته‌ای و مربیان حیوانات دیده می‌شود.

الکس رتنر توضیح می‌دهد که دامنه این درخواست‌ها از محیط‌های بیمارستانی و بالینی گرفته تا پژوهش‌های عمیق حقوقی گسترده است، و حتی به گفته او، اخیراً درخواستی برای ساخت روبریک در حوزه نجاری نیز دریافت کرده‌اند. او این وضعیت را پوشش‌دهنده «تمام زوایا و گوشه‌وکنارهای تخصص انسانی» توصیف می‌کند.

رمزگذاری و تبدیل تمام مهارت‌ها و دانش بشری به فهرست‌های معیار، کاری عظیم و شاید بلندپروازانه باشد، اما آزمایشگاه‌های پیشرو بودجه‌ای میلیارددلاری دارند و حجم تقاضای آن‌ها در حال بازآرایی صنعت داده است. هر روز شرکت‌های تازه‌ای وارد این بازار می‌شوند و همه در تلاش‌اند متخصصانی با سابقه‌های برجسته‌تر و دستمزدهای بالاتر ارائه دهند.

شرکت Surge از ریاضی‌دانان برنده مدال فیلدز، وکلای دادگاه عالی و تاریخ‌دانان هاروارد نام می‌برد. مرکور تحلیل‌گران گلدمن و مشاوران مک‌کنزی را تبلیغ می‌کند. شرکت Handshake AI، یکی دیگر از ارائه‌دهندگان سریع‌الرشد متخصصان، از فیزیک‌دانان فارغ‌التحصیل برکلی و استنفورد و شبکه‌ای از فارغ‌التحصیلان بیش از هزار دانشگاه سخن می‌گوید.

گرت لرد، مدیرعامل و هم‌بنیان‌گذار Handshake، سال گذشته متوجه تغییرات بازار داده شد؛ زمانی که ارائه‌دهندگان قدیمی داده به سراغ او آمدند و درخواست متخصص داشتند. Handshake متخصص داشت. لرد این شرکت را در سال ۲۰۱۴ به‌عنوان ترکیبی از لینکدین و گلس‌دور برای دانشجویان و فارغ‌التحصیلان تازه‌کار تأسیس کرده بود تا برای کارآموزی و اولین شغل‌هایشان جست‌وجو کنند. بیش از هزار مرکز مشاوره شغلی دانشگاهی برای دسترسی به این پلتفرم هزینه پرداخت می‌کنند و شرکت‌هایی که به دنبال جذب نیرو از میان ۲۰ میلیون دانشجو، فارغ‌التحصیل، کارشناسی ارشد و دکتری عضو Handshake هستند نیز از آن استفاده می‌کنند. اوایل امسال، لرد خود وارد بازار داده هوش مصنوعی شد و در عمل یک شرکت دوم را در دل شرکت اول راه‌اندازی کرد: Handshake AI.

در ماه ژوئن، شرکت Meta مدیرعامل Scale را استخدام کرد و ۴۹ درصد سهام این شرکت را خرید. آزمایشگاه‌های رقیب نگران شدند که Scale دیگر یک ارائه‌دهنده بی‌طرف نباشد؛ آیا می‌توانستند به داده‌هایی که اکنون توسط یک زیرمجموعه نیمه‌متعلق به Meta ارائه می‌شد اعتماد کنند؟ این اتفاق مانند شکستن یک پیناتای میلیارددلاری بر سر تمام استارتاپ‌های داده بود. تقاضا برای Handshake یک‌شبه سه برابر شد.

در ماه نوامبر، Handshake به نرخ درآمد سالانه ۱۵۰ میلیون دلار رسید و از کسب‌وکار اصلی ده‌ساله خود پیشی گرفت. لرد می‌گوید تقاضا بیش از توان شرکت است. او توضیح می‌دهد که در پنج ماه تعداد کارکنان از سه نفر به ۱۵۰ نفر رسیده و حتی ۱۸ نفر در یک روز کار خود را آغاز کرده‌اند. به گفته او، شرکت در حال تمام کردن میزهای خالی خود است.

تقاضای سیری‌ناپذیر سازندگان مدل‌های هوش مصنوعی هر شرکتی را که داده‌ای برای ارائه داشته باشد، به درون میدان جاذبه خود می‌کشد. شرکت Turing که کار خود را به‌عنوان یک آژانس تأمین نیرو آغاز کرده بود، پس از آنکه اوپن‌اِی‌آی در سال ۲۰۲۲ به سراغش رفت، به سمت تولید داده آموزشی چرخش کرد و پس از معامله Scale، جهش تقاضا را تجربه کرد. شرکت Labelbox نیز که نرم‌افزار برچسب‌گذاری تولید می‌کند، سال گذشته سرویس جدیدی به نام Alignerr راه‌اندازی کرد؛ جایی که خریداران می‌توانند متخصصانی را که «Alignerr» نامیده می‌شوند و توسط مصاحبه‌گر هوش مصنوعی شرکت، به نام زارا، ارزیابی شده‌اند، پیدا کنند.

صنعت داده های هوش مصنوعی: میلیاردها دلار ماشین و هزاران مهندس

آژانس‌های تأمین نیرو، پیمانکاران تعدیل محتوا و کسب‌وکارهای مشابه نیز در حال بازآرایی خود حول محور آزمایشگاه‌های هوش مصنوعی هستند. شرکت Invisible Technologies ده سال پیش به‌عنوان یک ربات دستیار شخصی آغاز به کار کرد که وظایف را به کارگران خارجی محول می‌کرد، اما با افزایش تقاضای آزمایشگاه‌های هوش مصنوعی برای تولید داده، درآمد آن بیست برابر شد. امسال، این شرکت یک مدیرعامل سابق مک‌کنزی را استخدام کرد، سرمایه‌گذاری خطرپذیر جذب کرد و خود را به‌عنوان یک شرکت آموزش هوش مصنوعی معرفی می‌کند. شرکت Pareto نیز مسیر مشابهی را طی کرده است؛ این شرکت در سال ۲۰۲۰ با ارائه دستیاران اجرایی مستقر در فیلیپین آغاز به کار کرد و اکنون خدمات داده آموزشی هوش مصنوعی ارائه می‌دهد.

شرکت Micro1 در سال ۲۰۲۲ به‌عنوان یک آژانس تأمین مهندسان نرم‌افزار آغاز شد؛ مهندسانی که توسط هوش مصنوعی ارزیابی شده بودند. اما اکنون این شرکت به یک ارائه‌دهنده خدمات برچسب‌گذاری داده نیز تبدیل شده است. در ماه ژوئیه، خبرگزاری رویترز گزارش داد که درآمد سالانه این شرکت از ۱۰ میلیون دلار به ۱۰۰ میلیون دلار رسیده و در حال نهایی‌سازی دور سرمایه‌گذاری سری A با ارزش‌گذاری ۵۰۰ میلیون دلاری است.

حتی اوبر نیز تلاش می‌کند سهمی از این بازار به دست آورد. این شرکت در ماه اکتبر یک استارتاپ بلژیکی فعال در برچسب‌گذاری داده را خرید و اکنون در حال راه‌اندازی یک پلتفرم برچسب‌گذاری برای کارگران آمریکایی است تا رانندگان بتوانند زمانی که در حال رانندگی نیستند، داده‌ها را برچسب‌گذاری کنند.

این وضعیت به گفته برخی فعالان صنعت شبیه انفجار کامبرین بوده است و اکنون باید دید کدام شرکت‌ها از این موج تکامل جان سالم به در می‌برند.

پس از آن، فهرستی طولانی از بازیگران کوچک‌تر و تخصصی‌تر دیده می‌شود. شرکت Sapien به برچسب‌زن‌های داده دستمزد را با رمزارز پرداخت می‌کند. رووان استون، مدیرعامل Sapien، در گفت‌وگویی با ورج در ماه ژوئیه توضیح داده بود که این شرکت ــ که در مدل‌های عمودی متمرکز بر یک حوزه خاص تخصص دارد و لوسی گوئو، هم‌بنیان‌گذار Scale، در هیئت مشاوران آن حضور دارد ــ در حال «جذب و یکپارچه‌سازی دانش جمعی بشریت» است. حتی این شرکت هم تنها استارتاپ داده انسانی نیست که پرداخت‌ها را با توکن‌های رمزارزی انجام می‌دهد.

شرکت‌هایی مانند Stellar، Aligned، FlexiBench، Revelo و Deccan AI همگی شبکه‌های استعداد، متخصصان در حلقه تولید داده و خطوط غنی‌سازی داده خود را تبلیغ می‌کنند. شرکت Mechanize با ایجاد موجی از واکنش‌های ویروسی در ماه آوریل اعلام کرد که هدفش «خودکارسازی کامل تمام کارها» است. اما این هدف تحریک‌آمیز چگونه قرار است محقق شود؟ با فروش داده‌های آموزشی و محیط‌های تمرینی، درست مانند سایر شرکت‌ها.

این شرکت‌ها، مشابه انویدیا که طراح غالب تراشه‌های هوش مصنوعی است، ابزارهای پایه‌ای تب هوش مصنوعی را می‌فروشند و میلیاردها دلار هزینه‌های بدهی‌محور آزمایشگاه‌های پیشرو را جذب می‌کنند؛ آزمایشگاه‌هایی که در رقابت برای دستیابی به ابرهوش هستند. این کار نسبت به خودِ استخراج طلا (یا ساخت مدل) کسب‌وکاری امن‌تر است و شروع فروش داده بسیار ساده‌تر از طراحی تراشه‌های جدید است؛ به همین دلیل استارتاپ‌ها با سرعت در حال افزایش‌اند.

آدام جی. گرم‌لینگ، یکی از کارکنان سابق Scale، می‌گوید اکنون «تقریباً همه متوجه شده‌اند که می‌توانند یک استارتاپ داده انسانی راه بیندازند». او توضیح می‌دهد که پس از اعلام خروجش از Scale در یکی از دورهای تعدیل نیرو، حدود ۳۰۰ پیام جذب نیرو در لینکدین دریافت کرده است. او نیز این وضعیت را همان «انفجار کامبرین» توصیف می‌کند و می‌گوید اکنون باید دید چه کسانی باقی می‌مانند.

صنعت داده ممکن است به‌سرعت در حال رشد باشد، اما تاریخی پرآشوب دارد. این صنعت پر است از غول‌های سابقی که با تغییر ناگهانی روش‌های آموزشی یا خروج یک مشتری بزرگ سقوط کرده‌اند. در اوت ۲۰۲۰، ارزش بازار شرکت استرالیایی Appen که در برچسب‌گذاری داده فعالیت می‌کرد، از ۴.۳ میلیارد دلار عبور کرد؛ اما اکنون ارزش آن به کمتر از ۱۳۰ میلیون دلار رسیده است، یعنی سقوطی ۹۷ درصدی. برای Appen، حدود ۸۰ درصد درآمد از تنها پنج مشتری ــ مایکروسافت، اپل، متا، گوگل و آمازون ــ تأمین می‌شد و خروج حتی یکی از آن‌ها می‌توانست تهدیدی وجودی باشد.

بازار امروز نیز به‌شدت متمرکز است. فودی در یک پادکست اخیر، تمرکز مشتریان مرکور را با انویدیا مقایسه کرد؛ جایی که چهار مشتری ۶۱ درصد درآمد را تشکیل می‌دهند. اگر سرمایه‌گذاران از تأمین مالی سازندگان مدل خسته شوند یا آزمایشگاه‌ها روش آموزشی خود را تغییر دهند، پیامدها می‌تواند ویرانگر باشد. همه توسعه‌دهندگان هوش مصنوعی هم‌اکنون از چندین تأمین‌کننده داده استفاده می‌کنند و همان‌طور که خروج گسترده از Scale نشان داد، آن‌ها به‌سرعت پول خود را جای دیگری می‌برند.

این شرایط فضای رقابتی بسیار شدیدی ایجاد کرده است. در پادکست‌ها و مصاحبه‌ها، مدیران عامل به مدل‌های کسب‌وکار رقبای خود حمله می‌کنند. چن همچنان معتقد است بسیاری از رقبایش «کارگاه‌های انسانی» هستند. فودی شرکت‌های Surge و Scale را جمع‌سپارهای قدیمی در دوره‌ای می‌داند که متخصصان با دستمزد بالا نقش اصلی را دارند. لرد از Handshake می‌گوید رقبایش هزاران دلار خرج می‌کنند تا فیزیک‌دان‌ها را در تیک‌تاک هدف قرار دهند، در حالی که همه آن‌ها از قبل در پلتفرم او حضور دارند. هر سه مدیر معتقدند Scale حتی پیش از سرمایه‌گذاری Meta نیز مشکلات کیفیت داشت. هر بار که یکی از این انتقادها منتشر می‌شود، سخنگوی Scale پاسخ تندی می‌دهد و فودی را متهم به جلب توجه یا چن را به‌خاطر طولانی شدن روند جذب سرمایه مسخره می‌کند. Scale همچنین در حال حاضر از مرکور شکایت کرده و مدعی است این شرکت یکی از کارکنانش را جذب کرده که هنگام خروج، مشتریان را نیز با خود برده است.

فعلاً پولی که از آزمایشگاه‌ها سرازیر می‌شود برای همه کافی است. آن‌ها روبریک، محیط‌های آموزشی و متخصصانی از هر نوع ممکن می‌خواهند، اما همچنان داده‌های قدیمی‌تر را نیز خریداری می‌کنند. چن از Surge می‌گوید تقاضا «همواره در حال افزایش» است و شکل‌های جدید آموزش «تقریباً مکمل یکدیگر» هستند.

حتی Scale نیز پس از ضربه ناشی از سرمایه‌گذاری Meta دوباره در حال رشد است و مشتریان بزرگ تا حدی بازگشته‌اند. جیسون دروگ، مدیرعامل موقت Scale، در یک مصاحبه روی صحنه در ماه سپتامبر گفت که این شرکت همچنان با گوگل، مایکروسافت، اوپن‌اِی‌آی و xAI همکاری می‌کند. برای رقابت بهتر در حوزه هوش مصنوعی سازمانی، Scale برنامه‌ای به نام «Human Frontier Collective» برای متخصصان یقه‌سفید در حوزه‌های STEM مانند علوم کامپیوتر، مهندسی، ریاضیات و علوم شناختی راه‌اندازی کرده است.

Scale به ورج گفته است که هر دو بخش داده و نرم‌افزارهای کاربردی این شرکت هرکدام درآمدی در حد صدها میلیون دلار دارند؛ بخش داده هر ماه پس از سرمایه‌گذاری Meta رشد کرده و بخش نرم‌افزارهای کاربردی نیز از نیمه اول تا نیمه دوم سال ۲۰۲۵ دو برابر شده است. همچنین گفته شده که سه‌ماهه سوم سال ۲۰۲۵ بهترین فصل بخش دولتی شرکت از سال ۲۰۲۰ بوده است، بخشی به دلیل قراردادهای دولتی. گزارش‌ها حاکی از آن است که Scale انتظار دارد درآمد امسال بیش از دو برابر شود و به ۲ میلیارد دلار برسد. (شرکت از اظهار نظر رسمی درباره این رقم خودداری کرده است.)

به گفته بینگ لیو، رئیس بخش پژوهش Scale، این شرکت اکنون وارد فروش «ارزیابی‌ها» شده است؛ آزمون‌هایی که توسعه‌دهندگان هوش مصنوعی برای تشخیص نقاط ضعف مدل‌های خود و نیاز به داده بیشتر از آن‌ها استفاده می‌کنند. استراتژی کسب‌وکار این است که شرکت‌ها با استفاده از این ارزیابی‌ها متوجه کمبودهای داده‌ای مدل‌های خود شوند و سپس همان نوع داده را از Scale خریداری کنند.

ارزش‌گذاری‌های ۱۱ رقمی شرکت‌های تازه‌تأسیس داده را می‌توان نشانه‌ای از یک حباب هوش مصنوعی دانست، اما می‌توان آن را نوعی شرط‌بندی روی مسیر خاصی از توسعه هوش مصنوعی نیز تلقی کرد. (هر دو برداشت می‌توانند هم‌زمان درست باشند.) هدفی که آزمایشگاه‌های هوش مصنوعی برای توجیه هزینه‌های عظیم خود مطرح می‌کنند، دستیابی قریب‌الوقوع به «هوش عمومی مصنوعی» است؛ چیزی که طبق تعریف منشور اوپن‌اِی‌آی «بسیار خودمختار» است و می‌تواند «در بیشتر کارهای اقتصادی ارزشمند از انسان بهتر عمل کند».

این اصطلاح مبهم و محل اختلاف است، اما یک ویژگی اساسی هوش عمومی مصنوعی باید توانایی «تعمیم» باشد. اگر آن را برای انجام ریاضیات و حسابداری آموزش دهید، باید بتواند بدون نیاز به دورهای جدید یادگیری تقویتی درباره قوانین مالیاتی، مقررات مالیاتی ایالتی، نسخه جدید نرم‌افزارهای مالیاتی و موارد مشابه، مالیات شما را انجام دهد. یک عامل واقعاً توانمند نباید برای انجام هر نوع وظیفه در هر حوزه‌ای به حجم عظیمی از داده‌های جدید نیاز داشته باشد.

نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *