
هوش مصنوعی نیازمند صنعت داده هاست تا مثل نفت، چرخ های مدلهای هوش مصنوعی را بچرخاند. این صنعت بزرگ و تا حد خوبی ناشناخته است. با این مقاله از ورج در مورد این صنعت همراه باشید.
برندان فودی در نوزدهسالگی همراه با دو نفر از دوستان دوران دبیرستانش شرکت مرکور را راهاندازی کرد. هدف آنها این بود که دوستان دیگرشان، که خودشان هم استارتاپ داشتند، بتوانند مهندسان نرمافزار خارجی استخدام کنند. این شرکت در سال ۲۰۲۳ آغاز به کار کرد و در عمل نوعی شرکت تأمین نیروی انسانی بود، هرچند با سطح بالایی از خودکارسازی. مدلهای زبانی رزومهها را بررسی میکردند و مصاحبهها را انجام میدادند. تنها چند ماه پس از شروع فعالیت، مرکور به درآمد سالانه یک میلیون دلار رسیده و سود ده شد.
در اوایل سال ۲۰۲۴، شرکت اسکیلاِیآی با یک درخواست بزرگ به سراغ مرکور آمد: آنها به ۱۲۰۰ مهندس نرمافزار نیاز داشتند. در آن زمان، اسکیل یکی از معدود نامهای شناختهشده در صنعت دادههایی است که پشتصحنه آموزشی برای هوش مصنوعی هستند. این شرکت با سازماندهی صدها هزار نفر در سراسر جهان برای برچسبگذاری دادههای مربوط به خودروهای خودران، الگوریتمهای تجارت الکترونیک و چتباتهای مبتنی بر مدلهای زبانی، به ارزشی نزدیک به ۱۴ میلیارد دلار رسیده بود. اکنون که شرکتهایی مانند اوپناِیآی و آنتروپیک تلاش میکردند چتباتهای خود را به کدنویسی آموزش دهند، اسکیل برای تولید دادههای آموزشی به مهندسان نرمافزار نیاز داشت.
فودی احساس میکرد این موضوع میتواند نشانه تغییری بزرگتر در صنعت هوش مصنوعی باشد. او پیشتر درباره افزایش تقاضا برای کارهای تخصصی مرتبط با داده شنیده بود و حالا اسکیل درخواست هزار برنامهنویس را مطرح کرده بود. زمانی که مهندسانی که او جذب کرده بود از تأخیر در پرداختها شکایت کردند ــ مسئلهای که با توجه به شهرت اسکیل در مدیریت آشفته پلتفرم و شکایتهای حقوقی در کالیفرنیا درباره عدم پرداخت دستمزد بیسابقه نبود ــ فودی تصمیم گرفت واسطه را حذف کند.
در ماه سپتامبر، فودی اعلام کرد که درآمد سالانه مرکور به ۵۰۰ میلیون دلار رسیده و این شرکت را به سریع ترین رشد در تاریخ رساند. پیش از آن، این عنوان در اختیار شرکت انیسفر بود؛ شرکتی که ابزار کدنویسی مبتنی بر هوش مصنوعی به نام cursor را تولید میکند. در نشانهای از شرایط جدید بازار، کرسر اخیراً اعلام کرده بود که کاربرانش همان نوع دادههای آموزشی را تولید میکنند که آزمایشگاههای هوش مصنوعی حاضرند برای آن پول بپردازند. همچنین رسانه The Information گزارش داده بود که اوپناِیآی و xAI به خرید این شرکت علاقهمند شدهاند.
در آخرین دور جذب سرمایه، ارزش مرکور به ۱۰ میلیارد دلار رسید. فودی و دو همبنیانگذارش که اکنون ۲۲ سال دارند و بهعنوان جوانترین میلیاردرهای خودساخته شناخته میشوند. دستکم یکی از کارکنان اولیه شرکت نیز از مرکور جدا شده تا شرکت دادهمحور هوش مصنوعی خودش را تأسیس کند.
در حالی که بحثها درباره زیرساخت هوش مصنوعی معمولاً بر ساخت گسترده مراکز داده متمرکز است، رقابتی مشابه در حوزه دادههای آموزشی نیز در جریان است. آزمایشگاههای هوش مصنوعی تقریباً تمام دادههای در دسترس و آسان را مصرف کردهاند و این موضوع پرسشهایی را درباره امکان ادامه روند پیشرفت سریع صرفاً از طریق گسترش مقیاس داده های ورودی ایجاد کرده است. در همین حال، بسیاری از پیشرفتهای اخیر از طریق روشهای آموزشی جدید حاصل شدهاند که بر مجموعهدادههای کوچکتر و تخصصی متکیاند؛ دادههایی که توسط متخصصان حوزههایی مانند برنامهنویسی و مالی تهیه میشوند و شرکتهای هوش مصنوعی حاضرند برای آنها مبالغ بالایی بپردازند.
آمار دقیقی درباره میزان هزینهکرد آزمایشگاههای هوش مصنوعی وجود ندارد، اما برآوردهای تقریبی سرمایهگذاران و افراد مطلع صنعت نشان میدهد که این رقم امسال از ۱۰ میلیارد دلار فراتر رفته و همچنان در حال افزایش است؛ رقمی که عمدتاً از سوی حدود پنج شرکت بزرگ پرداخت میشود. این شرکتها هنوز راهی برای کسب درآمد پایدار از هوش مصنوعی پیدا نکردهاند، اما کسانی که داده آموزشی به آنها میفروشند، توانستهاند سودآور باشند. فعلاً این فروشندگان داده از معدود فعالان سودده در اکوسیستم هوش مصنوعی به شمار میآیند.
صنعت داده مدتهاست که کمارزشترین و کمجاذبهترین بخش توسعه هوش مصنوعی به شمار میرود. طبق یک مطالعه در سال ۲۰۲۱ از سوی پژوهشگران گوگل، این کار اغلب بهعنوان نوعی فعالیت خدماتی ناگزیر تلقی میشد که باید هرچه سریعتر و ارزانتر انجام شود. با این حال، یادگیری ماشین مدرن بدون اکوسیستم تأمینکنندگان داده وجود خارجی نداشت و این دو حوزه همزمان با یکدیگر پیش میروند.
مجموعهدادههای عظیمی که در اوایل دهه ۲۰۱۰ امکانپذیری یادگیری ماشین را ثابت کردند، به لطف ظهور پلتفرم Amazon Mechanical Turk چند سال پیش از آن شکل گرفتند؛ یک پلتفرم اولیه برای جمعسپاری که در آن هزاران نفر در ازای مبلغی ناچیز تصاویر سگها و گربهها را برچسبگذاری میکردند. تلاش برای توسعه خودروهای خودران نیز به رشد نسل جدیدی از شرکتها کمک کرد؛ از جمله Scale AI که روش جمعسپاری را از طریق پلتفرم کاری اختصاصی خود به نام Remotasks بهبود داد. در این پلتفرم، کارگران با استفاده از نرمافزارهای نیمهخودکار، دور علائم توقف و مخروطهای ترافیکی کادر میکشیدند.
چرخش صنعت به سمت چتباتهای مبتنی بر مدلهای زبانی پس از انتشار چت جی پی تی، تحول دیگری را رقم زد. ChatGPT توانایی مشابه انسانی خود را از روشی آموزشی به نام «یادگیری تقویتی با بازخورد انسانی» یا RLHF به دست آورد؛ روشی که در آن به پیمانکاران پول پرداخت میشد تا کیفیت پاسخهای چتبات را ارزیابی کنند. سپس مدلی دوم بر اساس همین ارزیابیها آموزش میدید و هر زمان ChatGPT کاری انجام میداد که این مدل پیشبینی میکرد مورد پسند انسانهاست، به آن پاداش میداد. ارائه این ارزیابیها کاری پیچیدهتر از نسلهای پیشین دادههای جمعسپاری بود، بهویژه با پیشرفتهتر شدن چتباتها؛ برای مثال، ارزیابی کیفیت یک توصیه پزشکی نیازمند فردی با آموزش پزشکی است.
بخش زیادی از این ارزیابیهای انسانی را شرکت Scale فراهم میکرد، اما شرکت جدیدی به نام Surge AI که توسط دانشمند دادهای به نام ادوین چن و با سرمایه شخصی او تأسیس شده بود، بهتدریج به دومین تأمینکننده بزرگ این صنعت تبدیل شد. چن در تجربههای کاری پیشین خود در گوگل، توییتر و فیسبوک از کیفیت پایین دادههایی که از فروشندگان دریافت میکرد ناراضی بود؛ دادههایی پر از برچسبگذاریهای اشتباه که توسط افرادی بدون تخصص لازم و با دستمزد بسیار پایین انجام میشد. چن توضیح میداد که این فروشندگان در عمل مانند «کارگاههای انسانی» عمل میکردند؛ یعنی صرفاً تعداد زیادی نیرو را وارد کار میکردند و تلاش داشتند کمیت را جایگزین کیفیت کنند.
در حالی که Scale پلتفرم Remotasks را داشت، Surge پلتفرمی به نام Data Annotation Tech ایجاد کرد؛ پلتفرمی کوچکتر، هدفمندتر در جذب نیرو و با کنترل کیفیت سختگیرانهتر. این شرکت همچنین دستمزد بالاتری پرداخت میکرد، حدود ۳۰ دلار در ساعت. با این حال، مانند Scale، شرکت Surge نیز در کالیفرنیا با شکایتهایی درباره طبقهبندی نادرست شغلی و عدم پرداخت دستمزد روبهرو است. تقاضا از سوی OpenAI و سایر آزمایشگاههایی که تلاش داشتند عقبماندگی خود را جبران کنند، بسیار بالا بود. Surge از زمان آغاز فعالیت سودآور بوده و طبق گزارشها سال گذشته بیش از یک میلیارد دلار درآمد داشته است؛ رقمی که از درآمد گزارششده Scale یعنی ۸۷۰ میلیون دلار بیشتر است. اوایل امسال، خبرگزاری رویترز گزارش داد که Surge برای نخستین بار در حال بررسی جذب سرمایه است و به دنبال یک میلیارد دلار سرمایهگذاری با ارزشگذاری ۱۵ میلیارد دلاری است. طبق گزارش فوربس، چن همچنان حدود ۷۵ درصد سهام شرکت را در اختیار دارد.
با این حال، دادههایی که نشان میدهند مردم کدام پاسخهای چتبات را ترجیح میدهند، سیگنالی خام و ابتدایی محسوب میشوند. مدلها بهراحتی میتوانند میانبُرهای سادهای یاد بگیرند؛ برای مثال، بهجای انجام کاری پیچیده مانند «بررسی سازگاری پاسخ با منابع معتبر»، صرفاً به کاربر بگویند «نکته بسیار خوبی مطرح کردهاید». حتی زمانی که متخصصان حوزههای مختلف ارزیابی را انجام میدهند، خروجیها اغلب فقط «متخصصانهتر» به نظر میرسند اما همچنان آنقدر غیرقابلاعتماد هستند که نتوان روی آنها حساب کرد. مدلها در آزمونهای حقوقی نمره عالی میگیرند اما قوانین ساختگی تولید میکنند؛ در آزمونهای حسابداری قبول میشوند اما سلولهای اشتباه را در یک صفحهگسترده انتخاب میکنند. در ماه ژوئیه، پژوهشگران MIT مطالعهای منتشر کردند که نشان میداد ۹۵ درصد کسبوکارهایی که هوش مصنوعی مولد را به کار گرفتهاند، هیچ بازدهی دریافت نکردهاند.
شرکتهای هوش مصنوعی امیدوارند که یادگیری تقویتی با معیارهای جزئیتر بتواند این وضعیت را تغییر دهد. پیشرفتهای اخیر در ریاضیات و کدنویسی نشاندهنده امکانپذیری این رویکرد است. مدلهای o1 از اوپناِیآی و R1 از دیپسیک نشان دادند که اگر مجموعهای از مسائل ریاضی و برنامهنویسی همراه با چند نمونه مرحلهبهمرحله از نحوه تفکر انسانها برای رسیدن به راهحل در اختیار مدل قرار گیرد، مدلها میتوانند در این حوزهها مهارت قابلتوجهی پیدا کنند. این مدلها هنگام آزمون و خطا برای رسیدن به پاسخ درست، روشهای مختلف را میسنجند، به عقب برمیگردند و تکنیکهای حل مسئلهای را به کار میگیرند که توسعهدهندگان آن را «استدلال» توصیف کردهاند.
مشکل اینجاست که مسائل ریاضی و کدنویسی، وظایفی ایدهآل و خودبسنده هستند و با چالشهایی که یک مهندس نرمافزار در دنیای واقعی با آن روبهرو میشود تفاوت دارند. بنابراین، امتیازهای مدلها در آزمونهای معیار، عملکرد واقعی آنها را نشان نمیدهد. برای اینکه مدلها واقعاً کاربردی شوند، شرکتهای هوش مصنوعی به دادههایی نیاز دارند که بازتابدهنده وظایف واقعی مهندسان باشد؛ به همین دلیل است که این شرکتها با سرعت بالا به دنبال استخدام مهندسان نرمافزار هستند.
مشکل دیگر این است که ریاضیات و کدنویسی احتمالاً سادهترین حوزههایی هستند که هوش مصنوعی میتواند بر آنها غلبه کند. برای اینکه یادگیری تقویتی کار کند، مدلها به یک سیگنال روشن از موفقیت نیاز دارند تا بتوانند آن را بهینهسازی کنند. به همین دلیل این روش برای بازیهایی مانند گو بسیار خوب عمل میکند: پیروزی نتیجهای کاملاً مشخص و بدون ابهام است، بنابراین مدلها میتوانند میلیونها راه مختلف را برای رسیدن به آن امتحان کنند. بهطور مشابه، کد یا اجرا میشود یا نمیشود. البته این قیاس کامل نیست؛ کد زشت و ناکارآمد هم ممکن است اجرا شود، اما دستکم یک معیار قابلسنجش برای بهینهسازی فراهم میکند.
در زندگی واقعی، موارد کمی چنین ویژگیای دارند. هیچ آزمون جهانیای وجود ندارد که تعیین کند یک لایحه حقوقی یا یک تحلیل مشاورهای «خوب» است یا نه. موفقیت به زمینه، هدف، مخاطب و بیشمار عامل دیگر بستگی دارد.
ژوئل پینو، مدیر ارشد هوش مصنوعی در شرکت Cohere، توضیح میدهد که در جامعه هوش مصنوعی نوعی باور وجود دارد مبنی بر اینکه میتوان یک تابع پاداش واحد تعریف کرد و اگر دقیقاً مشخص کنیم که از سیستمهای هوش مصنوعی چه میخواهیم، میتوانیم آنها را طوری آموزش دهیم که همان کار را انجام دهند. اما او تأکید میکند که واقعیت بسیار متنوعتر و پیچیدهتر از این تصور ساده است.
او همچنین توضیح میدهد که یادگیری تقویتی به یک تابع پاداش واحد نیاز دارد و در یافتن راهحلهایی که باید میان چند ارزش متضاد تعادل برقرار کنند چندان موفق نیست؛ بنابراین ممکن است یک الگوی کاملاً متفاوت نیاز داشته باشد.
در غیاب چنین الگوی جدیدی، شرکتهای هوش مصنوعی تلاش میکنند مسئله را با روش فشار مستقیم حل کنند: آنها از طریق شرکتهایی مانند مرکور و سرج، به هزاران وکیل، مشاور و متخصص حرفهای دیگر پول میپردازند تا با جزئیات دقیق، معیارهای یک کار خوب را در هر موقعیت قابلتصوری بنویسند. امید آنها این است که این فهرستها ـکه معمولاً روبریک ارزیابی (grading rubrics) نامیده میشوند، به مدلها امکان دهند مانند آنچه در مهندسی نرمافزار آغاز شده، از طریق یادگیری تقویتی به سطحی از شایستگی در سایر حوزهها نیز برسند.
این وضعیت شبیه آن بود که یک جعبه شکلات میلیارددلاری را بالای سر تمام استارتاپهای داده باز کنند: تقاضا برای خدمات شرکت Handshake یکشبه سه برابر شد.
تهیه روبریکها (فهرستهای معیار ارزیابی) کاری بسیار زمانبر است. افرادی که روی آنها کار میکنند میگویند صرف ۱۰ ساعت یا حتی بیشتر برای تکمیل و اصلاح یک روبریک کاملاً معمول است؛ روبریکی که ممکن است بیش از دوازده معیار مختلف داشته باشد. شرکتها جزئیات روشهای آموزشی خود را بهشدت محرمانه نگه میدارند، اما نمونهای که اوپناِیآی برای بنچمارک پزشکی اخیر خود منتشر کرده، تصویر خوبی از ماهیت این روبریکها ارائه میدهد. در این مثال، وقتی از مدل درباره همسایهای بیهوش سؤال میشود، مدل در صورتی پاداش میگیرد که در پاسخ خود توصیههایی مانند بررسی نبض، یافتن دستگاه شوک قلبی، انجام CPR و ۱۶ معیار دیگر را ذکر کند. در این بنچمارک نزدیک به ۵۰ هزار معیار وجود دارد که هرکدام برای مجموعهای از پرسشها به کار میروند. به گفته فعالان صنعت داده، آزمایشگاههای هوش مصنوعی در هر دوره آموزش، دهها تا صدها هزار روبریک سفارش میدهند که مجموعاً میلیونها معیار را شامل میشود.

به گفته فودی از شرکت مرکور، این روبریکها باید «بسیار جزئی و دقیق» باشند. او توضیح میدهد که تهیه روبریکهای مربوط به مشاوره از اینجا آغاز میشود که ابتدا یک طبقهبندی جامع از تمام صنایع محل فعالیت یک شرکت مشاوره تهیه شود، سپس انواع خدمات مشاورهای در هر صنعت مشخص شود، و بعد انواع گزارشها و تحلیلهایی که یک مشاور ممکن است در هر دسته تولید کند فهرست شود.
انجام این وظایف معمولاً نیازمند کار با رایانه است و هر یک از این کارها نیز به روبریک مخصوص خود نیاز دارد. برای مثال، ارسال یک ایمیل شامل مراحل متعددی است: باز کردن مرورگر، شروع یک پیام جدید، نوشتن متن و غیره. آکاش ساباروال، معاون مهندسی Scale، توضیح میدهد که اگر تنها معیار موفقیت این باشد که ایمیل ارسال یا دریافت شده، این کافی نیست و باید مجموعهای از اقدامات میانی نیز بررسی شود.
مدلها یاد میگیرند این وظایف را در نسخههای سادهشده نرمافزارها انجام دهند؛ محیطهایی که «محیطهای یادگیری تقویتی» نامیده میشوند و اغلب از آنها با عنوان «باشگاههای ورزشی هوش مصنوعی» یاد میشود. در این محیطها، مدلها میتوانند با آزمون و خطا یاد بگیرند که چگونه کلیکها و کشیدنهای لازم را انجام دهند تا در روبریک امتیاز خوبی کسب کنند. بازار این محیطها نیز به سرعت در حال رشد است.
همانند روبریکها، هر محیط یادگیری نیز باید متناسب با کاربردش طراحی شود. الکس رتنر، همبنیانگذار و مدیرعامل Snorkel AI، توضیح میدهد که گاهی این محیطها نسخهای شبیهسازیشده از سرویسهایی مانند DoorDash یا Salesforce هستند، اما در بسیاری موارد محیطهایی کاملاً اختصاصی و ویژه یک سازمان ساخته میشود. شرکت Snorkel که پیشتر نرمافزار برچسبگذاری داده تولید میکرد، اخیراً یک سرویس داده های انسانی نیز راهاندازی کرده است.
رتنر به یک تناقض مشهور در توسعه هوش مصنوعی اشاره میکند که «پارادوکس موراوک» نام دارد؛ این پارادوکس برگرفته از مشاهدات پژوهشگری در دهه ۱۹۸۰ است که در حوزه بینایی ماشین کار میکرد و متوجه شده بود کارهایی که برای انسانها بسیار سادهاند، برای ماشینها اغلب دشوارترین کارها هستند. در آن زمان تصور عمومی این بود که بینایی ماشین زودتر از شطرنج حل خواهد شد؛ زیرا تنها تعداد اندکی از انسانها توانایی و آموزش لازم برای استادبزرگ شدن در شطرنج را دارند، اما حتی کودکان هم میتوانند ببینند. اکنون مدلها میتوانند چالشهای پیچیده و تکمرحلهای کدنویسی را حل کنند، اما در انجام وظایف سادهتر مهندسی در دنیای واقعی، بدون نظارت دقیق انسانی، دچار مشکل میشوند، ابزارها را اشتباه به کار میگیرند و خطاهای آشکار مرتکب میشوند.
رتنر توضیح میدهد که این نوع کار واقعی، با معیارهای موفقیت مبهم و میانی که بسیار پیشپاافتادهتر از یک مسابقه کدنویسی به نظر میرسند، همان جایی است که مدلها دچار مشکل میشوند. او میگوید این حوزه همان مرز غیرمنتظره پیشرفت است و شرکتها ــ از جمله شرکت خودش ــ تلاش میکنند با ساخت محیطهای پیچیدهتر و روبریکهای دقیقتر، در همین مسیر حرکت کنند.
به گفته فروشندگان خدمات داده، پرتقاضاترین حوزهها آنهایی هستند که در نقطه تلاقی «قابلیت راستیآزمایی» و «ارزش اقتصادی» قرار میگیرند. مهندسی نرمافزار همچنان بزرگترین بخش است و پس از آن مالی و مشاوره قرار دارند. حوزه حقوق نیز محبوب است، اما تاکنون کمتر قابلراستیآزمایی بوده و بنابراین برای یادگیری تقویتی مناسبتر نیست. فیزیک، شیمی و ریاضیات همگی تقاضای بالا دارند. در واقع، تقریباً هر حوزهای که تصور کنید در این بازار حضور دارد؛ حتی آگهیهایی برای مهندسان هستهای و مربیان حیوانات دیده میشود.
الکس رتنر توضیح میدهد که دامنه این درخواستها از محیطهای بیمارستانی و بالینی گرفته تا پژوهشهای عمیق حقوقی گسترده است، و حتی به گفته او، اخیراً درخواستی برای ساخت روبریک در حوزه نجاری نیز دریافت کردهاند. او این وضعیت را پوششدهنده «تمام زوایا و گوشهوکنارهای تخصص انسانی» توصیف میکند.
رمزگذاری و تبدیل تمام مهارتها و دانش بشری به فهرستهای معیار، کاری عظیم و شاید بلندپروازانه باشد، اما آزمایشگاههای پیشرو بودجهای میلیارددلاری دارند و حجم تقاضای آنها در حال بازآرایی صنعت داده است. هر روز شرکتهای تازهای وارد این بازار میشوند و همه در تلاشاند متخصصانی با سابقههای برجستهتر و دستمزدهای بالاتر ارائه دهند.
شرکت Surge از ریاضیدانان برنده مدال فیلدز، وکلای دادگاه عالی و تاریخدانان هاروارد نام میبرد. مرکور تحلیلگران گلدمن و مشاوران مککنزی را تبلیغ میکند. شرکت Handshake AI، یکی دیگر از ارائهدهندگان سریعالرشد متخصصان، از فیزیکدانان فارغالتحصیل برکلی و استنفورد و شبکهای از فارغالتحصیلان بیش از هزار دانشگاه سخن میگوید.
گرت لرد، مدیرعامل و همبنیانگذار Handshake، سال گذشته متوجه تغییرات بازار داده شد؛ زمانی که ارائهدهندگان قدیمی داده به سراغ او آمدند و درخواست متخصص داشتند. Handshake متخصص داشت. لرد این شرکت را در سال ۲۰۱۴ بهعنوان ترکیبی از لینکدین و گلسدور برای دانشجویان و فارغالتحصیلان تازهکار تأسیس کرده بود تا برای کارآموزی و اولین شغلهایشان جستوجو کنند. بیش از هزار مرکز مشاوره شغلی دانشگاهی برای دسترسی به این پلتفرم هزینه پرداخت میکنند و شرکتهایی که به دنبال جذب نیرو از میان ۲۰ میلیون دانشجو، فارغالتحصیل، کارشناسی ارشد و دکتری عضو Handshake هستند نیز از آن استفاده میکنند. اوایل امسال، لرد خود وارد بازار داده هوش مصنوعی شد و در عمل یک شرکت دوم را در دل شرکت اول راهاندازی کرد: Handshake AI.
در ماه ژوئن، شرکت Meta مدیرعامل Scale را استخدام کرد و ۴۹ درصد سهام این شرکت را خرید. آزمایشگاههای رقیب نگران شدند که Scale دیگر یک ارائهدهنده بیطرف نباشد؛ آیا میتوانستند به دادههایی که اکنون توسط یک زیرمجموعه نیمهمتعلق به Meta ارائه میشد اعتماد کنند؟ این اتفاق مانند شکستن یک پیناتای میلیارددلاری بر سر تمام استارتاپهای داده بود. تقاضا برای Handshake یکشبه سه برابر شد.
در ماه نوامبر، Handshake به نرخ درآمد سالانه ۱۵۰ میلیون دلار رسید و از کسبوکار اصلی دهساله خود پیشی گرفت. لرد میگوید تقاضا بیش از توان شرکت است. او توضیح میدهد که در پنج ماه تعداد کارکنان از سه نفر به ۱۵۰ نفر رسیده و حتی ۱۸ نفر در یک روز کار خود را آغاز کردهاند. به گفته او، شرکت در حال تمام کردن میزهای خالی خود است.
تقاضای سیریناپذیر سازندگان مدلهای هوش مصنوعی هر شرکتی را که دادهای برای ارائه داشته باشد، به درون میدان جاذبه خود میکشد. شرکت Turing که کار خود را بهعنوان یک آژانس تأمین نیرو آغاز کرده بود، پس از آنکه اوپناِیآی در سال ۲۰۲۲ به سراغش رفت، به سمت تولید داده آموزشی چرخش کرد و پس از معامله Scale، جهش تقاضا را تجربه کرد. شرکت Labelbox نیز که نرمافزار برچسبگذاری تولید میکند، سال گذشته سرویس جدیدی به نام Alignerr راهاندازی کرد؛ جایی که خریداران میتوانند متخصصانی را که «Alignerr» نامیده میشوند و توسط مصاحبهگر هوش مصنوعی شرکت، به نام زارا، ارزیابی شدهاند، پیدا کنند.

آژانسهای تأمین نیرو، پیمانکاران تعدیل محتوا و کسبوکارهای مشابه نیز در حال بازآرایی خود حول محور آزمایشگاههای هوش مصنوعی هستند. شرکت Invisible Technologies ده سال پیش بهعنوان یک ربات دستیار شخصی آغاز به کار کرد که وظایف را به کارگران خارجی محول میکرد، اما با افزایش تقاضای آزمایشگاههای هوش مصنوعی برای تولید داده، درآمد آن بیست برابر شد. امسال، این شرکت یک مدیرعامل سابق مککنزی را استخدام کرد، سرمایهگذاری خطرپذیر جذب کرد و خود را بهعنوان یک شرکت آموزش هوش مصنوعی معرفی میکند. شرکت Pareto نیز مسیر مشابهی را طی کرده است؛ این شرکت در سال ۲۰۲۰ با ارائه دستیاران اجرایی مستقر در فیلیپین آغاز به کار کرد و اکنون خدمات داده آموزشی هوش مصنوعی ارائه میدهد.
شرکت Micro1 در سال ۲۰۲۲ بهعنوان یک آژانس تأمین مهندسان نرمافزار آغاز شد؛ مهندسانی که توسط هوش مصنوعی ارزیابی شده بودند. اما اکنون این شرکت به یک ارائهدهنده خدمات برچسبگذاری داده نیز تبدیل شده است. در ماه ژوئیه، خبرگزاری رویترز گزارش داد که درآمد سالانه این شرکت از ۱۰ میلیون دلار به ۱۰۰ میلیون دلار رسیده و در حال نهاییسازی دور سرمایهگذاری سری A با ارزشگذاری ۵۰۰ میلیون دلاری است.
حتی اوبر نیز تلاش میکند سهمی از این بازار به دست آورد. این شرکت در ماه اکتبر یک استارتاپ بلژیکی فعال در برچسبگذاری داده را خرید و اکنون در حال راهاندازی یک پلتفرم برچسبگذاری برای کارگران آمریکایی است تا رانندگان بتوانند زمانی که در حال رانندگی نیستند، دادهها را برچسبگذاری کنند.
این وضعیت به گفته برخی فعالان صنعت شبیه انفجار کامبرین بوده است و اکنون باید دید کدام شرکتها از این موج تکامل جان سالم به در میبرند.
پس از آن، فهرستی طولانی از بازیگران کوچکتر و تخصصیتر دیده میشود. شرکت Sapien به برچسبزنهای داده دستمزد را با رمزارز پرداخت میکند. رووان استون، مدیرعامل Sapien، در گفتوگویی با ورج در ماه ژوئیه توضیح داده بود که این شرکت ــ که در مدلهای عمودی متمرکز بر یک حوزه خاص تخصص دارد و لوسی گوئو، همبنیانگذار Scale، در هیئت مشاوران آن حضور دارد ــ در حال «جذب و یکپارچهسازی دانش جمعی بشریت» است. حتی این شرکت هم تنها استارتاپ داده انسانی نیست که پرداختها را با توکنهای رمزارزی انجام میدهد.
شرکتهایی مانند Stellar، Aligned، FlexiBench، Revelo و Deccan AI همگی شبکههای استعداد، متخصصان در حلقه تولید داده و خطوط غنیسازی داده خود را تبلیغ میکنند. شرکت Mechanize با ایجاد موجی از واکنشهای ویروسی در ماه آوریل اعلام کرد که هدفش «خودکارسازی کامل تمام کارها» است. اما این هدف تحریکآمیز چگونه قرار است محقق شود؟ با فروش دادههای آموزشی و محیطهای تمرینی، درست مانند سایر شرکتها.
این شرکتها، مشابه انویدیا که طراح غالب تراشههای هوش مصنوعی است، ابزارهای پایهای تب هوش مصنوعی را میفروشند و میلیاردها دلار هزینههای بدهیمحور آزمایشگاههای پیشرو را جذب میکنند؛ آزمایشگاههایی که در رقابت برای دستیابی به ابرهوش هستند. این کار نسبت به خودِ استخراج طلا (یا ساخت مدل) کسبوکاری امنتر است و شروع فروش داده بسیار سادهتر از طراحی تراشههای جدید است؛ به همین دلیل استارتاپها با سرعت در حال افزایشاند.
آدام جی. گرملینگ، یکی از کارکنان سابق Scale، میگوید اکنون «تقریباً همه متوجه شدهاند که میتوانند یک استارتاپ داده انسانی راه بیندازند». او توضیح میدهد که پس از اعلام خروجش از Scale در یکی از دورهای تعدیل نیرو، حدود ۳۰۰ پیام جذب نیرو در لینکدین دریافت کرده است. او نیز این وضعیت را همان «انفجار کامبرین» توصیف میکند و میگوید اکنون باید دید چه کسانی باقی میمانند.
صنعت داده ممکن است بهسرعت در حال رشد باشد، اما تاریخی پرآشوب دارد. این صنعت پر است از غولهای سابقی که با تغییر ناگهانی روشهای آموزشی یا خروج یک مشتری بزرگ سقوط کردهاند. در اوت ۲۰۲۰، ارزش بازار شرکت استرالیایی Appen که در برچسبگذاری داده فعالیت میکرد، از ۴.۳ میلیارد دلار عبور کرد؛ اما اکنون ارزش آن به کمتر از ۱۳۰ میلیون دلار رسیده است، یعنی سقوطی ۹۷ درصدی. برای Appen، حدود ۸۰ درصد درآمد از تنها پنج مشتری ــ مایکروسافت، اپل، متا، گوگل و آمازون ــ تأمین میشد و خروج حتی یکی از آنها میتوانست تهدیدی وجودی باشد.
بازار امروز نیز بهشدت متمرکز است. فودی در یک پادکست اخیر، تمرکز مشتریان مرکور را با انویدیا مقایسه کرد؛ جایی که چهار مشتری ۶۱ درصد درآمد را تشکیل میدهند. اگر سرمایهگذاران از تأمین مالی سازندگان مدل خسته شوند یا آزمایشگاهها روش آموزشی خود را تغییر دهند، پیامدها میتواند ویرانگر باشد. همه توسعهدهندگان هوش مصنوعی هماکنون از چندین تأمینکننده داده استفاده میکنند و همانطور که خروج گسترده از Scale نشان داد، آنها بهسرعت پول خود را جای دیگری میبرند.
این شرایط فضای رقابتی بسیار شدیدی ایجاد کرده است. در پادکستها و مصاحبهها، مدیران عامل به مدلهای کسبوکار رقبای خود حمله میکنند. چن همچنان معتقد است بسیاری از رقبایش «کارگاههای انسانی» هستند. فودی شرکتهای Surge و Scale را جمعسپارهای قدیمی در دورهای میداند که متخصصان با دستمزد بالا نقش اصلی را دارند. لرد از Handshake میگوید رقبایش هزاران دلار خرج میکنند تا فیزیکدانها را در تیکتاک هدف قرار دهند، در حالی که همه آنها از قبل در پلتفرم او حضور دارند. هر سه مدیر معتقدند Scale حتی پیش از سرمایهگذاری Meta نیز مشکلات کیفیت داشت. هر بار که یکی از این انتقادها منتشر میشود، سخنگوی Scale پاسخ تندی میدهد و فودی را متهم به جلب توجه یا چن را بهخاطر طولانی شدن روند جذب سرمایه مسخره میکند. Scale همچنین در حال حاضر از مرکور شکایت کرده و مدعی است این شرکت یکی از کارکنانش را جذب کرده که هنگام خروج، مشتریان را نیز با خود برده است.
فعلاً پولی که از آزمایشگاهها سرازیر میشود برای همه کافی است. آنها روبریک، محیطهای آموزشی و متخصصانی از هر نوع ممکن میخواهند، اما همچنان دادههای قدیمیتر را نیز خریداری میکنند. چن از Surge میگوید تقاضا «همواره در حال افزایش» است و شکلهای جدید آموزش «تقریباً مکمل یکدیگر» هستند.
حتی Scale نیز پس از ضربه ناشی از سرمایهگذاری Meta دوباره در حال رشد است و مشتریان بزرگ تا حدی بازگشتهاند. جیسون دروگ، مدیرعامل موقت Scale، در یک مصاحبه روی صحنه در ماه سپتامبر گفت که این شرکت همچنان با گوگل، مایکروسافت، اوپناِیآی و xAI همکاری میکند. برای رقابت بهتر در حوزه هوش مصنوعی سازمانی، Scale برنامهای به نام «Human Frontier Collective» برای متخصصان یقهسفید در حوزههای STEM مانند علوم کامپیوتر، مهندسی، ریاضیات و علوم شناختی راهاندازی کرده است.
Scale به ورج گفته است که هر دو بخش داده و نرمافزارهای کاربردی این شرکت هرکدام درآمدی در حد صدها میلیون دلار دارند؛ بخش داده هر ماه پس از سرمایهگذاری Meta رشد کرده و بخش نرمافزارهای کاربردی نیز از نیمه اول تا نیمه دوم سال ۲۰۲۵ دو برابر شده است. همچنین گفته شده که سهماهه سوم سال ۲۰۲۵ بهترین فصل بخش دولتی شرکت از سال ۲۰۲۰ بوده است، بخشی به دلیل قراردادهای دولتی. گزارشها حاکی از آن است که Scale انتظار دارد درآمد امسال بیش از دو برابر شود و به ۲ میلیارد دلار برسد. (شرکت از اظهار نظر رسمی درباره این رقم خودداری کرده است.)
به گفته بینگ لیو، رئیس بخش پژوهش Scale، این شرکت اکنون وارد فروش «ارزیابیها» شده است؛ آزمونهایی که توسعهدهندگان هوش مصنوعی برای تشخیص نقاط ضعف مدلهای خود و نیاز به داده بیشتر از آنها استفاده میکنند. استراتژی کسبوکار این است که شرکتها با استفاده از این ارزیابیها متوجه کمبودهای دادهای مدلهای خود شوند و سپس همان نوع داده را از Scale خریداری کنند.
ارزشگذاریهای ۱۱ رقمی شرکتهای تازهتأسیس داده را میتوان نشانهای از یک حباب هوش مصنوعی دانست، اما میتوان آن را نوعی شرطبندی روی مسیر خاصی از توسعه هوش مصنوعی نیز تلقی کرد. (هر دو برداشت میتوانند همزمان درست باشند.) هدفی که آزمایشگاههای هوش مصنوعی برای توجیه هزینههای عظیم خود مطرح میکنند، دستیابی قریبالوقوع به «هوش عمومی مصنوعی» است؛ چیزی که طبق تعریف منشور اوپناِیآی «بسیار خودمختار» است و میتواند «در بیشتر کارهای اقتصادی ارزشمند از انسان بهتر عمل کند».
این اصطلاح مبهم و محل اختلاف است، اما یک ویژگی اساسی هوش عمومی مصنوعی باید توانایی «تعمیم» باشد. اگر آن را برای انجام ریاضیات و حسابداری آموزش دهید، باید بتواند بدون نیاز به دورهای جدید یادگیری تقویتی درباره قوانین مالیاتی، مقررات مالیاتی ایالتی، نسخه جدید نرمافزارهای مالیاتی و موارد مشابه، مالیات شما را انجام دهد. یک عامل واقعاً توانمند نباید برای انجام هر نوع وظیفه در هر حوزهای به حجم عظیمی از دادههای جدید نیاز داشته باشد.



