
با نزدیک شدن به پایان سال ۲۰۲۵، چشمانداز هوش مصنوعی بهطور بنیادین با سال گذشته تفاوت یافته است. عامل اصلی این تغییر نه یک سرمایهگذاری تریلیون دلاری در سیلیکونولی، بلکه ظهور شتابان استارتاپ چینی «دیپسیک» بود؛ شرکتی که سد محاسباتی محافظ سلطه غولهای فناوری غربی را شکست. این شرکت با عرضه مدلهایی که عملکردی همسطح یا حتی فراتر از پیشرفتهترین سامانههای جهان داشتند، اما با هزینهای بسیار کمتر، معادلات اقتصادی توسعه هوش مصنوعی را به چالش کشید.
اوج این تحول در اوایل ۲۰۲۵ با معرفی مدلهای DeepSeek-V3 و DeepSeek-R1 رقم خورد. این دو مدل نشان دادند که دستیابی به سطح پیشرفته استدلال با بودجهای کمتر از ۶ میلیون دلار ممکن است؛ رقمی که در تضاد آشکار با چرخههای سرمایهگذاری چند میلیارد دلاری رقبای آمریکایی قرار دارد. این رویداد به سقوط تاریخی بازار در «دوشنبه دیپسیک» در ژانویه و قرار گرفتن یک اپلیکیشن چینی در صدر فروشگاه اپاستور آمریکا منجر شد؛ نشانهای از آغاز عصری تازه در پیشرفت غیرمتمرکز و فوقکارآمد هوش مصنوعی.
معجزه ۵.۶ میلیون دلاری: برتری فنی بر نیروی خام
پایه فنی سلطه دیپسیک در سال ۲۰۲۵ بر عرضه DeepSeek-V3 و جانشین آن با تمرکز بر استدلال، یعنی DeepSeek-R1، استوار بود. در حالی که صنعت به قوانین مقیاسپذیری عادت کرده بود که نیازمند افزایش نمایی تعداد GPUها و مصرف برق بودند، DeepSeek-V3 از معماری Mixture-of-Experts (MoE) با ۶۷۱ میلیارد پارامتر بهره برد که تنها ۳۷ میلیارد پارامتر آن در هر توکن فعال میشود. این فعالسازی پراکنده باعث شد مدل هوشمندی یک سامانه عظیم را حفظ کند، اما با سرعت و کارایی هزینهای مشابه یک مدل کوچکتر عمل نماید.
در قلب این کارآمدی، نوآوریای به نام Multi-head Latent Attention (MLA) قرار دارد. مدلهای ترنسفورمر سنتی معمولاً با نیازهای سنگین حافظه KV cache در پردازش متنهای طولانی دچار مشکل میشوند. MLA با استفاده از فشردهسازی رتبه پایین، این بار حافظه را تا ۹۳.۳ درصد کاهش داد و امکان پردازش متنهایی با طول ۱۲۸ هزار توکن را با کمترین فشار سختافزاری فراهم کرد. افزون بر این، دیپسیک استفاده از دقت FP8 (اعداد شناور ۸ بیتی) را در کل فرایند آموزش پیشگامانه به کار گرفت؛ رویکردی که سرعت محاسبات را حتی روی سختافزارهای قدیمی مانند تراشههای NVIDIA H800 افزایش داد، تراشههایی که پیشتر به دلیل محدودیتهای صادراتی آمریکا برای آموزش در سطح پیشرفته ناکافی تلقی میشدند.

در آزمونهای مختلف، DeepSeek-R1 توانست تواناییهای استدلالی همسطح سری o1 شرکت OpenAI ارائه دهد، بهویژه در حوزه ریاضیات و برنامهنویسی. در آزمون MATH-500، این مدل امتیاز ۹۱.۶ درصد کسب کرد که بالاتر از رکورد ۸۵.۵ درصدی رقبای اصلی غربی بود. جامعه پژوهشی هوش مصنوعی در ابتدا نسبت به ادعای هزینه ۵.۵۷ میلیون دلاری آموزش تردید داشت، اما با انتشار وزنهای باز و گزارشهای فنی دقیق از سوی شرکت، روشن شد که بهینهسازی نرمافزاری عملاً نیاز به خوشههای سختافزاری عظیم را دور زده است.
اختلال در بازار و سقوط «دوشنبه دیپسیک»
پیامدهای اقتصادی کارآمدی دیپسیک در روز دوشنبه ۲۷ ژانویه ۲۰۲۵ با شدت تمام به والاستریت رسید. این روز که بعدها به نام «دوشنبه دیپسیک» شناخته شد، شاهد بزرگترین سقوط یکروزه در تاریخ بازار سهام بود؛ سهام شرکت انویدیا (NASDAQ: NVDA) نزدیک به ۱۸ درصد افت کرد و حدود ۶۰۰ میلیارد دلار از ارزش بازار آن از بین رفت. سرمایهگذارانی که تصور میکردند «سد سختافزاری» مانعی دائمی برای ورود رقباست، با این واقعیت روبهرو شدند که ساخت هوش مصنوعی در سطح جهانی با تعداد کمتر و تراشههای ارزانتر نیز امکانپذیر است.
این موج به سایر شرکتهای «هفت شگفتانگیز» نیز سرایت کرد. سهام مایکروسافت (NASDAQ: MSFT)، آلفابت (NASDAQ: GOOGL) و متا (NASDAQ: META) کاهش چشمگیری داشت، زیرا روایت غالب از «چه کسی بیشترین GPU را دارد» به «چه کسی میتواند در معماری نوآوری کند» تغییر یافت. موفقیت دیپسیک نشان داد که برنامههای سرمایهگذاری تریلیون دلاری برای ساخت مراکز داده عظیم ممکن است بیش از حد متکی باشند، اگر مدلهای پیشرفته با هزینهای اندک قابل دسترس شوند. همین امر شرکتهای بزرگ آمریکایی را وادار کرد تا تمرکز خود را از اندازه خوشههای سختافزاری به مقیاسپذیری در استنتاج و کارآمدی معماری تغییر دهند.
تأثیر دیپسیک تنها به بازار سهام محدود نشد. در اواخر ژانویه، اپلیکیشن دیپسیک به رتبه نخست فروشگاه iOS آمریکا رسید و از ChatGPT و Gemini گوگل پیشی گرفت. این نخستین بار بود که یک مدل هوش مصنوعی چینی توانست در ایالات متحده به پذیرش گسترده و ویروسی دست یابد. این اپلیکیشن در کمتر از سه هفته بیش از ۲۳ میلیون بار دانلود شد. موفقیت آن نشان داد که کاربران بیش از منشأ جغرافیایی هوش مصنوعی، به توانایی استدلال و سرعت مدل R1 اهمیت میدهند.

تغییر ژئوپولیتیک در چشمانداز هوش مصنوعی
ظهور دیپسیک بهطور بنیادین چشمانداز جهانی هوش مصنوعی را تغییر داد و صنعت را به سمت استاندارد «وزنهای باز» سوق داد. این شرکت با انتشار مدلهای خود تحت مجوز MIT، دسترسی به هوش مصنوعی در سطح پیشرفته را دموکراتیک کرد و به توسعهدهندگان و استارتاپها در سراسر جهان امکان داد تا بدون هزینههای سنگین APIهای اختصاصی، بر پایه معماری آن کار کنند. این اقدام فشار زیادی بر آزمایشگاههای بستهای مانند OpenAI و Anthropic وارد کرد که مدلهای پشت دیوار پرداختی خود را در برابر جایگزینی رایگان و قدرتمند دیدند.
این تحول همچنین بحثهای شدیدی درباره رقابت هوش مصنوعی میان آمریکا و چین برانگیخت. سالها کنترل صادرات نیمهرساناهای پیشرفته از سوی آمریکا با هدف کند کردن پیشرفت چین در این حوزه اعمال شده بود. توانایی دیپسیک در دور زدن این محدودیتها با استفاده از GPUهای H800 و بهینهسازیهای معماری هوشمندانه، بهعنوان یک «لحظه اسپوتنیک» برای دولت آمریکا توصیف شد. این امر نشان داد که هرچند دسترسی به سختافزار همچنان مهم است، شکاف هوش میتواند با نوآوری الگوریتمی پر شود.
البته ظهور مدلی با محوریت چین بدون نگرانی نبوده است. موضوعاتی مانند حریم خصوصی دادهها، احتمال سانسور دولتی در خروجیهای مدل و پیامدهای بلندمدت اتکا به زیرساختهای توسعهیافته خارجی، به محور اصلی بحثهای سیاستگذاری فناوری در سال ۲۰۲۵ تبدیل شدهاند. با وجود این نگرانیها، «اثر دیپسیک» روند جهانی به سوی شفافیت و کارآمدی را شتاب بخشیده و به پایان عصری انجامیده است که تنها چند شرکت چند میلیارد دلاری میتوانستند سطح پیشرفته هوش مصنوعی را تعریف کنند.
راه به سوی ۲۰۲۶: گردشکارهای ایجنت محور و نسخه V4
روندی که دیپسیک آغاز کرده، نشانهای از توقف ندارد. پس از عرضه نسخه DeepSeek-V3.2 در دسامبر ۲۰۲۵ که با معرفی «توجه پراکنده» هزینه استنتاج را تا ۷۰ درصد کاهش داد، گزارشها حاکی از آن است که این شرکت در حال کار بر روی نسخه نسل بعدی DeepSeek-V4 است. انتظار میرود این مدل جدید تمرکز ویژهای بر «گردشکارهای ایجنت محور» داشته باشد؛ قابلیتی که به هوش مصنوعی امکان میدهد نهتنها استدلال کند، بلکه وظایف پیچیده و چندمرحلهای را بهصورت خودکار در محیطهای نرمافزاری مختلف اجرا نماید.
کارشناسان پیشبینی میکنند چالش بزرگ بعدی برای دیپسیک و پیروانش، ادغام تواناییهای چندوجهی در زمان واقعی و بهبود روش «یادگیری تقویتی با بازخورد انسانی» (RLHF) خواهد بود تا خطاهای موسوم به «توهم» در محیطهای حساس به حداقل برسد. با کاهش مداوم هزینه هوش، انتظار میرود موجی از کاربردهای «هوش لبهای» شکل گیرد؛ جایی که توان استدلال در سطح دیپسیک مستقیماً در سختافزارهای مصرفی مانند تلفنهای هوشمند و رباتها تعبیه میشود، بدون نیاز به اتصال دائمی به فضای ابری.
چالش اصلی همچنان در عرصه ژئوپولیتیک در حال تحول باقی مانده است. با توجه به بررسیهای نهادهای نظارتی آمریکا برای اعمال محدودیتهای شدیدتر بر اشتراکگذاری مدلهای هوش مصنوعی و صادرات «وزنهای باز»، توانایی دیپسیک در حفظ پایگاه جهانی کاربرانش به میزان توانایی این شرکت در مدیریت محیط مقرراتی چندپاره وابسته خواهد بود. با این حال، سابقهای تازه شکل گرفته است: قوانین مقیاسپذیری گذشته جای خود را به قوانین کارآمدی امروز دادهاند.

۲۰۲۵ نقطه عطفی در تاریخ هوش مصنوعی
سال ۲۰۲۵ بهعنوان سالی در یادها خواهد ماند که «خندق محاسباتی» از میان رفت. صعود دیپسیک از یک بازیگر نسبتاً کوچک به قدرتی جهانی ثابت کرد که آینده هوش مصنوعی متعلق به کارآمدی است، نه صرفاً ثروت. این شرکت با ارائه عملکردی در سطح پیشرفته با هزینهای کمتر از ۶ میلیون دلار، کل صنعت را وادار کرد تا راهبردهای خود را بازنگری کند و از اتکای صرف به مقیاسگذاری سختافزاری به سمت نوآوری معماری حرکت نماید.
نتایج کلیدی این سال روشن است: بهینهسازی نرمافزاری میتواند بر محدودیتهای سختافزاری غلبه کند، مدلهای با وزنهای باز به نیرویی قدرتمند در بازار بدل شدهاند و جغرافیای رهبری در هوش مصنوعی بیش از هر زمان دیگری سیال است. با ورود به سال ۲۰۲۶، تمرکز از «اندازه» مدلها به «هوشمندی» آنها با منابع موجود تغییر خواهد کرد.
در ماههای پیش رو، صنعت با دقت نرخ پذیرش DeepSeek-V3.2 و واکنش آزمایشگاههای آمریکایی را دنبال خواهد کرد؛ آزمایشگاههایی که اکنون تحت فشار شدید قرار دارند تا ارزش خود را در جهانی که «هوش مصنوعی پیشرفته» بهطور فزایندهای در دسترس همگان قرار گرفته، اثبات کنند. «لحظه دیپسیک» تنها یک رویداد گذرا نبود؛ بلکه آغاز فصل تازهای در تاریخ هوش مصنوعی بود.



