فرض کنید روز شلوغی در سال ۲۰۳۹ است و شما در حال تماشا کردن فیلم در حین سفر با یکی از خودروهای خودکاری هستید که در جادههای جهان پرسه می زنند. این خودرو خودش در زمان لازم ترمز کرده و گاز می دهد، به اشیا (ماشین های دیگر، دوچرخه سواران، گربه های ولگرد و…) برخورد نمی کند، از تمام علائم راهنمایی و رانندگی پیروی می کند و همیشه بین خطوط می راند.
تا همین چند وقت پیش این یک سناریو مضحک بود. اما حالا جای پایش را در قلمروی امکان محکم کرده است. درواقع، شاید یک روز خوردوهای خودکار آنقدر از پیرامونشان آگاه باشند که اصلاً تصادفی پیش نیاید. بااینوجود، برای رسیدن به این نقطه باید با استفاده از فرآیندهای پیچیده گوناگون ازجمله یادگیری عمیق، بر بسیاری از موانع فائق آمد. اما سوال اصلی اینجاست که فناوری تا کجا میتواند ما را با خود ببرد؟
یادگیری عمیق چیست؟
یادگیری عمیق ، شکل تازه احیاشدهای است از یادگیری ماشینی که خودش زیرمجموعهای از هوش مصنوعی به حساب میآید. یادگیری عمیق بهمنظور شناسایی اشیا و ترجمه گفتار در زمان واقعی، با تقلید از لایههای نورونی در مغز انسان، از رایانههای قوی، مجموعه دادههای انبوه، شبکههای عصبیِ تحت نظارت و آموزشدیده و الگوریتم موسوم به پسانتشار یا بهاصطلاح backprop استفاده میکند.
یادگیری عمیق از دهه ۱۹۵۰ مطرح بوده، اما ظهور آن به عنوان یک ستاره در حوزه هوش مصنوعی، نسبتاً چیز جدیدی است. در سال ۱۹۸۶، جفری هینتون، پژوهشگر فعلی گوگل و کسی که مدتهاست پدرخوانده یادگیری عمیق شناخته میشود.
او در میان پژوهشگرانی بود که به ارائه تصویری از شبکههای عصبی کمک کردند و به زبان علمی نشان دادند که میتوان تعداد زیادی از رایانهها را با استفاده از الگوریتم پسانتشار، برای شناسایی بهتر شکل و پیشبینی کلمه آموزش داد. تا سال ۲۰۱۲ از یادگیری عمیق در همهچیز استفاده میشد؛ از برنامههای مصرفکننده مثل Siri اپل گرفته تا تحقیقات داروشناختی.
هینتون در گفتگو با نیویورکتایمز اظهار داشت: «نکته این رویکرد رشد زیبای آن است. اساساً فقط باید آن را بزرگتر و سریعتر کنید، تا بهتر شود. حالا دیگر نباید به پشت سر نگاه کرد.»
یادگیری عمیق به زبان ساده
درک هوش مصنوعی گاهی اوقات به اندازه اصطلاحات یک موضوع فناوری نیست. اطلاعات و اصطلاحات زیادی زیر چتر بزرگ هوش مصنوعی قرار دارد؛ مانند یادگیری ماشین، پردازش زبان طبیعی، بینایی کامپیوتر و…
یادگیری عمیق مثال خوبی در این زمینه است. دیپ لرنینگ به دسته وسیعتر یادگیری ماشین مرتبط است اما نمیتوان گفت که یادگیری عمیق همان یادگیری ماشین است. این امر احتمال اشتباهات و سوء تفاهمها را تشدید میکند. یادگیری عمیق در درون یادگیری ماشین قرار دارد و یادگیری ماشین درون هوش مصنوعی است.
هوش مصنوعی اساساً زمانی است که ماشینها کارهایی را که به هوش انسانی نیاز دارند، انجام میدهند. حوزه هوش مصنوعی شامل یادگیری ماشین میشود، جایی که ماشینها میتوانند با تجربه یاد بگیرند و مهارتهایی را بدون دخالت انسان به دست آورند.
یادگیری عمیق شاخهای از یادگیری ماشین است که در آن شبکههای عصبی یا همان الگوریتمهایی که از مغز انسان الهام گرفتهاند، از مقادیر زیادی داده یاد میگیرند.
برای توضیح دیپ لرنینگ به زبان ساده میتوان گفت:
دیپ لرنینگ یک تکنیک یادگیری ماشین است که به رایانهها میآموزد تا کارهایی را انجام دهند که به طور طبیعی برای انسان اتفاق میافتد. به عنوان مثال یادگیری عمیق یک فناوری کلیدی در پشت خودروهای بدون راننده است که به آنها امکان میدهد تابلوی ایست و یا عابر پیاده را از تیر چراغ برق تشخیص دهند.
در دیپ لرنینگ، یک مدل کامپیوتری یاد میگیرد که وظایف طبقهبندی را مستقیماً از روی تصاویر، متن یا صدا انجام دهد. مدلهای یادگیری عمیق میتوانند به دقت پیشرفتهای دست یابند که گاهی اوقات از عملکرد سطح انسانی فراتر میرود. مدلها با استفاده از مجموعه بزرگی از دادههای برچسبگذاری شده و معماریهای شبکه عصبی که حاوی لایههای زیادی هستند، آموزش داده میشوند.
یادگیری عمیق چطور کار میکند؟
ساخت اتومبیل خودران نسل بعد
شرکت HERE، نقشههای باکیفیتی میسازد که قابلیتهای پردازنده خودرو را بسیار بالا میبرند، بهعلاوه برای سواریهای آینده، سیستم ناوبری طراحی میکند. یادگیری عمیق برای این فرآیند بسیار اهمیت دارد.
مدیرعامل این شرکت پس از برگزاری غرورآمیز یک تور برای بازدید از فضای دفتر کارش به بازدیدکنندگان، اینطور میگوید: «بعضی از مردم میگویند که ما می توانیم بدون نقشههای HD هم زندگی کنیم، میتوانیم فقط یک دوربین روی خودرو بگذاریم. اما دوربین شما هرچهقدر هم که خوب باشد، همیشه با مشکلی مواجه خواهد شد. پس اگر حسگرهای شما خراب شوند، نقشه آخرین راه فرارتان است.»
او و تیمش، با تعریف الگوریتمهای خودکار و خط لوله دادههای مقیاسپذیر (سیستمی که میتواند حجم فزایندهای از دادههای ورودی را مدیریت نماید)، نقشههای باکیفیتی میسازند که از منایع مختلف، دادههایی را به خدمت میگیرند. این دادهها از طریق سنسورهای روی خودروهای مالکان اصلی HERE، یعنی BMW، مرسدس و آئودی گردآوری میشوند.
او توضیح میدهد که چون شروع کردن با دادههای آموزشی دقیق اهمیت دارد، نامگذاری یا اصطلاحا برچسبزنی انسانی، اولین گام مهم در این فرآیند است.
تصاویر نمای خیابانها از طریق نقشه گوگل و Lidar (یک سیستم شناسایی شبهرادار که از نور لیزر برای جمعآوری اطلاعات مربوط به اشکال سهبعدی دقیق در جهان استفاده میکند) در کنار اطلاعات نشانگذاری کوچهها که در ابتدا بهصورت دستی کدگذاری شدهاند، به یک موتور یادگیری عمیق، داده میشوند؛ این موتور مکرراً بهبود یافته و بازیافت میشود.
سپس مدل یادگیری عمیق در خط لوله تولید، گسترش مییابد و به کار گرفته میشود تا نشانگذاری کوچهها و راههای باریک را با دقت سانتیمتر بهصورت خودکار شناسایی کند. در اینجا باز هم انسان وارد معادله میشود تا صحت تمام این اندازهها را بازبینی و تأیید کند.
او میگوید که در حالت آرمانی، کارخانههای خودروسازی بسیار بیشتری با به اشتراکگذاری دادههای حسگر خود موافقت خواهند کرد؛ البته نه اطلاعات شخصی قابلتشخیص که نگرانی از نقض حریم خصوصی را مطرح میسازند.
ازاینرو خودروهای خودکار میتوانند از یکدیگر یاد گرفته و از بهروزرسانیهای تازه بهرهمند شوند. بهعنوان مثال، فرض کنید یک تصادف زنجیرهای ششماشینه، پنج مایل جلوتر از موقعیت فعلی شما رخ داده است.
اولین خودرویی که این تصادف را کشف کرده، اطلاعات را به یک منبع مرکزی مثل HERE مخابره میکند، که آن هم به نوبه خود آن اطلاعات را به هر خودرویی که به محل حادثه نزدیک میشود مخابره مینماید.
این پروژه هنوز در دست ساخت است، اما مدیران شرکت از کارآمدی آن اطمینان دارند.
آموزش deep learning (آموزش به مدلهای یادگیری عمیق)
سه روش رایجی که برای انجام طبقه بندی اشیا در یادگیری عمیق استفاده میکنند عبارتند از:
آموزش از صفر
برای آموزش یک شبکه عمیق از ابتدا، یک مجموعه داده بسیار بزرگ با برچسب جمع آوری شده و یک معماری شبکه که ویژگیها و مدلها را یاد میگیرد، طراحی میشود. این روش به دلیل حجم زیاد داده و میزان یادگیری کمتر رایج است زیرا آموزش این شبکهها معمولا روزها یا هفتهها طول میکشد.
آموزش انتقالی
اکثر برنامههای کاربردی یادگیری عمیق از رویکرد یادگیری انتقال( فرآیندی که شامل تنظیم دقیق یک مدل از پیش آموزش دیده است) استفاده میکنند.
استخراج ویژگی
یک رویکرد کمتر رایج و تخصصیتر برای یادگیری عمیق، استفاده از شبکه به عنوان استخراجکننده ویژگی است. از آن جایی که همه لایهها وظیفه یادگیری ویژگیهای خاصی از تصاویر را دارند، میتوانیم این ویژگیها را در هر زمانی در طول فرآیند آموزش از شبکه خارج کنیم. سپس میتوان از این ویژگیها به عنوان ورودی برای مدل یادگیری ماشین استفاده کرد.
دامنه و تأثیر یادگیری عمیق
ابزاری تحولآفرین یا صرفاً مفید؟
گری مارکوس استاد دانشگاه نیویورک و پژوهشگر یادگیری ماشین، در مقاله خود، نسبت به استقبال از یادگیری عمیق بهعنوان نوعی انقلاب در هوش مصنوعی، ابراز بیعلاقگی نمود.
مارکوس اظهار داشت: «درواقع یادگیری عمیق فقط بخشی از چالش بزرگتر ساخت ماشینهای هوشمند است. چنین روشهایی فاقد راههای بازنمایی روابط علّی هستند (مثلاً بین بیماریها و علائم آنها) و احتمال دارد که در دریافت ایدههای انتزاعی با چالشهایی مواجه شوند.
آنها شیوه واضحی برای اجرای استنتاجهای منطقی نداشته و از یکپارچهسازی دانش انتزاعی هم فاصله دارند؛ مثلاً اطلاعاتی درمورد چیستی اشیا، کاربرد آنها و نحوه استفاده از آنها.»
اکنون، به لطف افزایش قدرت رایانهای بهخصوص در پردازش گرافیکی و پیشرفتهای الگوریتمی (به ویژه در حوزه شبکههای عصبی) یادگیری عمیق تا حد زیادی، پیشرفتهتر شده و کاربرد گستردهتری یافته است؛ مثلاً در تشخیص پزشکی، جستجوی صدا، تولید خودکار متن و حتی پیشبینی وضعیت آب و هوا.
گرت اسمیت مؤسس Guild AI و مدیر سازمان یادگیری ماشینی Chicago ML میگوید: «قدرت واقعی یادگیری عمیق، زمانی معلوم شد که مردم فهمیدند میتوان از آن برای حل بسیاری از مسائل استفاده کرد. در برخی موارد، بعضی از کاربردها میتوانند یک سر و گردن بالاتر بوده و به توانایی فوق بشری پهلو بزنند.»
DeepMind شرکت نهسالهای است که از سال ۲۰۱۴ به تملک گوگل درآمده است. مطالعات این شرکت انگلیسی در باب یادگیری تقویتی عمیق، ترکیبی از یادگیری عمیق بر اساس شبکه عصبی و یادگیری تقویتی بر اساس آزمون و خطا، به تولید نرمافزاری بهنام AlphaGo و همتای پیشرفتهترش AlphaGo Zero انجامید که هر دوی آنها در سال ۲۰۱۶ بهشکلی استادانه، قهرمانان بازی Go را له کردند.
ریسی کوندور، استاد علوم رایانهای دانشگاه شیکاگو میگوید: «حالا ارتباط یکپارچهتری میان یادگیری ماشینی و علم برقرار است. یادگیری ماشینی صرفاً کار آزاردهندهای نیست که مجبور باشید در کنار کارهای دیگر انجامش دهید. چون حجم زیادی از داده روی هارد درایوتان دارید و در حال تبدیل شدن به جزء جدانشدنی فرآیند کشف علمی است.»
مثلاً دینامیک مولکولی، شبیهسازی رایانهای خط سیر اتمها و مولکولهاست تا بفهمیم که یک سیستم جاندار یا بیجان، تحت فشار چه رفتاری دارد یا اینکه مولکولهای دارو چطور به گیرندههای خود میچسبند. در گذشتههای دور، کارشناسان پیشبینی میکردند که طراحی مولکولی کاملاً خودکار شده و تولید دارو را سرعت خواهد بخشید.
وعده شبکههای عصبی
بزرگترین تغییر جهت فعلی در یادگیری عمیق، عمق شبکههای عصبی است که از چند لایه به صدها لایه افزایش یافته است. عمق بیشتر به معنای ظرفیت بیشتر تشخیص الگوهاست که قدرت تشخیص اشیا و پردازش زبان طبیعی را تقویت میکند به طوری که مورد اولی از دومی انشعابات گستردهتری دارد.
اسمیت میگوید: «فرآیند ترجمه کار سختی است و برنامههای فوقالعادهای برای این کار وجود دارد. امروزه شما از لحاظ وجود شبکههایی که قادر به پیشبینیکردن زبانهایی باشند که هرگز پیش از این ندیدهاند، از انعطافپذیری بیشتری برخوردارید. اما قابلیت اجرای عمومی ترجمه با محدودیت مواجه است.
ما مدتی این کار را انجام میدادیم و تأثیر چندانی در تغییر این بازی نداشت. داشتن بینش قوی، همان چیزی است که نوآوری عظیمی را به دنبال دارد. بهعنوان مثال گذاشتن ردیاب روی یک ماشین تا بتواند محیطش را بهدرستی تشخیص دهد میتواند همهچیز را تغییر دهد.»
چالشهای یادگیری عمیق
مشکل داده را چطور حل کنیم؟
اسمیت میگوید وقتی پای یادگیری عمیق در میان است، «فیل درخشان در اتاق» را میتوان معادل دادهها دانست. کیفیت آنها به اندازه کمیتشان اهمیت ندارد، چراکه مدلهای یادگیری ماشینی و عمیق، بهشدت در برابر دادههای اشتباه مقاوم هستند.
وی میگوید که شما اساساً در حال ارائه دانش هستید و برای انجام پردازشهای پیچیده به نورونهای بیشتر و ظرفیت بیشتری نیاز دارید؛ به دادههایی نیاز دارید که در دسترس عموم قرار ندارند.
این یعنی مدلهای از پیشآموخته که توسط شخص دیگری ساخته شده و بهصورت آنلاین دردسترس قرار گرفتهاند، مجموعهدادههای عمومی آن را کاهش نخواهد داد. در اینجاست که هیولاهای چندبیلیون دلاری یادگیری ماشینی مزیت منحصربهفردی دارند.
کاربردهای دیپ لرنینگ
چند سال پیش ما هرگز تصور نمیکردیم اپلیکیشنهای یادگیری عمیق برای ما ماشینهای خودران و دستیار گوگل را به ارمغان بیاورند اما امروزه این خلاقیتها بخشی از زندگی روزمره ما هستند.
دیپ لرنینگ با امکانات بیپایان خود مانند تشخیص تقلب و بازیابی پیکسل همچنان ما را مجذوب خود میکند. یادگیری عمیق یک صنعت همیشه در حال رشد است، ارتقاء مهارت با کمک یک دوره مقدماتی آموزش یادگیری عمیق میتواند به شما کمک کند مفاهیم اساسی را به وضوح درک کنید و آینده شغلی خود را تقویت کنید.
اجازه دهید به کاربردهای یادگیری عمیق در صنایع بیشتر بپردازیم.
به دنیایی فکر کنید که هیچ تصادف جادهای یا موارد خشم جادهای وجود ندارد. دنیایی را در نظر بگیرید که در آن هر جراحی بدون از دست دادن جان انسان به دلیل خطاهای جراحی موفقیتآمیز باشد. دنیایی را در نظر بگیرید که در آن هیچ کودکی محروم نیست و حتی آنهایی که محدودیتهای ذهنی یا جسمی دارند میتوانند از همان کیفیت زندگی مانند بقیه بشریت لذت ببرند.
اگر درک این موارد خیلی سخت است، به دنیایی فکر کنید که در آن بتوانید تصاویر قدیمی خود را بر اساس پارامترهای خود (رویدادها، روزهای خاص، مکانها، چهرهها یا گروهی از افراد) جدا کنید.
برنامههای دیپ لرنینگ ممکن است برای یک انسان عادی ناامیدکننده به نظر برسند اما کسانی که از امتیاز دانستن دنیای یادگیری ماشین برخوردارند، متوجه میشوند که یادگیری عمیق در سطح جهانی با کاوش و حل مشکلات انسانی در هر حوزهای تفاوت ایجاد میکند.
در ادامه به چند مورد از کاربردهای دیپ لرنینگ اشاره شده است.
- ماشینهای خودران
- تجمیع اخبار و کشف تقلب
- پردازش زبان طبیعی
- دستیاران مجازی
- سرگرمی
- تشخیص بصری
- تشخیص تقلب
- مراقبتهای بهداشتی
- شخصیسازیها
- تشخیص تاخیر رشد در کودکان
- رنگ آمیزی تصاویر سیاه و سفید
- اضافه کردن صدا به فیلمهای صامت
- ترجمه ماشینی خودکار
- تولید خودکار دست خط
آینده یادگیری عمیق
در عینحال که کوندور، اسمیت و دیگران پیشرفت یادگیری عمیق را تحسین میکنند اما نسبت به محدودیتهای آن هم واقعبین هستند.
کوندور میگوید: «کارهایی که یادگیری عمیق در آنها واقعاً قوی ظاهر شده، دقیقاً از نوعی هستند که دانشمندان علوم رایانه مدتهاست بر رویش کار کردهاند؛ چون به خوبی تعریف شدهاند و منافع تجاری زیادی پشتشان است. پس این درست است که تشخیص اشیا، کاملاً با آنچه ۱۲ سال قبل بود فرق میکند، اما مسئله همان تشخیص شیء است و از کارهای شناختی عمیق سطح بالا محسوب نمیشود.»
در یکی از مقالات وبسایت مدیوم که اخیرا با عنوان «عمیقترین مسئله یادگیری عمیق» منتشر شد، گری مارکوس، به مصاحبهای با استاد علوم رایانهای دانشگاه مونترال، یوشوا بِنجیو اشاره کرد؛ کسی که توصیه کرده «چالشهای دشوار هوش مصنوعی را در نظر گرفته و به پیشرفتهای کوتاهمدت تدریجی رضایت ندهید.
نمیگویم که میخواهم یادگیری عمیق را فراموش کنم. برعکس، میخواهم آن را اساس قرار دهم. اما باید بتوانیم آن را برای انجام کارهایی مثل استدلال، یادگیری علیت و بررسی جهان برای فراگیری و کسب اطلاعات، توسعه دهیم.»
شاید یادگیری عمیق، همانطور که یان لوکان، مدیر تحقیقات هوش مصنوعی فیسبوک به مسئولین وبسایت VentureBeat میگوید، میبایست به نفع زبانی سادهتر و انعطافپذیرتر، از خیر زبان کدگذاری محبوب اما گاهاً مشکلساز پایتون بگذرد. لوکان اضافه کرد که شاید سختافزار جدیدی لازم شود.
در هر صورت، یک چیز روشن است، یادگیری عمیق یا باید تکامل پیدا کند یا محکوم به فناست. هرچند به گفته مخاطبان این حوزه، دستیابی به اولی، از وقوع دومی جلوگیری نمیکند.
اسمیت میگوید که در این مقطع، حتی دختر سه سالهاش هم از پس یادگیری عمیق بر میآید. بهعنوان مثال:
«اگر به او عکسی از یک فیل نشان دهم و بعداً تصویر متفاوتی از فیل را ببیند، فوراً میتواند تشخیص دهد که این یک فیل است چون از قبل شکلش را میداند و میتواند آن را در ذهنش مجسم کند. اما یادگیری عمیق نمیتواند این مسئله را حل کند، چون فاقد قابلیت یادگیری از روی چند نمونه اندک است و ما هنوز به حجم انبوهی از دادههای آموزشی وابستهایم.»
او میگوید که از حالا به بعد، یادگیری عمیق صرفاً روشی مفید است که میتوان آن را برای حل مسائل مختلف به کار برد. بدین ترتیب، از این نظر، انقراض آن قریبالوقوع نیست، اما امکان دارد.