رابرت وایسگرابر، افسر ارشد فنآوری و مدیرعامل AX Semantics اینطور میگوید: «من میگویم هرکس حداقل یک بار مقالهای را خوانده که بهصورت الگوریتمی ساخته شده باشد.»
البته نمیشود گفت همه. آنطور که وایسگرابر میگوید، در بسیاری از موارد، خوانندگان تفاوتی میان نسخهی انسانی و رباتی نمیبینند. اما او میداند. شرکتش، AX Semantics، یکی از چند شرکتی است -از جمله Narrative Science و Automated Insights- که روی تولید زبان طبیعی، یا نگارش خودکار تحقیق می-کنند.
میتوان از فنآوری جهت نوشتن توضیحات محصول، گزارش درآمدهای سه ماهه، خلاصههای فوتبال فانتزی و روزنامهنگاری استفاده کرد. مثلاً واشنگتن پست، یک ربات هوش مصنوعی به نام هلیوگراف (Heliograf) ساخته که به انجام انتخاب و پوشش رویدادهای ورزشی کمک میکند. ضمناً در آلمان که AX Semantics در آنجا واقع شده، گزارش Stuttgarter Zeitung که با هوش مصنوعی درخصوص آلودگی هوا نوشته شده بود اخیراً برندهی یک جایزهی روزنامهنگاری شده است.
وایسگرابر در مقایسهی این پیروزی با لحظهای که استاد بزرگ شطرنج، گری کاسپاروف بازی را به یک ابَررایانه باخت، گفت: «ما این را لحظهی گاسپاروف مینامیم.»
نویسندههای انسانی از رقابت با الگوریتمها نمیهراسند. همین حالا هم چشمانداز شغلی نویدبخشی ندارند. سال ۲۰۱۹، تقریباً ۴۰۰۰ روزنامهنگار شغل خود را طی جریانی از دست دادند که نویسندهای آن را «آخرالزمان رسانه» نامید. امسال، همهگیری ویروس کرونا، دور تازهای از اخراجها و برکناریها را در سرتاسر این صنعت رقم زده است.
اما آیا ساخت زبان طبیعی، خبر از پایان حرفهی محاصرهشدهی نویسندگی میدهد؟
ظاهراً اتاق خبر روزنامهی «پست» اینطور فکر نمیکند. فردریک کانکل ، گزارشگر پست و رئیس اتحادیهی روزنامه، دربارهی هلیوگراف به سایت Wired اینطور گفت: «ما طبیعتاً از هر نوع فنآوری که بتواند جایگزین انسان شود بیم داریم. اما به نظر میرسد که این فنآوری تنها برخی از کارهای کسلکننده و تکراری را بر عهده گرفته است.»
وایسگرابر این را تأیید میکند. به گفتهی او، فنآوری AX Semantic «بخش خستهکنندهی این حرفه [نوشتن] را خودکار میکند.»
نوشتن در حجم زیاد
تولید زبان طبیعی یک مشکل تجاری اساسی را درمورد نوشتن حل میکند، یعنی مشکل خوب ننوشتن در حجم زیاد. یک نویسنده میتواند مقالهای ۱۰۰۰ کلمهای را ظرف یک هفته بدون هیچ مشکلی بنویسد، اما همان نویسنده نمیتواند درصورت افزایش تقاضا، به راحتی تعداد چنین مقالاتی را به ۱۰،۰۰۰ تا در هفته برساند. و در عصر اینترنت، تقاضا برای محتوا افزایش یافته است.
به گفتهی وایسگرابر، حتی اگر یک فروشگاه اینترنتی کوچک باشید، ۲۰،۰۰۰ محصول دارید و باید در گوگل دیده شوید و باید متنتان را طوری بهینهسازی کنید که فروش را بالا ببرد .» شرکتها نمیتوانند از نسخهی تأمین کننده دوباره استفاده کنند هرچند خوانندگان معمولاً اهمیتی به زبان تکراری نمیدهند، اما به گفتهی وایسگرابر، الگوریتمهای جستجوی گوگل، محتوای منحصربهفرد را ترجیح میدهند.
نرمافزار AX Semantics، یک ژاکت را براساس دادههای پایگاه داده توصیف میکند.
واضح است که یک انسان هم میتواند چنین «برونداد متنی» را قلم بزند، اما نمیتواند به راحتی آن را درمورد تقریباً و نه کاملاً ۲۰۰۰ ژاکت مشابه انجام دهد، یا هریک از آن متون را به ۲۰ زبان دیگر ترجمه کند. وایسگرابر تخمین میزند که پروژهای مثل این نیاز به گروهی متشکل از حداقل ۲۰ نویسنده، مترجم یا ویراستار خواهد داشت و مخ آنها سوت خواهد کشید. اما تولید زبان طبیعی میتواند بخش اعظمی از این فرآیند را خودکار کند. (نرمافزار AX Semantic توانایی ترجمهی متن به ۱۱۰ زبان را هم دارد.)
بهینهسازی تبدیل هم با همین مسائل مواجه است. به گفتهی وایسگرابر، مشتریان AX Semantic اغلب می-پرسند که آیا باید در فروشگاههای اینترنتی خود از زبان رسمی استفاده کنند یا غیررسمی. آزمایش کردن برای رسیدن به پاسخ این سؤال به نسخههای جدیدی از هزاران توصیف محصول با لحنهای متفاوت نیاز دارد. تولید چنین متونی سالها وقت انسان را خواهد گرفت. اما نرمافزار تولید زبان طبیعی AX Semantic میتواند با فشار یک دکمه، متن را از حالت رسمی به غیررسمی تغییر دهد.
نیازی به گفتن نیست، چنین چیزی همیشه امکان نداشته است.
از الگوهای پیشساخته تا تصمیمات جزئی به واسطهی هوش مصنوعی
پردازش زبان طبیعی در ابتدا بیشتر شبیه به Mad Libs بود تا فنآوری انقلابی. اولین تلاشها در این خصوص به شکل سیستمهای الگو-محور برای نوشتن پیشبینی هواشناسی محلّی صورت گرفت. این سیستمها خودکار بودند، اما به شکلی کاملاً طوطیوار؛ به گفتهی واسگرابر، آنها اساساً اعداد جدید را به نثر قدیم وصل میکردند.
برخی اقدامات در جهت ایجاد قابلیت پیش بینی به دههی ۱۹۸۰ برمیگردند، اما حتی تا دههی ابتدایی قرن بیست و یک هم تولید زبان طبیعی پیشرفت چندانی نداشت. وقتی StatSheet در سال ۲۰۰۷ آغاز به کار کرد، دادههای زمان واقعی پیرامون مسابقات و بازیکنان بسکتبال کالج را بهصورت خودکار منتشر نمود. این کار که هنوز تولید زبان طبیعی براساس الگوهای پیشساخته به شمار میآمد فقط به جهان وب مهاجرت کرده بود.
به گفتهی وایسگرابر، این سیستمها، پنج سال پیش هوشمندتر شدند. هوش مصنوعی به حدی رسید که میتوانست بدون پیکربندی دستی گسترده زبانها را یاد بگیرد. درعوض الگوریتمها میتوانستند بهسادگی مطالب خواندنی را در یک زبان فرضی هضم کرده، و آن زبان را بهطور مستقل از دادههای بدون ساختار «بیاموزند». این کار زحمت تولید زبان طبیعی را کمتر کرد. نرمافزار تولید زبان طبیعی میتوانست به سرعت ترجمه کند، دستور زبان خودش را بررسی نماید، مترادفها را جهت اطمینان از منحصربهفرد بودن متن به کار ببرد و لحن خود را کنترل نماید.
این پیشرفت مهمی محسوب میشد، اما پردازش زبان طبیعی هنوز هم به اندازهی یک انسان نویسنده قدرتمند نیست. به مثال ژاکت برگردیم: چیستی ژاکت برای یک انسان واضح است، اما هوش مصنوعی اصلاً معنای این کلمه، جایگاهی که «ژاکت» در فرهنگ ما اشغال میکند، یا علت دکمه داشتن آن را نمیداند.
به گفتهی وایسگرابر: «باید به سیستم یاد بدهید که معنای ویژگیها چیست. بنابراین اگر در حال نوشتن از یک ژاکت هستید که دکمه دارد، به آن بگویید آنها برای چه هستند، برای بستن ژاکت، تا بتوانید در سرما گرم بمانید.»
نوع دانش، یا تخصص دامنه را باید بهصورت دستی به نرمافزار تولید زبان طبیعی اضافه کرد اما فقط باید یک بار، آن هم به شکل عبارت اگر-پس آن را افزود. (مثلاً: اگر «دکمه» باشد، پس «میتوانید دکمههایش را در شبهای سرد ببندید.») وایسگرابر میگوید، وقتی کاربر عبارات اگر-پس را به اندازهی کافی ساخته و اولویتبندی کند، نرمافزار میتواند «تصمیمات جزئی» درستی بگیرد، و هزاران توصیف ژاکت را قلم بزند.
به عبارت دیگر، هنوز هم انسان باید اولین توصیف ژاکت را به نحو مؤثری «بنویسد» اما تولید زبان طبیعی میتواند آن را به هزاران توصیف تبدیل کند.
توصیفات منتشرشده میتوانند به پایگاه دادهی back-end هم پیوند خورده باشند که یعنی هروقت پایگاه داده بهروزرسانی شود، متن هم بهروز میشود. AX Semantics این ویژگی را «ویرایش زنده» مینامد. این نهتنها به این معناست که رفع اشکالاتِ back-end بهطور خودکار نواقص نسخهی front-end (جلوی صحنه و پیش چشم کاربر) را رفع میکند، بلکه صفات عالی هم مدام بهروزرسانی میشوند. بنابراین اگر یک فروشگاه اینترنتی، ژاکتی را بهعنوان ارزانترین کالایش عرضه کند، و سپس ژاکت جدید و ارزانتری را به موجودی خود اضافه نماید، برچسب «ارزانترین» بهطور خودکار به محصول تازه منتقل خواهد شد.
نویسندگان انسانی آگهیهای تجاری، در درازمدت نمیتوانند این دقت و صحت را در کارشان داشته باشند. نباید هم از آنها چنین توقعی داشت! اما یک کار میتوانند انجام دهند که هوش مصنوعی هنوز نمیتواند: خلاقیت.
آیندهی نگارش الگوریتمی (و آنالوگ)
به گفتهی وایسگرابر «وضعیت فعلی این هنر [تولید زبان طبیعی] این است که شما یا خلاقیت دارید یا کنترل.»
AX Semantics عمدتاً بر روی کنترل تمرکز دارد که یعنی فرآیند راهاندازی دستی. اما برخی ابزار دیگر در این عرصه، بیشتر بر خلاقیت تمرکز میکنند. مثلاً Talk to Transformer میتواند براساس یک پیاموارهی مختصر، متن قابلتوجهی تولید کند، اما هوش مصنوعی واقعاً معنای چیزی را که میگوید نمیداند. فقط کلماتی که قبلاً با هم دیده را کنار هم میگذارد.
وایسگرابر به دنبال ظهور «محتوای ترکیبی» است که از همکاری میان انسان و هوش مصنوعی حاصل میشود. نرمافزار AX Semantics این کار را ممکن میکند؛ مثل هلیوگرافِ واشنگتن پست.
البته این فنآوری جای رشد زیادی دارد. احتمالاً همهی خوانندگان با متنی مواجه شدهاند که بهصورت الگوریتمی نوشته شده باشد، اما وایسگرابر به دقت این متون را از کاربرد گستردهی نرمافزار تولید زبان طبیعی تمییز می-دهد. طبق برآوردهای او، حدوداً ۱۰۰۰ شرکت از محصولات NLG استفاده میکنند – و با اینکه «به شکل وسیعی» از آنها بهره میگیرند، اما این کماکان از نظر پایگاه کاربری «اساساً هیچ» است. به نظر او، نزدیکترین چالش این حوزه، جذب مشتریان جدیدی است که کاربردهای تازهای را معرفی خواهند کرد و الهامبخش امکانات جدیدی خواهند شد.
وایسگرابر قویتر شدن هوش مصنوعی و خودکارسازی را هم میبیند. هرچند الگوریتمها به این زودی نمیتوانند تحقیقات خودشان را انجام دهند، اما طبق پیشبینی او ظرف یک دهه، آنها قادر به تولید مقالات پژوهشی از رئوس مطالب خواهند بود، و این، همهی معلمها را عزادار خواهد کرد.
در پایان شایان ذکر است که من انسانم و این مقاله را بدون کمک هوش مصنوعی نوشتهام.