ظهور هوش مصنوعی جامع

خبر کوتاه بود و تکان‌دهنده:‌ هوش مصنوعی جامع (AGI) آمد. هوش جامعی که می‌گفتند امکان آمدنش نیست و سال‌ها از ظهورش فاصله داریم.

AGI

تا الان هوش‌های مصنوعی صرفا در یک ناحیه‌ی محدود تخصص داشتند؛‌ مثلا:

  • پردازش متن.
  • تشخیص چهره.
  • ایجاد کپشن از روی تصویر.
  • ایجاد تصویر از روی کپشن.
  • رانندگی.
  • شطرنج بازی کردن.
  • تشخیص صدا.
  • تشخیص دست‌خط.
  • کاراکترهای یک بازی.
  • و ... !‌

تمام موارد ذکر شده‌ی فوق هر کدام برنامه‌های جداگانه و دارای کُدبیس‌های جدا هستند و یک هوش مصنوعی توسعه یافته برای کاراکترهای یک گیم هیچ ربطی نداره به یک مدل یادگیری عمیق برای رانندگی خودکار. یک شرکت می‌تونه مدل‌های تربیت‌شده‌ی جداگانه داشته باشد که هیچ ربطی به یکدیگر ندارند. حتی ممکنه یک شرکت تمام منابع خود را به کار بگیره که یک هوش مصنوعی مختص ماشین‌های خودران طراحی کنه و در هر چرخه مدل خودش رو بهتر کنه و دقتش رو بالاتر ببره اما کاری به دیگر زمینه‌‌های مربوط به هوش مصنوعی نداشته باشه.

راستی درباره‌ی تفاوت بین هوش مصنوعی؛ یادگیری ماشین و یادگیری عمیق می‌تونید به این پست مراجعه کنید.

هر وقت اسم هوش مصنوعی میاد. ناخودآگاهِ جمعیِ بدنه‌ی غیرتکنیکالِ جامعه میره سمت فیلم های هالیوودی و ترمیناتور و آخرالزمان و نابودی بشر به دست ربات‌ها. این نگاه غیرتخصصی حتی از سمت لیدرهای تکنولوژی مثل ایلان ماسک هم دیده شده؛ مثلا چند سال قبل ایلان ماسک در توییتی هوش مصنوعی رو خطرناک‌تر از بمب هسته‌ای اعلام میکنه که صرفا میتونم بگم مثل خیلی از توییت‌هاش از روی جلب توجه و سطحی‌نگری بوده. جالبه که بدونید مارک زاکربرگ این نگرش ایلان رو در اون زمان کاملا غیرمسئولانه میخونه و این نگاه رو تلویحا به تمسخر میگیره.

اگه بخوام یک تعریف تکست‌بوکی از هوش جامع مصنوعی ارائه بدم اینه:

«هوش جامع مصنوعی نمایشی از قابلیت‌های شناختی کلی مغز انسان در قالب نرم‌افزار و سخت‌افزار است. هوش جامع در هنگام مواجهه با یک امر ناشناخته می‌تواند راه‌حلی پیدا کند. مقصود از هوش جامع مصنوعی انجام هر کاری است که یک انسان می‌تواند از پس آن بربیاید.»

پاراگراف بالا یه تعریف بود ولی خب از اونجایی که متخصصین ازهر شاخه هوش انسانی رو به یک نحو تعریف میکنند باعث میشه تعاریف و تعابیر از هوش جامع مصنوعی هم متفاوت بشه. ولی اگه من بخوام یه تعریف ساده‌تر از هوش جامع مصنوعی ارائه بدم. اصلا AGI (Artificial General Intelligence) رو هوش جامع مصنوعی ترجمه نمیکنم و اون رو هوش مصنوعی جامع ترجمه میکنم دلیلش هم اینه که باعث میشه سر تعریف هوش جامع وارد ورطه‌های روانشناسی و عصب‌شناسی هوش جامع و آگاهی و سای Ψ نشم و از موضوع اصلی دور نشم. ترجیح می‌دم که یه‌راست برم سر اصل مطلب و یه تعریف پراگماتیک از هوش مصنوعی جامع ارائه بدم. هوش مصنوعی جامع رو میشه در مقابل هوش‌ها و مدل‌های فعلی و فوق تخصصی تعریف کرد که مدل‌هایی صرفا تک‌بعدی هستند و در یک حوزه‌ی بخصوص مهارت دارند؛‌ هوش مصنوعی جامع، هوشی چندبعدیه که از پس خیلی از کارها در حوزه‌های مختلف بر میاد.

خیلی‌ها می‌گفتند که هوش مصنوعی جامع بخاطر پیچیدگی‌های بالاش در آینده‌ی نزدیک در دسترس نخواهد بود . اما اخیرا دیپ‌مایند گوگل از عامل هوشمند جنرالیست Gato رونمایی کرد که در حقیقت یک هوش مصنوعی جامع بحساب میاد.

Gato
هوش مصنوعی جامع Gato

« Gato الهام گرفته شده از مدل‌سازی زبانی مقیاس بالا؛ رویکردی است که فراتر از حوزه‌ی ایجاد متن می‌رود. این عامل یک هوش مصنوعی چندمنظوره است که در حوزه‌های مختلف فعالیت می‌کند. یک شبکه‌ی عصبی با همان پارامتر‌های مشابه‌ می‌تواند آتاری بازی کند؛ برای تصاویر کپشن درست کند؛ بلوک‌های اسباب‌بازی را با دست رباتیک واقعی روی هم بچیند و ... Gato خودش تصمیم می‌گیرد بر اساس چارچوبی که در آن قرار می‌گیرد که آیا متن ایجاد کند، دکمه‌ها را فشار دهد یا کارهای دیگر انجام دهد. »

برای تربیت Gato؛ داده‌ها از کارها و روش‌های مختلف به صورت توکن‌های خطی؛ سریالی شده و سپس توسط یک ترنسفورمر شبکه‌های عصبی، مشابه مدل‌های بزرگ زبانی پردازش یافته‌اند. کانسپت کلی مرحله‌ی تمرین‌دهی مدل از حوزه‌های مختلف رو در تصویر زیر میتونید ملاحظه کنید:

Gato Training Phase
مرحله‌ی ترینینگ Gato

در هنگام استقرار Gato، یک پرامپت؛ مانند یک توضیح توکن‌سازی می‌شود و دنباله‌ی اولیه را شکل می‌دهد. سپس محیط، اولین مشاهده را ارائه می‌دهد که آن هم توکن‌سازی می‌شود و به دنباله ضمیمه می‌شود. در نهایت Gato کاری را که باید انجام دهد، از روی بُردار اعمال نمونه‌برداری کرده و انجام می‌دهد. کانسپت کلی مرحله‌ی استقرار رو می‌تونید در تصویر زیر ملاحظه کنید.

Gato Deployment Phase
مرحله‌ی استقرار Gato

Gato از روی تعداد زیادی از مجموعه داده‌های حاوی تجاربِ شبیه‌سازی‌شده و همچنین تجارب دنیای واقعی در کنار انواع مختلفی از مجموعه‌ داده‌های تصاویر و زبان طبیعی تمرین داده شده است. نقطه‌ی قوت Gato در یک امر کلیدی است؛ هیچ‌وقت چیزی را که آموخته فراموش نمی‌کند.