نخستین انگیزه در بهوجود آمدن این ساختار یادگیری از راه بررسی ساختار عصبی در مغز انسان الهام گرفته شده که در آن یاختههای عصبی با فرستادن پیام به یکدیگر درک را امکانپذیر میکنند. بسته به فرضهای گوناگون در مورد نحوه اتصال این یاختههای عصبی، مدلها و ساختارهای مختلفی در این حوزه پیشنهاد و بررسی شدهاند، هرچند که این مدلها بهصورت طبیعی در مغز انسان وجود ندارد و مغز انسان پیچیدگیهای بیشتری دارد. این مدلها نظیر شبکه عصبی عمیق، شبکه عصبی پیچیده، شبکه باور عمیق پیشرفتهای خوبی را در حوزههای پردازش زبانهای طبیعی، پردازش تصویر ایجاد کردهاند. در حقیقت عبارت یادگیری عمیق، بررسی روشهای تازه برای شبکه عصبی مصنوعی است.
کتاب «شبکههای عصبی و یادگیری ژرف» تألیف و ترجمه مهدی اسماعیلی با همکاری فائزه اکبری، در 10 فصل ابتدا مقدمهای از شبکههای عصبی و مفاهیم مرتبط با آن بیان کرده و در ادامه به تشریح موضوعاتی همچون «یادگیری ماشین و شبکههای عصبی»، «یادگیری شبکههای عصبی ژرف»، «یادگیری در راستای تعمیم بهتر»، «شبکههای تابع پایه شعاعی»، «ماشینهای بولتزمن محدود»، «شبکههای عصبی برگشتی»، «شبکههای عصبی کانولوشن»، «یادگیری تقویتی ژرف» و «عناوین پیشرفته در یادگیری ژرف» میپردازد.
الگوبرداری از مغز انسان در شبکههای عصبی مصنوعی
ساختار یادگیری عمیق، از بررسی ساختار عصبی در مغز انسان الهام گرفته شده که در آن یاختههای عصبی با فرستادن پیام به یکدیگر درک را امکانپذیر میکنند. اما این سوال همواره مطرح بوده که آیا هوش مصنوعی روزی میتواند همتراز مغز انسان شود؟ در بخشی از کتاب حاضر در این زمینه میخوانیم: «شبکههای عصبی مصنوعی، یکی از تکنیکهای محبوب و رایج در حوزه یادگیری ماشین محسوب میشوند و با پیشرفتهای اخیر میتوان گفت که شبکههای عصبی امروزه یکی از رایجترین روشهایی است که از آن برای تشخیص و شناسایی الگوهای موجود در دادهها استفاده میشود.
حجم بالای دادههای در دسترس و همچنین افزایش قدرت محاسباتی، موفقیتهایی را برای شبکههای عصبی به همراه داشته و این محبوبیت با تولد عصر جدیدی برای شبکههای عصبی با نام یادگیری ژرف همراه شده است. اگرچه تا نزدیکی عملکرد هوش مصنوعی به عملکرد انسان راهی طولانی (شاید هم کوتاه) باقی مانده، اما امروزه در برخی از حوزههای کاربردی نظیر شناسایی تصاویر، اتومبیلهای خودران و بازیهای کامپیوتری، موفقیتهای چشمگیری برای شبکههای عصبی و بهخصوص یادگیری ژرف رقم خورده است. از نظر تئوری و با شرط وجود مجموعه دادههای کافی، شبکههای عصبی قادرند هر تابع ریاضی را بیاموزند و برخی از نسخههای آن مانند شبکههای برگشتی بهعنوان تورینگ کامل شناخته میشوند.»
یادگیری در راستای تعمیم بهتر
«قدرت شبکههای عصبی در یادگیری توابع پیچیده تحسینبرانگیز است، اما این سکه روی دیگری نیز دارد و آن هم چالشهایی نظیر بیشبرازش است. چنانچه در طراحی فرایند یادگیری دقت نشود، آنگاه پیشبینی مدل آموخته بر روی دادههای آموزشی عالی، اما کارایی مدل مزبور بر روی دادههای آزمایشی و دیده نشده ضعیف خواهد بود. این چالش که با نام بیشبرازش شناخته میشود، ناشی از به خاطر سپردن جزئیات دادههای آموزشی توسط مدل است که برای دادههای آزمایشی قابل تعمیم نیست.
برای فهم بهتر مسأله، دانشآموزی را درنظر بگیرید که تنها قادر است مسائل حل شده توسط معلم خود را بهخوبی حل کند، اما قادر به حل کردن مسائل جدید نیست، بهنظر میرسد با حل کردن مسائل متعدد و زیاد برای این دانشآموز، بتوان این قابلیت را در او پرورش داد که قادر به حل مسائل جدید نیز باشد. توانایی پیشبینیهای درست و دقیق یک مدل برای نمونههایی از دادهها که قبل از این با آنها مواجه نشده است، با نام تعمیم شناخته میشود. بدون تردید، تعمیم یکی از ویژگیهای کاربردی سودمند برای برنامههای یادگیری ماشینی تلقی میشود و این الگوریتمها اغلب به دنبال تعمیم بالاتر هستند.»
نخستین چاپ کتاب «شبکههای عصبی و یادگیری ژرف» در 328 صفحه با شمارگان 750 نسخه به بهای 64 هزار تومان از سوی انتشارات آتینگر راهی بازار نشر شده است.
نظر شما