یکشنبه ۲۰ مهر ۱۳۹۹ - ۰۹:۲۰

مروری بر کتاب «یادگیری تقویتی»؛

یادگیری در تعامل با محیط

یادگیری از طریق تعامل یک ایده پایه‌ای است که تقریبا در زیرساخت تمام تئوری‌های یادگیری و هوشمندی قرار دارد.

به گزارش خبرگزاری کتاب ایران(ایبنا)، هنگامی که به نحوه یادگیری فکر می‌کنیم، ایده یادگیری به وسیله تعامل با محیط احتمالا اولین چیزی است که به ذهن خطور می‌کند. هنگامی که یک نوزاد بازی می‌کند، دستان خود را تکان می‌دهد یا به اطراف نگاه می‌کند، هیچ معلمی به او نحوه انجام این کارها را آموزش نداده است، اما ارتباط مستقیم با محیط خود دارد. با تمرین و تکرار، این ارتباط باعث تولید اطلاعات باارزشی از علت و معلول زنجیره رخداد‌ها می‌شوند و اینکه در نقطه فعلی از زنجیره چه کاری باید انجام داد تا به هدف رسید، بی‌شک در طول زندگی، چنین تعاملاتی یکی از منابع اصلی کسب دانش برای هر فردی است.

هنگامی که ما در حال یادگیری رانندگی یا در حال انجام مکالمه هستیم، از نحوه بازخورد محیط نسبت به رفتار خود کاملا آگاهیم و می‌خواهیم آنچه از طریق رفتار ما رخ می‌دهد را در کنترل داشته باشیم. یادگیری از طریق تعامل یک ایده پایه‌ای است که تقریبا در زیرساخت تمام تئوری‌های یادگیری و هوشمندی قرار دارد.

کتاب «یادگیری تقویتی» نوشته ریچارد ساتن و اندرو بارتو به ترجمه سجاد کردانی مقدم در هشت فصل با موضوعاتی همچون «ردیابی‌های شایستگی»، «یادگیری تقویتی عمیق» و «روش‌های مونته کارلو» به‌تازگی از سوی انتشارات گسترش علوم پایه راهی بازار نشر شده است.

یادگیری تقویتی چیست؟
«به یادگیری نحوه نگاشت یک وضعیت به یک اقدام به‌طوری‌که یک سیگنال پاداش عددی را حداکثر نماید، یادگیری تقویتی می‌گویند. در این دیدگاه برخلاف بسیاری از روش‌های یادگیری ماشین، به یادگیرنده گفته نمی‌شود که چه اقدامی را انجام دهد و جای آن یادگیرنده باید با آزمایش آن اقدام و دریافت بازخورد از سیگنال پاداش زنجیره اقداماتی که به حداکثر کردن پاداش منتهی می‌شوند را به‌دست آورد.

در بسیاری از مسائل نتیجه انجام یک اقدام فراتر از وضعیت مسأله در گام بعدی است و بر روی تمام زنجیره‌ گام‌های پس از آن تأثیر می‌گذارد. به‌عنوان مثال بازی شطرنج را در نظر بگیرید، در این بازی انجام هر حرکت (اقدام) یک امتیاز آنی به همراه دارد (مثلا زدن یک مهره حریف) ولی علاوه بر آن بازی را وارد یک وضعیت جدید می‌کند که بر روی زنجیره اقدامات قابل انجام پس از آن و در نتیجه پاداش‌های آن و پاداش نهایی تأثیرگذار است. دو مشخصه جستجو با آزمون و خطا و پاداش‌های تاخیردار دو ویژگی بسیار مهم در یادگیری تقویتی هستند.

یادگیری تقویتی نه با مشخصه‌های روش یادگیری بلکه با مشخصه‌های مسئله یادگیری تعریف می‌شود. هر روشی که مناسب حل یک مسئله باشد می‌تواند به‌عنوان یک روش یادگیری تقویتی مورد استفاده قرار گیرد.»

تفاوت‌های یادگیری تقویتی و یادگیری با نظارت
«یادگیری تقویتی با یادگیری با نظارت که امروزه بیشترین استفاده در تحقیقات از آن می‌شود ،تفاوت دارد. در یادگیری با نظارت بر اساس داده‌های لیبل‌‌دار که توسط یک ناظر خارجی متخصص قبلا آماده شده‌ است، یادگیری صورت می‌گیرد. یادگیری با نظارت یک روش مهم در یادگیری است اما برای یادگیری از تعاملات کافی نیست.

در مسائل تعاملی بدست آوردن نمونه‌هایی از رفتار مورد انتظار به‌طوری‌که این نمونه‌ها ما را به هدف برسانند و تمام فضای مسئله‌ که عامل می‌تواند در آن قرار گیرد را پوشش دهند، تقریبا غیرعملی است. همچنین در یک فضای مسئله ناشناخته عامل باید بتواند از تجربه‌های گذشته خود یاد بگیرد. یکی از مهم‌ترین چالش‌ها که فقط در یادگیری تقویتی وجود دارد و سایر روش‌های یادگیری با آن روبرو نیستند، نیاز به ایجاد یک تعادل بین اکتشاف و بهر‌برداری از تجربه قبلی است.

عامل در هر گام باید انتخاب کند که برای تصمیم‌گیری اقدامی که می‌خواهد انجام دهد از تجربه قبلی خود استفاده کند و یا اینکه یک راه جدید انتخاب کند و به جستجو بپردازد. برای بدست آوردن بیشترین پاداش یک عامل یادگیری تقویتی باید اقدامی را انتخاب کند که بیشترین پاداش را برای آن پیش‌بینی می‌کند، اما برای پیدا کردن اقداماتی که باعث پاداش بیشتری می‌شوند، عامل باید مسیرهای جدید را جستجو کند و این یک دوراهی برای انتخاب اقدام است که عامل آن با همواره روبرو خواهد بود.»

نخستین چاپ کتاب «یادگیری تقویتی» در 264 صفحه مصور با شمارگان یک‌هزار نسخه به بهای 40 هزار تومان از سوی انتشارات گسترش علوم پایه راهی بازار نشر شده است.

لینک کوتاه

نظر شما

شما در حال پاسخ به نظر «» هستید.

نام

ایمیل

نظر شما *

برگزیده

از تازه‌های نشر سازمان اسناد و کتابخانه ملی ایران ؛

«روایت سعادت» اثری جدید از مجموعه تاریخ شفاهی

کتاب «روایت سعادت»، اثر جدید از مجموعه تاریخ شفاهی سازمان اسناد و کتابخانه ملی ایران، به تازگی منتشر شد.
به مدت ۲ روز؛

تعطیلی موزه‌های تهران در پی آلودگی هوای پایتخت

موزه‌ها و اماکن فرهنگی‌تاریخی پایتخت در پی آلودگی هوای تهران به مدت ۲ روز تعطیل شدند.
همزمان با زادروز احمد شاملو؛

نمایشگاه «ابدیتی از تو» از ۲۳ آذر در خانه هنرمندان ایران

نمایشگاه آثار خط برجسته «ابدیتی از تو» به مناسبت زادروز احمد شاملو با عنوان «ابدیتی از تو» در خانه هنرمندان ایران برپا می‌شود.
به کوشش دبیرخانه پویش؛

داوری پویش ملی دانش‌آموزی «برسد به دست سیدحسن» آغاز شد

مرحله داوری پویش ملی دانش‌آموزی «برسد به دست سیدحسن» با بررسی بیش از هزار و ۲۰۰ اثر از سراسر کشور انجام می‌شود.
روزهای سرد دهه ۱۳۲۰ شمسی به روایت یک کتاب؛

بررسی رمان «مه و دود» در فرهنگسرای گلستان

فرهنگسرای گلستان در اولین نشست از سلسله نشست‌های «کتاب نوش» به معرفی و مرور کتاب «مه و دود» می‌پردازد.
از سوی کانون پرورش فکری؛

کارگاه شاخص‌های بصری در کتاب‌های کودک و نوجوان برگزار می‌شود

کانون پرورش فکری کودکان و نوجوانان، کارگاه دو روزه‌ای با عنوان «آشنایی با شاخص‌های بصری در ارزیابی کتاب‌های کودک و نوجوان» برگزار می‌کند.
مدیر بخش مسابقه تبلیغات سینمای ایران جشنواره فیلم فجر اعلام کرد؛

استقبال از بخش مسابقه تبلیغات سینمای ایران فجر چهل‌وسوم

با پایان مهلت ارسال آثار به مسابقه تبلیغات سینمای ایران چهل‌وسومین جشنواره فیلم فجر، مدیر این بخش، تعداد آثار ارسال‌شده را اعلام کرد.
به همت انتشارات کتابسرای میردشتی؛

کتاب «طراحی در معماری شهری» منتشر شد

کتاب «طراحی در معماری شهری؛ تابلوهای اطلاع رسان و هدایت‌کننده مکان‌های شهری و عمومی» نوشته سید مهدی نورانی در نوبت اول ۱۴۰۳ یا ۳۴۴ صفحه و قیمت ۶۸۵ هزار تومان به همت انتشارات کتابسرای میردشتی منتشر شده است.
توسط دفتر ادبیات مرکز آفرینش‌های ادبی حوزه هنری؛

کتاب «جاده کالیفرنیا» رونمایی می‌شود

کتاب «جاده کالیفرنیا» روز سه شنبه ۲۰ آذر در موزه صلح تهران نقد و بررسی می‌شود.
از سوی امیرکبیر؛

انتشار مجدد دوره هفت‌جلدی «آتش بدون دود» انجام شد

انتشارات امیرکبیر به تازگی مجموعه ۷ جلدی آتش بدون دود، اثر نادر ابراهیمی را دوباره منتشر و روانه بازار نشر کرده است
توسط نشر کامک؛

«محیط کار انسانی» وارد بازار نشر شد

کتاب «محیط کار انسانی؛ بالندگی کارکنان و کسب و کار؛ از طریق خلق جو کاری انسان محور» توسط انتشارات کامک، رهسپار بازار نشر شد.
گپ‌وگفت با یک تصویرگر کتاب کودک در «سه‌شنبه‌های طلایی»؛

دورهمی تصویرگران در کارستان بهارستان

سلسله نشست‌های «سه‌شنبه‌های طلایی» در این هفته مهمان سمیه محمدی، تصویرگر کتاب کودک خواهد بود.
به همت خانه هنرمندان ایران؛

نشست تخصصی حقوقی در خصوص سکوهای نمایش خانگی

نشست تخصصی «به کسی مربوط نیست؟!» سه‌شنبه ۲۰ آذر ۱۴۰۳ در خانه هنرمندان ایران برگزار می‌شود.
از سوی انتشارات نگارستان اندیشه؛

کتاب «سیاست» فرهنگ رجایی رونمایی می‌شود

مراسم رونمایی از کتاب «سیاست» از سوی انتشارات نگارستان اندیشه با همکاری مرکز مطالعات استراتژیک خاورمیانه برگزار می‌شود.
در خانه دکتر شریعتی؛

یاد خلبان اسکندری در خانه دکتر شریعتی می‌پیچد

نشست نقد و بررسی کتاب «بیگانه با ترس» (هشت گفتگو درباره خلبان محمود اسکندری) در خانه‌موزه دکتر شریعتی برگزار می‌شود.
بنیاد سعدی خبر داد؛

دیدار استادان زبان فارسی با حداد عادل در ایروان / پل ادبی میان ایران و ارمنستان

دیدار نخبگان زبان و ادبیات فارسی ارمنستان با دکتر غلامعلی حداد عادل؛ رئیس بنیاد سعدی در سفارت جمهوری اسلامی ایران برگزار شد.
از سوی خانه اندیشمندان علوم انسانی؛

نشست «تحلیل ژئوپلیتیکی تحولات سوریه» برگزار می‌شود

نشست «تحلیل ژئوپلیتیکی تحولات سوریه و رویکرد بازیگران منطقه‌ای و فرامنطقه‌ای» در سالن خیام خانه اندیشمندان علوم انسانی برگزار می‌شود.
توسط انتشارات امیرکبیر؛

شازده کوچولو به چاپ هشتاد و دوم رسید

کتاب شازده کوچولو اثر آنتوان دوسنت اگزوپری با ترجمه محمد قاضی توسط انتشارات امیرکبیر به چاپ هشتاد و دوم رسید.
از سوی انتشارات انقلاب اسلامی؛

دو عنوان از مجموعه‌ی ره‌نامه به چاپ سوّم رسیدند

کتاب‌های «زن و خانواده» و «رسانه و فضای مجازی» از مجموعه‌ی ۴۰ جلدی «ره‌نامه» تجدید چاپ شده و به چاپ سوّم رسیدند.
از سوی موسسه شهرستان ادب؛

«ماه و بلوط» محسن مومنی شریف در شهرستان ادب نقد می‌شود

دفتر داستان شهرستان ادب در نهمین برنامه از «عصر اثر» رمان «ماه و بلوط» نوشته محسن مومنی شریف را نقد و بررسی می‌کند.

پربازدیدترین

تازه‌ها

در حوزه هنری قم عنوان شد؛

شخصیت نویسنده روی کتاب «از سلاخ‌خانه تا…مهدیه» تاثیر گذاشته است

قم - یک نویسنده و منتقد ادبی با اشاره به کتاب «از سلاخ‌خانه تا…مهدیه»، اثر ابراهیم اکبری دیزگاه گفت: شخصیت نویسنده روی کتاب تاثیر گذاشته است.
استاندار آذربایجان غربی:

وفاق رسانه برای توسعه در آذربایجان‌غربی/ وفاق عاملی اصلی رشد و توسعه

آذربایجان‌غربی_ استاندار آذربایجان‌غربی گفت: در حوزه تصمیم گیری خودم را وکیل مدافع همه استان می‌دانم و در جابجایی‌های مدیریتی هم با کارکرد افراد کار داریم و تفرقه کار دشمن و بدخواهان ماست و وفاق را باید ترویج دهیم تا بتوانیم رشد کنیم.
مسئول دبیرخانه انجمن ادبی مادرانه مطرح کرد؛

چهارمین جایزه ادبی مادرانه با محوریت مادر امام رضا(ع) برگزار می‌شود

خراسان‌رضوی - مسئول دبیرخانه انجمن ادبی مادرانه گفت: چهارمین جایزه ادبی مادرانه، امسال با محوریت حضرت نجمه خاتون (س)، مادر گرامی امام رضا (ع)، برگزار می‌شود.
مدارس عشایری فارس به اردوی کتاب‌خوانی دعوت شدند

فارس_ مرحله دوم اردوهای کتاب‌خوانی عشایر در استان فارس آغاز شد.
دبیر «محفل ادبی آفتاب»:

«مهرک و قاصدک» عطر باران را به «محفل ادبی آفتاب» بندرعباس آوردند

هرمزگان - دبیر «محفل ادبی آفتاب» گفت: «مهرک و قاصدک» عطر باران را به «محفل ادبی آفتاب» بندرعباس آوردند.
با حضور معاون فرهنگی سپاه؛

رونمایی از سه اثر نیروی زمینی سپاه / لزوم توجه به تاریخ شفاهی امنیت پایدار

سه اثر جدید انتشارات شهدای نیروی زمینی سپاه با محوریت امنیت پایدار رونمایی شد.
بررسی آمار رسمی نشر هنر - ۲۱

انتشار ۱۸ عنوان کتاب در حوزه «سینما» در یک ماه

در بازه زمانی آبان‌ماه ۱۴۰۳، در دسته‌بندی «سینما» ، تعداد ۱۸ عنوان کتاب چاپ شده است.
فیلم

خیام‌خوانی توسط داور لبنانی

برشی از برنامه داستان شد را می‌بینید.
در گفت‌وگو با ایبنا عنوان شد؛

شاملو تلاش کرد با قالب سپید به کلمات اصالت دهد/ هنرمندان مرکز ثقل فرهنگ هستند

گلستان- نویسنده، پژوهشگر و روزنامه نگار و فعال فرهنگی گلستانی معتقد است؛ احمد شاملو تلاش کرد با قالب سپید اصالت را به کلمه بدهد و زبان شعر فارسی را همگام بازمان به‌پیش ببرد.
برگزاری مسابقه بزرگ کتابخوانی «پاییز آمد»

سیستان و بلوچستان_ رئیس حوزه هنری انقلاب اسلامی سیستان و بلوچستان از برگزاری مسابقه کتابخوانی در این استان خبر داد.
همزمان با اردیبهشت ۱۴۰۴؛

دانشگاه کردستان میزبان همایش ملی مطالعات گروس شد

کردستان - دبیر علمی همایش ملی مطالعات گروس از برگزاری این همایش در اردیبهشت سال آینده خبر داد و گفت: همایش ملی مطالعات گروس با مشارکت دانشگاههای معتبر کشور و دستگاه‌های اجرایی کردستان برگزار می‌شود.
به همت معلمان و دانش‌آموزان روستای دل؛

تجلیل از کوچکترین کتاب‌خوان کشور در زادگاه مادری

کردستان - «ملودی محمودی» که به عنوان کوچکترین کتاب‌خوان کشور شناخته می‌شود، توسط معلمان و دانش‌آموزان مدرسه روستای دل سروآباد و در زادگاه مادریش مورد تجلیل قرار گرفت.
مدیرکل اوقاف و امور خیریه استان زنجان:

هزینه مسابقات قرآنی از محل موقوفات تامین می‌شود

زنجان- مدیرکل اوقاف و امور خیریه استان زنجان گفت: هزینه مسابقات قرآنی از محل موقوفات تامین می‌شود.
در نشست «سه‌شنبه‌های طلایی» مطرح شد؛

برای کودکان تصویرگری کنید نه جشنواره‌ها/ نقد سازنده؛ کلید رشد هنر تصویرگری در ایران

سمیه محمدی، تصویرگر کتاب کودک گفت: استاد گلدوزیان همیشه به ما می‌گفت که اصلاً برای جشنواره کار نکنید؛ بلکه برای کودک کار کنید و باید آن‌قدر خوب کار کنید که آثار شما به‌دلیل رنگ، بزرگ‌نمایی و جزئیات دیگر به گونه‌ای باشند که تصویر شما کشف‌کردنی باشد و با یک بار نگاه کردن تمام نشود.
کارگردان مستند «بوم ایرانی» مطرح کرد؛

«بوم ایرانی»؛ مستندی از دنیای کتاب‌ها

محمد مقدم گفت: علی پارسا نتیجه تحقیقات ۵ ساله خود را در کتابی به نام «بادبان‌های جنوب» منتشر کرده است. با حمایت و اصرارهای او، «بوم ایرانی» را براساس «بادبان‌های جنوب» ساختم.
مسابقه فیلمنامه‌نویسی؛

«تصویر شهر تهران» برگزار می‌شود

مؤسسه تصویر شهر با هدف حمایت از ایده‌های برتر برای تولید آثار سینمایی، مسابقه فیلمنامه‌نویسی با عنوان «تصویر شهر تهران» را برگزار می‌کند.
به همت انتشارات آبان؛

مجموعه ۱۰ جلدی «اکفراسیس» منتشر شد

مجموعه ۱۰ جلدی «اکفراسیس» با رویکردهایی متنوع مانند نامه‌نگاری، یادداشت، روایت و معرفی آثار، به بررسی و تفسیر هنر پرداخته و هر جلد آن، چشم‌اندازی تازه به دنیای هنر و ادبیات ارائه می‌دهد.
نویسنده کتاب «انین الاقصی» در گفت‌وگو با ایبنا؛

غسان با قلمش برای اسرائیل از یک گردان چریکی خطرناک‌تر بود

فداء الزمر، برگزیده اولین دوره جایزه جهانی ادبیات فلسطین،گفت:روایت فلسطینی باید حفظ شود چر که آثار ادبی محرک و برانگیزاننده جنبش‌های انقلابی علیه اشغالگری بودند همان طور که گولدامایر گفته است:«با کشتن غسان، از یک لوای فکری مسلح که برای اسرائیل خطرناک‌تر از هزار فدایی مسلح بود خلاص شدیم؛ زیرا غسان با قلمش برای اسرائیل از یک گردان چریکی خطرناک‌تر بود.»
در دورهمی حافظ خوانی اراک روایت شد؛

سالک از راه و رسم منزل‌ها بی‌خبر نبود

مرکزی – سه‌شنبه دیگر فرا رسید و دورهمی حافظ خوانی در اراک تفأل بر غزل شماره یک حافظ برای خوانش و تفسیر و تعبیر برآمد تا پیر مغان روایت کند «چگونه عشق آسان نمود اول ولی عاقبت چه مشکل‌ها را رقم زد».
به همت انتشارات «پَر سُرخ»؛

«سندباد در سیریک» منتشر شد

هرمزگان - به همت انتشارات «پَر سُرخ»، کتاب «سندباد در سیریک» منتشر شد.