یادگیری تقویتی (Reinforcement Learning)

**SHABNAM.TAVARI** · 18-03-15 09:13

با سلام
امکان داره الگوریتم eql بااستفاده از الگوریتم ژنتیک رو توضیح بدید و برای ژیاده سازی متلب راهنمایی کنید
مرسی

**ravegoat** · 02-04-15 10:56

برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید ارسالی توسط SHABNAM.TAVARI برای مشاهده این لینک/عکس می بایست عضو شوید ! برای عضویت اینجا کلیک کنید

با سلام
امکان داره الگوریتم eql بااستفاده از الگوریتم ژنتیک رو توضیح بدید و برای ژیاده سازی متلب راهنمایی کنید
مرسی

با سلام!

ضمن تبریک سال نو، عضویت تون رو در شهر سخت افزار تبریک می گم.

در یادگیری تقویتی تکاملی ما برای جست و جو در فضای سیاست ها به جای به کارگیری الگوریتم های تفاضلی (Temporal Difference یا TD) از الگوریتم های تکاملی نظیر الگوریتم ژنتیک استفاده می کنیم. در TD برای هر سیاست پارامتری به عنوان کیفیت تعریف میشه که نشان دهنده ی میزان کارایی اون سیاست در یک حالت خاص هستش. بر اساس این الگوریتم کیفیت سیاست های مطلوب افزایش پیدا می کنه و به واسطه ی کیفیت هر پارامتر می تونیم به میزان مطلوب بودن اون سیاست پی ببریم.
در مقابل در یادگیری تقویتی تکاملی هر سیاست به صورت یک کروموزوم در میاد. این کرموزوم ها طی فرآیند های تولید مثل و جهش نسل های برتر رو تشکیل می دن. نسل های برتر شامل کروموزوم های برتر اند و چون هر کروموزوم نماینده ی یک سیاست منحصر به فرد است، رمز گشایی نسل های برتر ما رو به سیاست های مطلوب خواهند رساند. برخلاف روش TD در این روش سیاست های مطلوب براساس یک روند تکاملی شناسایی می شوند.

پیشنهاد میشه که دو مقاله ی زیر رو مطالعه بفرمایید:
http://arxiv.org/pdf/1106.0221.pdf
https://www.cs.utexas.edu/~pstone/Pa...nks/JMLR06.pdf

در رابطه با پیاده سازی در MATLAB بنده جعبه ابزار اختصاصی ای رو برای EQL سراغ ندارم ولی می تونید از Toolbox زیر جهت این پیاده سازی ایده بگیرید:
ApproxRL: A Matlab Toolbox for Approximate RL and DP

موفق باشید
آرمین

موضوع: یادگیری تقویتی (Reinforcement Learning)

امکانات

Display

پاسخ: یادگیری تقویتی (Reinforcement Learning)

کاربر زیر از SHABNAM.TAVARI بخاطر این ارسال مفید قدردانی نموده است

پاسخ: یادگیری تقویتی (Reinforcement Learning)

3 کاربر زیر از ravegoat بخاطر این ارسال مفید قدردانی نموده اند:

اطلاعات موضوع

کاربران در حال مشاهده موضوع

Bookmarks

Bookmarks

قوانین ارسال