بررسی سیستمهای چند عامله با استفاده از تئوری بازیها
در این رساله، روش مناسبی جهت محاسبه نقطه تعادل نش در الگوریتمهای یادگیری تقویتی چندعاملی با تعداد زیاد عاملها مطرح شدهاست، كه قادراست با ادغام محاسبات مربوط به نقطه تعادل نش و ایجاد مصالحه بین اكتشاف- استخراج، محاسبات را به صورت بهینه كاهش دهند. تركیب یادگیری تقویتی تك- عاملی و تئوری بازی ایده اصلی اكثر روشهای یادگیری چندعاملی است. این روشها سعی دارند تا كل فرآیند یادگیری را به تعدادی متناهی از حالتهای تصمیمگیری چندعاملی با خاصیت ماركوف تقسیم كرده و با انتخاب نقطه تعادل نش در هر كدام از این مراحل به تدبیر بهینه برای هر عامل همگرا شوند. بنابراین محاسبه نقطه تعادل نش مسئله مهمی است كه در حال حاضر مشكلاتی شامل پیچیدگی محاسبات در روشهای شناخته شده محاسبه نقطه تعادل نش، چندگانگی نقطه تعادل نش، و مختلط بودن نقطه تعادل نش باعث شده كه اكثر روشهای پیشنهادی یادگیری تقویتی چندعاملی جایگاه مناسبی در حل مسائل دنیای واقعی پیدا نكنند. ناگفته نماند كه تقریباً تمام روشهای یادگیری تقویتی چندعاملی مطرح شده، مبتنی بر روشهای off-policy بودهاند كه نیازی به در نظر گرفتن مسئله رویه انتخاب عمل و اكتشاف در اثبات همگرایی ندارند. بنابراین در رویههای اجرایی پیشنهاد دادهاند كه ابتدا نقطه تعادل نش محاسبه شده و سپس با روش ϵ-greedy مصالحه بین اكتشاف و استخراج برقرار شود.
محاسبه نقطه تعادل ϵ-نش در بازیهای نرمال در این رساله به صورت یك مسئله مینیممسازی تعریف شده كه جواب آن توسط الگوریتمهای ژنتیك بدست آمدهاست. علاوه بر كاهش پیچیدگی روش محاسبه نقطه تعادل نش، با اضافه كردن جمله مناسب در محاسبه تابع برازندگی، هر عامل قادر است نقطه تعادل نش پارتو را محاسبه كند كه مسئله چندگانگی نقاط تعادل نش را نیز مرتفع میسازد.
فهرست مطالب
چكیده. 1
مقدمه 2
1- عامل و سیستمهای چند عامله. 4
1-1- مقدمه. 4
1-2- هوش مصنوعی توزیع شده. 4
1-3- حوزههای كاری هوش مصنوعی توزیع شده. 6
1-4- دلایل گرایش به هوش مصنوعی توزیع شده. 9
1-4-1- پایه تكنولوژیكی.. 9
1-4-2- توزیع ذاتی.. 10
1-4-3- مزایای طراحی و پیادهسازی.. 12
1-4-4- دلایل معرفت شناسی.. 13
1-4-5- بنیاد اجتماعی.. 14
1-4-6- همجوشی (كلاسهای جدید از مسائل). 14
1-5- مسائل مطرح در هوش مصنوعی توزیع شده. 14
1-6- تعریف عامل و عاملهای هوشمند.. 17
1-6-1- تعریف عامل.. 18
1-7- عامل به عنوان یك سیستم نرمافزاری.. 19
1-8- مفهوم عامل از دیدگاه عام. 20
1-9- مروری برخصوصیات عامل.. 20
1-10- ویژگیهای دیگر عاملها25
1-11- طبقه بندی عاملها29
1-12- مقایسه عامل با شیء. 33
1-13- تفاوتهای سیستم مبتنی بر عامل و سیستمهای خبره. 35
1-14- انواع محیط عامل.. 35
1-14-1- قابل دستیابی / غیر قابل دستیابی.. 36
1-14-2- محیط قطعی یا غیر قطعی.. 37
1-14-3- محیط مقطعی یا غیر مقطعی.. 38
1-14-4- محیط ایستا / پویا38
1-14-5- محیط گسسته یا پیوسته. 38
1-15- سیستمهای چند عامله. 39
1-16- خصوصیات سیستمهای چند عاملی:46
1-17- دلایل استفاده از سیستمهای چندعامله. 47
1-17-1- نیاز برخی دامنهها به سیستمهای چندعامله:47
1-17-2- افزایش سرعت عمل با موازی سازی.. 48
1-17-3- قابلیت اطمینان.. 48
1-17-4- توسعه پذیری.. 48
1-17-5- آسانتر شدن برنامهسازی.. 49
1-18- آزمون نظریههای سایر رشتههای علمی.. 49
1-19- معماریهای ارایه شده برای سیستمهای چندعامله. 49
1-19-1- مدل OMG50
1-19-2- استاندارد FIPA50
1-19-3- استاندارد KAOS. 50
1-19-4- مدل General Magic. 51
1-20- سازماندهی سیستمهای چندعامله. 51
1-20-1- ساختار سلسله مراتبی.. 51
1-20-2- ساختار مسطح.. 52
1-20-3- ساختار جزء به كل.. 53
1-20-4- ساختار پیمانهای.. 53
1-21- پارامترهای مطرح در ارزیابی سیستمهای چندعامله. 54
1-22- سیستمهای مقیاس وسیع(Large Scale systems):55
1-23- کنترل غیر متمرکز : (Decentralized Control)56
1-24- نتیجهگیری.. 57
2- تئوری بازیها و کاربردهای آنها درسیستمهای چند عامله. 60
2-1- مقدمه. 60
2-2- نظریه بازی ها چیست؟. 60
2-3- تفاوت میان تصمیمگیری و بازی.. 62
2-4- طبقهبندی نظریه بازیها63
2-5- برخی مفاهیم و اصطلاحات... 68
2-6- موارد استفاده از نظریه بازیها74
2-7- فرض های اساسی در نظریه بازیها75
2-8- شاخههای اصلی نظریه بازیها75
2-9- بازیهای ایستا77
2-10- نمایش بازی در فرم استراتژیك یا نرمال.. 79
2-11- فرم ماتریسی بازی.. 82
2-12- پیدا کردن جواب در بازیهای ایستا82
2-13- بازیهای رقابتی.. 83
2-14- بازیهای تصادفی.. 84
2-15- بازیهای پویا85
2-16- بازی پویا در فرم بسط یافته. 85
2-17- درخت بازی.. 87
2-18- عناصر فرم بسط یافته:88
2-19- پیشینه بازی:88
2-20- مجموعه اطلاعاتی:89
2-21- استراتژی.. 90
2-22- پیدا کردن جواب در بازیهای پویا91
3- بررسی روشهای یادگیری.. 93
3-1- یادگیری تقویتی.. 93
3-1-1- خط مشی.. 94
3-1-2- تابع پاداش... 94
3-1-3- تابع مقدار. 94
3-1-4- مدل برگرفته شده از محیط.. 95
3-2- اجزای یادگیری تقویتی.. 97
3-3- اهدافوپاداش.... 98
3-4- Q-Learning 99
3-5- خاصیتماركوف... 100
3-6- فرآیندتصمیمگیریماركوف... 101
3-7- روشهای حل فرآیندهای تصمیم گیری مارکوف... 103
3-8- تابعارزش.... 104
3-9- تابع ارزش بهینه:105
3-10-فرایند تحلیل سلسله مراتبی (AHP)106
3-11- ویژگیهای فرایند تحلیل سلسله مراتبی.. 106
3-12- ساختار سلسله مراتبی.. 107
3-13- اصول فرایند تحلیل سلسله مراتبی.. 108
3-14- محاسبه وزن.. 108
3-15- روشهای محاسبه وزن.. 109
3-15-1- روش حداقل مربعات ( least squares method )109
3-15-2- روش حداقل مربعات لگاریتمی (logarithmic least squares method)110
3-15-3- روش بردار ویژه ( Eigenvector Method ):111
3-15-4- روش های تقریبی(Approximation Method). 112
3-16- سازگاری سیستم و ماتریس سازگار. 112
3-17- محاسبه نرخ ناسازگاری.. 113
4- نتیجهگیری.. 116
5- مراجع. 118
6-
چطور این فایل رو دانلود کنم؟
برای دانلود فایل کافیه روی دکمه "خرید و دانلود" کلیک کنید تا صفحه "پیش فاکتور خرید" برای شما باز بشه و توی این صفحه مشخصات خودتون رو با دقت ثبت کنید و روی دکمه "پرداخت آنلاین" کلیک کنید و بعد از اینکه توی صفحه بانک مشخصات کارت بانکی خودتون رو ثبت کردید و پرداخت انجام شد ، صفحه دانلود فایل باز میشه و می تونید فایل مورد نظر رو همراه با فایل هدیه به راحتی دانلود کنید.
با خرید از شما چه هدیه ای دریافت می کنم؟
توی سایت فایل ناب برای هر خریدار یک فایل هدیه در نظر گرفتیم که بلافاصله بعد از اولین خرید ، این فایل رو هم می تونید به راحتی دانلود کنید. لینک دانلود این فایل به همراه لینک دانلود فایل خریداری شده ، بعد از پرداخت به شما نمایش داده میشه. عنوان فایل هدیه "چطور محصولات آموزشی پرفروش بسازیم" هست که قیمتش 29000 تومنه و بصورت رایگان در اختیار شما قرار داده میشه.
آیا فایل رو بلافاصله بعد از خرید تحویل می گیرم؟
بله. بلافاصله بعد از پرداخت آنلاین ، صفحه دانلود فایل برای شما نمایش داده میشه و می تونید اون فایل رو به راحتی دانلود کنید.
هزینه رو پرداخت کردم اما نمی تونم دانلود کنم.
در سایت فایل ناب چند روش پشتیبانی رو برای راحتی شما در نظر گرفتیم تا با سرعت بیشتری به پیام های شما رسیدگی کنیم. برای دریافت سریع فایل می تونید از طریق پشتیبانی آنلاین و یا از طریق شماره 09192682620 در واتساپ با ما در ارتباط باشید و ایمیل و شماره همراهی که در زمان خرید ثبت کردید رو ارسال کنید تا فایل رو برای شما بفرستیم. همچنین می تونید از فرم تماس با ما و یا از طریق تیکت در حساب کاربری خودتون این مشخصات رو برای ما ارسال کنید تا فایل رو به ایمیل شما بفرستیم.
این فایلی که دانلود کردم با توضیحاتی که نوشته بودن فرق داره !
اگه فایل با توضیحات همخوانی نداره کافیه از طریق تیکت این موضوع رو به ما اطلاع بدید. ما فایل رو بررسی میکنیم و یا فایل اصلی رو به ایمیل شما میفرستیم و یا اینکه هزینه ای که پرداخت کردید رو به حسابتون برگشت میزنیم. توضیحات کامل تر در این خصوص رو می تونید توی صفحه "راهنمای خرید و دانلود" مطالعه کنید.
چیکار کنم که موقع خرید و پرداخت آنلاین به مشکل نخورم؟
برای اینکه در زمان پرداخت آنلاین به مشکل برخورد نکنید باید V P N خاموش باشه و از مرورگرهای موزیلا فایرفاکس و کروم استفاده کنید. و ضمنا در صفحه "پیش فاکتور خرید" مشخصات خودتون رو به شکل صحیح وارد کنید. این موضوع رو در نوشتن ایمیل هم در نظر داشته باشید که ایمیلی که فعال هست و بهش دسترسی دارید رو بنویسید. ایمیل صحیح به این شکله filenab.com@gmail.com
نظرت در مورد این محصول چیه؟