درحال بارگذاري...
جستجو برای:
یادگیری تقویتی reinforcement learning
0.004 ثانیه
رديف | نوع | عنوان | پدیدآور اصلی | ناشر | سال انتشار | موضوع ها | شماره راهنما |
---|---|---|---|---|---|---|---|
1 | پایان نامه | فرایادگیری تقویتی برای تعمیم دامنه Meta Reinforcement Learning for Domain Generalization | ریاحی مدوار، مریم Riyahi Madvar, Maryam | صنعتی شریف | 1401 | یادگیری تقویتی Reinforcement Learning / تعمیم دامنه Domain Generalization / فرایادگیری Metalearning / یادگیری بدون نظارت Unsupervised Learning / فرایادگیری تقویتی Meta Reinforcement Learning / یادگیری تقویتی عمیق Deep Reinforcement Learning |
19-55379
|
2 | پایان نامه | چند الگوریتم یادگیری تقویتی بدون مدل در حالت گسسته Some Model-free Discrete Reinforcement Learning Algorithms | یوسفی زاده، حسین Yousefizadeh, Hossein | صنعتی شریف | 1399 | یادگیری تقویتی Reinforcement Learning / یادگیری عمیق Deep Learning / یادگیری ماشینی Machine Learning / برنامه ریزی پویا Dynamic Programming / یادگیری تقویتی گسسته Discrete Reinforcement Learning |
02-54227
|
3 | پایان نامه | ارزیابی روش های عصبی - تکاملی با توپولوژی فزوده در یادگیری چندعاملی های همکار Evaluation of NeuroEvolution of Augmenting Topologies in Cooperative Multi-Agent Learning | ایروانیان، سینا Iravanian, Sina | صنعتی شریف | 1389 | سیستم چندعاملی Multiagent System / یادگیری هماهنگی Learning Coordination / یادگیری تقویتی چندعاملی Multi-Agent Reinforcement Learning / روش عصبی - تکاملی Neuro-Evolutionary Methods |
02-41780
|
4 | پایان نامه | بررسی اختلالات انتخاب کنش در بیماران مبتلا به اسکیزوفرنی با استفاده از مدل سازی محاسباتی در چهاچوب یادگیری تقویتی A Study on Action Selection Deficits in Schizophrenic Patients Using Computational Modeling in Reniforcement Learning Framework | آقاجری، سارا Aghajari, Sara | صنعتی شریف | 1390 | یادگیری تقویتی Reinforcement Learning / انتخاب عمل Action Selection / اسکیزوفرنی Schizophernia / یادگیری معکوس سازی Reversal Learning / مدل نقاد - عملگر Actor-Critic Model |
05-42903
|
5 | پایان نامه | روش های منظم سازی برای بهبود نرخ یادگیری در یادگیری تقویتی Regularization Methods for Improving Data Efficiency in Reinforcement Learning | احمدیان شهرضا، حمید رضا Ahmadian Shahreza, Hamid Reza | صنعتی شریف | 1400 | منظم سازی Regularization / انتقال یادگیری Transfer Learning / یادگیری تقویتی Reinforcement Learning / کیفیت دادهها Data Efficiency |
02-54575
|
6 | پایان نامه | استفاده از یادگیری تقویتی برای بهدست آوردن ساختار مطلوب در سامانههای خودساختار Reinforcement Learning Approach in Self-Assembly Systems to Acquire Desired Structures | راوری، امیر حسین Ravari, Amir Hossein | صنعتی شریف | 1399 | خودساماندهی Self Assembly / مدل سازی Modeling / یادگیری تقویتی Reinforcement Learning / یادگیری تقویتی چندعاملی Multi-Agent Reinforcement Learning / یادگیری کیو Q-Learning |
05-53729
|
7 | پایان نامه | ارائه و بررسی پیاده سازی های ممریستوری برای الگوریتم های مختلف یادگیری ماشین Design and Comparison of Memristor Implementation for Different Machine Learning Algorithms | حقیقت، بهار Haghighat, Bahar | صنعتی شریف | 1391 | یادگیری ماشینی Machine Learning / یادگیری تقویتی Reinforcement Learning / مدل سازی فازی Fuzzy Modeling / یادگیری فعال Active Learning / ممریستور Memristor |
05-43085
|
8 | پایان نامه | انتزاع خودکار محیط در سیستم های یادگیری تقویتی چندعامله | فیض بخش رانکوه، مسعود. | صنعتی شریف | 1386 | بزرگ نمایی Amplification / تجرید Abstraction / یادگیری تقویتی سلسله مراتبی Hierarchical Reinforcement Learning / یادگیری تقویتی چندعامله مشارکتی Cooperative Multi-Agent Reinforcement Learning |
19-38375
|
9 | پایان نامه | کنترل هوشمند عمق بیهوشی | افلاکی، علی. | صنعتی شریف | 1385 | کنترل هوشمند Intelligent Control / یادگیری تقویتی Reinforcement Learning / مدل سازی بیهوشی Anesthesia Modeling |
05-36500
|
10 | پایان نامه | بررسی فرایند تقسیم امتیاز در سیستم های چندعامله با یادگیری تقویتی A Study on Credit Assignment among Reinforcement Learning Agents | رهایی، زهرا Rahaie, Zahra | صنعتی شریف | 1388 | سیستم چندعاملی Multiagent System / یادگیری تقویتی Reinforcement Learning / تقسیم امتیاز Credit Assignment |
19-40309
|
11 | پایان نامه | یادگیری تقویتی در سیستم های مدیریت گفتگو Learning Dialogue Management in Spoken Dialogue Systems | حبیبی، مریم Habibi, Maryam | صنعتی شریف | 1389 | یادگیری تقویتی Reinforcement Learning / مدیریت مکالمه Dialogue Management / سیستم محاوره مبتنی بر گفتار Spoken Dialoge System |
19-40878
|
12 | پایان نامه | الگوریتم تامسون و مسالهی راهزن چنددست Thompson Algorithm and Multi-armed Bandit Problem | فرازمند، سیاوش Farazmand, Siavash | صنعتی شریف | 1399 | مساله بندیت با بازوهای متعدد Multi-Armed Bandit Problem / یادگیری تقویتی Reinforcement Learning / الگوریتم تامسون Thompson Algorithm |
02-53891
|
13 | پایان نامه | مدیریت سبد سهام با استفاده از مدل های یادگیری تقویتی به کمک دادە های تاریخچه قیمتی سهم ها و همبستگی بین آنها A Reinforcement Learning Framework for Portfolio Management Problem Leveraging Stocks Historical Data And Their Correlation | طاهرخانی، حامد Taherkhani, Hamed | صنعتی شریف | 1402 | یادگیری تقویتی Reinforcement Learning / مدیریت سبد مالی Portfolio Management / یادگیری تقویتی عمیق Deep Reinforcement Learning / بازار مالی Financial Market / یادگیری عمیق Deep Learning / استراتژی بهینه مالی Optimal Fiscal Strategy |
44-56219
|
14 | پایان نامه | دخیل کردن قابلیت های عاطفی در یادگیری تقویتی | موسوی طباطبایی، سیده پریسا. | صنعتی شریف | 1386 | یادگیری تقویتی Reinforcement Learning / یادگیری عاطفی Emotional Learning / سیستم دسته بند یادگیری Learning Classifier System / چالش کاوش - کاربست Exploration/Exploitation Dilemma / کنجکاوی خوش بینانه Optimistically-Biased Curiosity / تردید Doubt |
19-37799
|
15 | پایان نامه | شبیهسازی سرطان با استفاده از فرایند تصمیمگیری مارکوف Cancer Simulation with Markov Decision Process | زارع پور، فریبرز Zarepour, Fariborz | صنعتی شریف | 1395 | یادگیری تقویتی Reinforcement Learning / یادگیری کیو Q-Learning / شبیه سازی سرطان Cancer Simulation / تصمیم گیری مارکوف Markov Decision Making / رویه تصمیم گیری مارکف چندعاملی Multi-Agent Markov Chain Processes (MMDPs) / یادگیری تقویتی چندعاملی Multi-Agent Reinforcement Learning |
19-49407
|
16 | پایان نامه | یادگیری فعالیتهای عملکردی بازوی رباتیک از طریق نمایش مبتنی بر یادگیری تقویتی Robotic Arm Manipulation Learning from Demonstration based on Reinforcement Learning | نوحیان، امیر حسین Noohian, Amir Hossein | صنعتی شریف | 1400 | یادگیری تقلیدی Learning from Demonstration (LfD) / یادگیری تقویتی عمیق Deep Reinforcement Learning / یادگیری تقویتی عمیق چندهدفه Multi-Objective Reinforcement Learning / حرکت های پایهای دینامیکی Dynamic Movement Primitives / بازوی ربات Robot Arm |
08-54965
|
17 | پایان نامه | تشخیص ناهنجاری در تصویر مبتنی بر یادگیری عمیق Image Anomaly Detection based on Deep Learning | لگزیان، آرش Lagzian, Arash | صنعتی شریف | 1402 | تشخیص ناهنجاری Anomaly Detection / یادگیری عمیق Deep Learning / شبکه های عصبی عمیق Deep Neural Networks / چکانش دانش Knowledge Distillation / یادگیری تقویتی Reinforcement Learning |
19-56380
|
18 | پایان نامه | مدل سازی پیشرفت سرطان با رویکرد نظریه بازی های تکاملی Modeling of Cancer Progression by Using Evolutionary Game Theory | ملکیان بروجنی، نگین Malekian Boroujeni, Negin | صنعتی شریف | 1394 | یادگیری تقویتی Reinforcement Learning / یادگیری تقویتی چندعاملی Multi-Agent Reinforcement Learning / تصمیم گیری مارکوف Markov Decision Making / سرطان سینه Breast Cancer / نظریه تکاملی بازی ها Evolutionary Games Theory / کارسینوم مجرایی درجا Ductal Carcinoma Insitu (DCIS) / مدل سازی سرطان Cancer Modeling |
19-47998
|
19 | پایان نامه | طرحریزی فرایند مونتاژ رباتیک خودکار مبتنی بر روش یادگیری تقویتی Optimal Process Planning for Automated Robotic Assembly of Mechanical Assembles based on Reinforcement Learning Method | رئیسی، مهران Raisi, Mehran | صنعتی شریف | 1399 | الگوریتم های هوشمند Intelligent Algorithms / یادگیری تقویتی سلسله مراتبی Hierarchical Reinforcement Learning / یادگیری تقویتی عمیق Deep Reinforcement Learning / بینایی ماشین Machine Vision / مونتاژ هوشمند Intelligent Assembly / الگوریتم SAC Soft Actor Critic (SAC)Algorithm |
08-54094
|
20 | پایان نامه | ارائه چارچوبی بر مبنای یادگیری تقویتی عمیق چندعامله جهت انجام معاملات خودکار در بازارهای مالی A Multi-agent Deep Reinforcement Learning Framework for Algorithmic Trading in Financial Markets | شوندی، علی Shavandi, Ali | صنعتی شریف | 1400 | یادگیری تقویتی Reinforcement Learning / معاملات الگوریتمی Algorithmic Trading / یادگیری تقویتی چندعاملی Multi-Agent Reinforcement Learning / الگوریتم DQN Deep Q-Network (DQN)Algorithm / بازار مالی Financial Market / بازه چندزمانی Multi-Timeframe |
01-54909
|