Sadegh Talebi
Tenure Track Adjunkt
Machine Learning
Universitetsparken 1
2100 København Ø
1 - 1 ud af 1Pr. side: 10
- 2021
- Udgivet
Improved Exploration in Factored Average-Reward MDPs
Talebi, Mohammad Sadegh, Jonsson, A. & Maillard, O., 2021, Proceedings of the 24th International Conference on Artificial Intelligence and Statistics (AISTATS). PMLR, s. 3988-3996 (Proceedings of Machine Learning Research, Bind 130).Publikation: Bidrag til bog/antologi/rapport › Konferencebidrag i proceedings › Forskning › fagfællebedømt
ID: 235125478
Flest downloads
-
51
downloads
Adversarial Bandits with Corruptions
Publikation: Bidrag til bog/antologi/rapport › Konferencebidrag i proceedings › Forskning › fagfællebedømt
Udgivet -
40
downloads
Tightening Exploration in Upper Confidence Reinforcement Learning
Publikation: Bidrag til bog/antologi/rapport › Konferencebidrag i proceedings › Forskning › fagfællebedømt
Udgivet -
22
downloads
Scaling Up Q-Learning via Exploiting State–Action Equivalence
Publikation: Bidrag til tidsskrift › Tidsskriftartikel › Forskning › fagfællebedømt
Udgivet