Sadegh Talebi

Tenure Track Adjunkt

Udgivelsesår:

Alle

1 - 4 ud af 4Pr. side: 10

Sortering: Udgivelsesår

2023
Udgivet
Exploration in Reward Machines with Low Regret
Bourel, Hippolyte Raymond, Jonsson, A., Maillard, O. A. & Talebi, Mohammad Sadegh, 2023, Proceedings of The 26th International Conference on Artificial Intelligence and Statistics. PMLR, Bind 206. s. 4114-4146 33 s. (Proceedings of Machine Learning Research, Bind 206).
Publikation: Bidrag til bog/antologi/rapport › Konferencebidrag i proceedings › Forskning › fagfællebedømt
Udgivet
Provably Efficient Offline Reinforcement Learning in Regular Decision Processes
Cipollone, R., Jonsson, A., Ronca, A. & Talebi, Mohammad Sadegh, 2023, Advances in Neural Information Processing Systems 36 (NeurIPS 2023). NeurIPS Proceedings, 34 s. (Advances in Neural Information Processing Systems, Bind 36).
Publikation: Bidrag til bog/antologi/rapport › Konferencebidrag i proceedings › Forskning › fagfællebedømt
Udgivet
Double Graph Attention Networks for Visual Semantic Navigation
Lyu, Y. & Talebi, Mohammad Sadegh, 2023, I: Neural Processing Letters. 55, 7, s. 9019-9040
Publikation: Bidrag til tidsskrift › Tidsskriftartikel › Forskning › fagfællebedømt
Udgivet
Scaling Up Q-Learning via Exploiting State–Action Equivalence
Lyu, Y., Côme, A., Zhang, Y. & Talebi, Mohammad Sadegh, 2023, I: Entropy. 25, 4, 584.
Publikation: Bidrag til tidsskrift › Tidsskriftartikel › Forskning › fagfællebedømt

ID: 235125478

51 downloads
Adversarial Bandits with Corruptions
Publikation: Bidrag til bog/antologi/rapport › Konferencebidrag i proceedings › Forskning › fagfællebedømt
Udgivet
41 downloads
Tightening Exploration in Upper Confidence Reinforcement Learning
Publikation: Bidrag til bog/antologi/rapport › Konferencebidrag i proceedings › Forskning › fagfællebedømt
Udgivet
22 downloads
Scaling Up Q-Learning via Exploiting State–Action Equivalence
Publikation: Bidrag til tidsskrift › Tidsskriftartikel › Forskning › fagfællebedømt
Udgivet