Sadegh Talebi

Tenure Track Adjunkt

Udgivelsesår:

Alle

1 - 2 ud af 2Pr. side: 10

Sortering: Udgivelsesdato

2024
Udgivet
Logarithmic regret in communicating MDPs: Leveraging known dynamics with bandits
Saber, H., Pesquerel, F., Maillard, O. & Talebi, Mohammad Sadegh, 2024, Proceedings of the 15th Asian Conference on Machine Learning. PMLR, s. 1167-1182 (Proceedings of Machine Learning Research, Bind 222).
Publikation: Bidrag til bog/antologi/rapport › Konferencebidrag i proceedings › Forskning › fagfællebedømt
E-pub ahead of print
Scaling Power Management in Cloud Data Centers: A Multi-Level Continuous-Time MDP Approach
Chitsaz, B., Khonsari, A., Moradian, M., Dadlani, A. & Talebi, Mohammad Sadegh, 2024, (E-pub ahead of print) I: IEEE Transactions on Services Computing. 12 s.
Publikation: Bidrag til tidsskrift › Tidsskriftartikel › Forskning › fagfællebedømt

ID: 235125478

50 downloads
Adversarial Bandits with Corruptions
Publikation: Bidrag til bog/antologi/rapport › Konferencebidrag i proceedings › Forskning › fagfællebedømt
Udgivet
40 downloads
Tightening Exploration in Upper Confidence Reinforcement Learning
Publikation: Bidrag til bog/antologi/rapport › Konferencebidrag i proceedings › Forskning › fagfællebedømt
Udgivet
22 downloads
Scaling Up Q-Learning via Exploiting State–Action Equivalence
Publikation: Bidrag til tidsskrift › Tidsskriftartikel › Forskning › fagfællebedømt
Udgivet

Datalogisk Institut