Sadegh Talebi
Tenure Track Adjunkt
Machine Learning
Universitetsparken 1
2100 København Ø
Flest downloads
-
43 downloadsUdgivet
Adversarial Bandits with Corruptions
Publikation: Bidrag til bog/antologi/rapport › Konferencebidrag i proceedings › Forskning › fagfællebedømt
-
33 downloadsUdgivet
Tightening Exploration in Upper Confidence Reinforcement Learning
Publikation: Bidrag til bog/antologi/rapport › Konferencebidrag i proceedings › Forskning › fagfællebedømt
-
12 downloadsUdgivet
Scaling Up Q-Learning via Exploiting State–Action Equivalence
Publikation: Bidrag til tidsskrift › Tidsskriftartikel › Forskning › fagfællebedømt
-
10 downloadsUdgivet
Bandit-Based Power Control in Full-Duplex Cooperative Relay Networks with Strict-Sense Stationary and Non-Stationary Wireless Communication Channels
Publikation: Bidrag til tidsskrift › Tidsskriftartikel › Forskning › fagfællebedømt
ID: 235125478
Flest downloads
-
43
downloads
Adversarial Bandits with Corruptions
Publikation: Bidrag til bog/antologi/rapport › Konferencebidrag i proceedings › Forskning › fagfællebedømt
Udgivet -
33
downloads
Tightening Exploration in Upper Confidence Reinforcement Learning
Publikation: Bidrag til bog/antologi/rapport › Konferencebidrag i proceedings › Forskning › fagfællebedømt
Udgivet -
12
downloads
Scaling Up Q-Learning via Exploiting State–Action Equivalence
Publikation: Bidrag til tidsskrift › Tidsskriftartikel › Forskning › fagfællebedømt
Udgivet