Suchergebnis

zu den Filteroptionen
Suche nach: Autor / Beteiligte = Cordes, Ivo und Sammlung = ULB Düsseldorf
  • Titelblatt
    apply modern RL methods, with deep Q-networks, value iteration, policy gradients, TRPO, AlphaGo Zero and more
    Lapan, Maxim
    Birmingham ; Mumbai : Packt, June 2018