Glubokoe obuchenie s podkrepleniem (Reinforcement Learning) — samoe populjarnoe i perspektivnoe napravlenie iskusstvennogo intellekta. Prakticheskoe izuchenie RL na Python pomozhet osvoit ne tolko bazovye, no i peredovye algoritmy glubokogo obuchenija s podkrepleniem. Vy nachnete s osnovnykh printsipov obuchenija s podkrepleniem, OpenAI Gym i TensorFlow, poznakomtes s markovskimi tsepjami, metodom Monte-Karlo i dinamicheskim programmirovaniem, tak chto «strashnye» abbreviatury DQN, DRQN, A3C, PPO i TRPO vskore perestanut vas pugat. Vy uznaete ob agentakh, kotorye uchatsja na chelovecheskikh predpochtenijakh, DQfD, HER i mnogikh drugikh poslednikh dostizhenijakh RL. Prochitav knigu, vy priobretete znanija i opyt, neobkhodimye dlja realizatsii obuchenija s podkrepleniem i glubokogo obuchenija s podkrepleniem v realnykh proektakh, i vojdete v mir iskusstvennogo intellekta. V etoj knige vy: †Poznakomites s osnovami metodov, algoritmov i elementov RL †Obuchite agenta s pomoschju OpenAI Gym i Tensorflow †Osvoite markovskie protsessy prinjatija reshenij, optimalnost Bellmana i obuchenie TD †Nauchites reshat problemy mnogorukikh banditov †Ovladeete algoritmami glubokogo obuchenija, takimi kak RNN, LSTM i CNN †Sozdadite intellektualnykh agentov s pomoschju algoritma DRQN, kotorye smogut igrat v Doom †S pomoschju DDPG nauchite agentov igrat v Lunar Lander †Otpravite agenta na avtogonki, ispolzuja metod DQN
"synopsis" may belong to another edition of this title.
(No Available Copies)
Search Books: Create a WantCan't find the book you're looking for? We'll keep searching for you. If one of our booksellers adds it to AbeBooks, we'll let you know!
Create a Want