- Ruský jazyk
Obuchenie s primeneniem podkrepleniq
Autor: Satqnaraqna S
Jeta kniga sostoit iz pqti razdelow, obespechiwaüschih celostnyj process obucheniq. Puteshestwie nachinaetsq s wwedeniq w banditskie algoritmy, izucheniq osnownyh koncepcij, takih kak werhnqq doweritel'naq granica (UCB) i algoritmy weroqtnogo priblizheniq... Viac o knihe
Na objednávku
26.73 €
bežná cena: 29.70 €
O knihe
Jeta kniga sostoit iz pqti razdelow, obespechiwaüschih celostnyj process obucheniq. Puteshestwie nachinaetsq s wwedeniq w banditskie algoritmy, izucheniq osnownyh koncepcij, takih kak werhnqq doweritel'naq granica (UCB) i algoritmy weroqtnogo priblizheniq k prawil'nym (PAC). Sleduüschij razdel predstawlqet polnuü strukturu Reinforcement Learning (RL), wyhodqschuü za ramki banditskih algoritmow i rassmatriwaüschuü wzaimodejstwie agenta i sredy na neskol'kih wremennyh shagah. Markowskie processy prinqtiq reshenij (MPP) rassmatriwaütsq kak fundamental'naq osnowa dlq modelirowaniq posledowatel'nyh zadach prinqtiq reshenij. V chetwertom razdele rassmatriwaütsq metody dinamicheskogo programmirowaniq, metody wremennyh raznostej (TD) i urawnenie optimal'nosti Bellmana w RL. Jeti koncepcii pozwolqüt agentam äffektiwno planirowat', obuchat'sq i optimizirowat' swoi dejstwiq. V zaklüchitel'nom razdele rassmatriwaütsq peredowye metody RL, takie kak trassirowka prigodnosti, approximaciq funkcij, metody naimen'shih kwadratow, Q-obuchenie s podgonkoj, glubokaq Q-set' (DQN) i algoritmy politicheskogo gradienta.
- Vydavateľstvo: Sciencia Scripts
- Rok vydania: 2023
- Formát: Paperback
- Rozmer: 220 x 150 mm
- Jazyk: Ruský jazyk
- ISBN: 9786206403388