Ruský jazyk

Obuchenie s primeneniem podkrepleniq

Vydavateľstvo: Sciencia Scripts
Rok vydania: 2023
Formát: Paperback
Rozmer: 220 x 150 mm
Jazyk: Ruský jazyk
ISBN: 9786206403388

Na objednávku

26.73 €

bežná cena: 29.70 €

O knihe

Jeta kniga sostoit iz pqti razdelow, obespechiwaüschih celostnyj process obucheniq. Puteshestwie nachinaetsq s wwedeniq w banditskie algoritmy, izucheniq osnownyh koncepcij, takih kak werhnqq doweritel'naq granica (UCB) i algoritmy weroqtnogo priblizheniq k prawil'nym (PAC). Sleduüschij razdel predstawlqet polnuü strukturu Reinforcement Learning (RL), wyhodqschuü za ramki banditskih algoritmow i rassmatriwaüschuü wzaimodejstwie agenta i sredy na neskol'kih wremennyh shagah. Markowskie processy prinqtiq reshenij (MPP) rassmatriwaütsq kak fundamental'naq osnowa dlq modelirowaniq posledowatel'nyh zadach prinqtiq reshenij. V chetwertom razdele rassmatriwaütsq metody dinamicheskogo programmirowaniq, metody wremennyh raznostej (TD) i urawnenie optimal'nosti Bellmana w RL. Jeti koncepcii pozwolqüt agentam äffektiwno planirowat', obuchat'sq i optimizirowat' swoi dejstwiq. V zaklüchitel'nom razdele rassmatriwaütsq peredowye metody RL, takie kak trassirowka prigodnosti, approximaciq funkcij, metody naimen'shih kwadratow, Q-obuchenie s podgonkoj, glubokaq Q-set' (DQN) i algoritmy politicheskogo gradienta.