πŸ“šDeep Reinforcement Learning in Action (2020)



βœοΈΠΠ²Ρ‚ΠΎΡ€: Alexander Zai, Brandon Brown



πŸ“ƒΠ‘Ρ‚Ρ€Π°Π½ΠΈΡ†: 383



Π“Π»ΡƒΠ±ΠΎΠΊΠΎΠ΅ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ с ΠΏΠΎΠ΄ΠΊΡ€Π΅ΠΏΠ»Π΅Π½ΠΈΠ΅ΠΌ Π² дСйствии Π½Π°ΡƒΡ‡ΠΈΡ‚ вас ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π°Π³Π΅Π½Ρ‚ΠΎΠ² искусствСнного ΠΈΠ½Ρ‚Π΅Π»Π»Π΅ΠΊΡ‚Π°, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π°Π΄Π°ΠΏΡ‚ΠΈΡ€ΡƒΡŽΡ‚ΡΡ ΠΈ ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½ΡΡ‚Π²ΡƒΡŽΡ‚ΡΡ Π½Π° основС прямой ΠΎΠ±Ρ€Π°Ρ‚Π½ΠΎΠΉ связи с ΠΎΠΊΡ€ΡƒΠΆΠ°ΡŽΡ‰Π΅ΠΉ срСдой. Π’ этом ΡƒΡ‡Π΅Π±Π½ΠΎΠΌ пособии, Π±ΠΎΠ³Π°Ρ‚ΠΎΠΌ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°ΠΌΠΈ, Π²Ρ‹ освоитС Π±Π°Π·ΠΎΠ²Ρ‹Π΅ ΠΈ ΠΏΡ€ΠΎΠ΄Π²ΠΈΠ½ΡƒΡ‚Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ DRL, Ρ€Π΅ΡˆΠ°Ρ интСрСсныС Π·Π°Π΄Π°Ρ‡ΠΈ, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ навигация ΠΏΠΎ Π»Π°Π±ΠΈΡ€ΠΈΠ½Ρ‚Ρƒ ΠΈ Π²ΠΈΠ΄Π΅ΠΎΠΈΠ³Ρ€Ρ‹. ΠŸΠΎΠΏΡƒΡ‚Π½ΠΎ Π²Ρ‹ Π±ΡƒΠ΄Π΅Ρ‚Π΅ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ с основными Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌΠΈ, Π²ΠΊΠ»ΡŽΡ‡Π°Ρ Π³Π»ΡƒΠ±ΠΎΠΊΠΈΠ΅ Q-сСти ΠΈ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Ρ‹ ΠΏΠΎΠ»ΠΈΡ‚ΠΈΠΊ, Π° Ρ‚Π°ΠΊΠΆΠ΅ с Ρ‚Π°ΠΊΠΈΠΌΠΈ стандартными отраслСвыми инструмСнтами, ΠΊΠ°ΠΊ PyTorch ΠΈ OpenAI Gym.



Бсылка Π½Π° ΠΊΠ½ΠΈΠ³Ρƒ