Model-Based Reinforcement Learning: From Data to Continuous Actions with a Python-based Toolbox

Milad Farsi

2023



Обучение с подкреплением является одной из основных парадигм машинного обучения (ML), в которой интеллектуальный агент выполняет действия, обеспечивающие оптимальное поведение устройств. Хотя эта парадигма машинного обучения приобрела огромный успех и популярность в последние годы, предыдущие исследования были сосредоточены либо на теории - оптимальном управлении и динамическом программировании - либо на алгоритмах, большинство из которых основаны на моделировании.



🤓СКАЧАТЬ КНИГУ



#python #machinelearning #eng