Разъяснивший Python

Model-Based Reinforcement Learning: From Data to Continuous Actions with a Python-based Toolbox

Milad Farsi

2023

Обучение с подкреплением является одной из основных парадигм машинного обучения (ML), в которой интеллектуальный агент выполняет действия, обеспечивающие оптимальное поведение устройств. Хотя эта парадигма машинного обучения приобрела огромный успех и популярность в последние годы, предыдущие исследования были сосредоточены либо на теории - оптимальном управлении и динамическом программировании - либо на алгоритмах, большинство из которых основаны на моделировании.

🤓СКАЧАТЬ КНИГУ

#python #machinelearning #eng