Люди могут выполнять множество сложных задач, опираясь на навыки, приобретенные в результате предыдущего опыта.



В данной работе этот подход мультиплицируется несколько раз, чтобы впоследствии воспроизводить более сложное поведение.



Например, вести футбольный мяч или транспортировать объект до его целевого местоположения.



Вообще, каждый раз, когда я наблюдаю итерации обучения, у меня диким образом происходит всплеск эмпатии к неудачным промежуточным моделям. 🤖



https://youtu.be/-ryF7237gNo