Легко ли распараллелить обучение модели случайного леса? Как мы можем сделать это?



Да, например R предоставляет простой способ распараллелить обучение случайных лесов на больших данных. Используется параметр multicombine, для которого можно установить значение TRUE для распараллеливания вычислений случайного леса.



rf .multicombine=TRUE, .packages='randomForest') %dopar% {

randomForest(x, y, ntree=ntree)

}