Как провести валидацию временного ряда?



В этой ситуации нельзя пользоваться обычными способами валидации, так как данные упорядочены относительно моментов времени.



✔️Можно рассказать про кросс-валидацию на временных рядах. В этой процедуре мы используем тестовые множества, состоящие из одного-единственного наблюдения. Соответствующие им тренировочные множества состоят только из наблюдений, возникающих перед тестовым наблюдением. Никакие наблюдения «из будущего» тут применяться не могут. На диаграмме сверху синие точки — это наблюдения из тренировочного множества, а красные — из тестового.



Точность прогноза рассчитывается путём усреднения на тестовых множествах. Мы можем модифицировать подход, если нам нужно оценить модель, которая даёт прогнозы на четыре шага вперёд. Тогда в качестве тестовых множеств нужно взять наблюдения из более далёкого будущего.



#middle