Истина в вине?



Как связаны вино и анализ данных: реальный кейс



Речь идет о вине из провинции Бордо, где производители столкнулись с проблемами:



- цена и качество вина могут сильно меняться из года в год



- необходимо знать, сколько будет стоить вино через 10, 20, 30 лет, чтобы решить, хранить его или продать сейчас



- кто умеет лучше предсказывать будущую цену вина - тот может лучше заработать



Как можно узнать будущую цену вина?

Точно никак. Разве что только с помощью машины времени.



Как решали эту задачу ранее?



Приглашался очень высокооплачиваемый эксперт по вину, который пробовал вино, смотрел на свет и говорил: "Это вино через 20 лет будет очень дорогим" или "Это вино будет так себе, продайте его сейчас". И это работало годами.



Но в 1990 году профессор Орли Ашенфелтер написал: "Я могу предсказать будущую цену вина, не пробуя его и не смотря на него".



Но как это возможно?



Ашенфелтер использовал простую модель - линейную регрессию и с ее помощью научился прогнозировать будущую цену вина.



Линейная регрессия (Linear regression) — модель зависимости переменной x от одной или нескольких других переменных (факторов, регрессоров, независимых переменных) с линейной функцией зависимости.



В свою модель он взял зависимость цены от погоды (температура, количество дождей в год урожая), а также возраста вина.



Сейчас подобные модели делают повсеместно, но тогда это было огромным прорывом.



———————————————————————————-



Полностью статью ученого можно почитать по запросу: Predicting the Quality and Prices of Bordeaux Wine



А кейс подсмотрела у Игоря Клейнера (Ph.D.)



#кейсы