πŸ†Ž CUPED ΠΊΠ°ΠΊ ΠΌΠ΅Ρ‚ΠΎΠ΄ сокращСния диспСрсии для провСдСния A/B экспСримСнтов.



🀭 ВсСм ΠΏΡ€ΠΈΠ²Π΅Ρ‚! Π’ этом постС Ρ…ΠΎΡ‡Ρƒ Ρ€Π°ΡΡΠΊΠ°Π·Π°Ρ‚ΡŒ ΠΎ Ρ‚ΠΎΠΌ Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ CUPED, Π·Π°Ρ‡Π΅ΠΌ ΠΎΠ½ Π½ΡƒΠΆΠ΅Π½?



🀩 CUPED (Controlled-experiment Using Pre-Experiment Data) - ΠΎΠ΄ΠΈΠ½ ΠΈΠ· ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² сокращСния диспСрсии ΠΏΡ€ΠΈ ΠΏΡ€ΠΎΠ²Π΅Π΄Π΅Π½ΠΈΠΈ экспСримСнтов, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹ΠΉ Π² индустрии Π½Π° основС Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΡ€Π΅Π΄ΡΠΊΡΠΏΠ΅Ρ€ΠΈΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΏΠ΅Ρ€ΠΈΠΎΠ΄Π°. ΠžΠ±Ρ‹Ρ‡Π½ΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ, которая ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Π΄ΠΎ экспСримСнта, называСтся ΠΊΠΎΠ²Π°Ρ€ΠΈΠ°Ρ‚ΠΎΠΉ.



πŸ”¨ ΠŸΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, ΠΌΡ‹ Π΄ΠΈΠ·Π°ΠΉΠ½ΠΈΠΌ экспСримСнт, рассчитываСм MDE (Minimum Detectable Effect) ΠΈ Sample Size (Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΡ‹ΠΉ Ρ€Π°Π·ΠΌΠ΅Ρ€ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ для провСдСния A/B тСста). Рассмотрим ΡΡ‚Π°Π½Π΄Π°Ρ€Ρ‚Π½ΡƒΡŽ Ρ„ΠΎΡ€ΠΌΡƒΠ»Ρƒ для нахоТдСния MDE ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½Π΅ΠΉ:



MDE = (F(1-alpha / 2) + F(1 - beta)) * sqrt(Var(X)) / sqrt(sample_size)



F(1-alpha / 2) - ΠΊΠ²Π°Π½Ρ‚ΠΈΠ»ΡŒΠ½Π°Ρ функция для 1 - ошибки ΠΏΠ΅Ρ€Π²ΠΎΠ³ΠΎ Ρ€ΠΎΠ΄Π° (двусторонняя Π³ΠΈΠΏΠΎΡ‚Π΅Π·Π°) aka критичСскоС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ для H0

F(1 - beta) - ΠΊΠ²Π°Π½Ρ‚ΠΈΠ»ΡŒΠ½Π°Ρ функция для мощности

Var(X) - диспСрсия ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ

sample_size - Ρ€Π°Π·ΠΌΠ΅Ρ€ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ (ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ рассчитываСтся Π½Π° основС Ρ‚Ρ€Π°Ρ„ΠΈΠΊΠ°, Ρ†Π΅Π»Π΅Π²Ρ‹Ρ… дСйствий)



πŸ•Ί ΠžΠ±Ρ‹Ρ‡Π½ΠΎ Π² экспСримСнтах ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ Π²Π»ΠΈΡΡ‚ΡŒ Π½Π° Ρ€Π°Π·ΠΌΠ΅Ρ€ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ (ΠΏΠΎ сути Π΄Π»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ экспСримСнта ΠΈ количСство Ρ‚Ρ€Π°Ρ„ΠΈΠΊΠ° ΠΈ Π΄ΠΈΡΠΏΠ΅Ρ€ΡΠΈΡŽ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ).



🍴 ΠžΡ‚ΡΡŽΠ΄Π° Π΄Π²Π° вопроса:



Π°) МоТСм Π»ΠΈ ΠΌΡ‹ Π½Π°Π³Π΅Π½Π΅Ρ€ΠΈΡ‚ΡŒ ΡΡ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ‚Ρ€Π°Ρ„ΠΈΠΊΠ°, Ρ‡Ρ‚ΠΎΠ±Ρ‹ MDE стало допсутимым ΠΏΡ€ΠΈ Π²Ρ‹Π±ΠΎΡ€Π΅ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΉ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ?



Π±) МоТСм Π»ΠΈ ΠΌΡ‹ Ρ‡Ρ‚ΠΎ-Ρ‚ΠΎ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ с Ρ†Π΅Π»Π΅Π²ΠΎΠΉ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΎΠΉ ΠΈ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰Π΅ΠΉ диспСрсиСй, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΠΎΠΊΡ€Π°Ρ‚ΠΈΡ‚ΡŒ MDE?



🍿 А ΠΊ Ρ‡Π΅ΠΌΡƒ Π²ΠΎΠΎΠ±Ρ‰Π΅ ΡΠΎΠΊΡ€Π°Ρ‰Π°Ρ‚ΡŒ MDE? Для Ρ‚ΠΎΠ³ΠΎ Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π΄Π΅Ρ‚Π΅ΠΊΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ большСС количСство ΠΏΡ€ΠΎΠΊΡ€Π°ΡˆΠΈΠ²Π°Π΅ΠΌΡ‹Ρ… экспСримСнтов ΠΈ ΡΠΎΠΊΡ€Π°Ρ‰Π°Ρ‚ΡŒ врСмя для провСдСния экспСримСнтов.



Π˜Ρ‚Π°ΠΊ, ΠΊ CUPED. ΠšΠ°Π½ΠΎΠ½ΠΈΡ‡Π΅ΡΠΊΠΈΠΉ Π²ΠΈΠ΄:





Ycuped = Y - theta * (X - Xmean)



Ycuped - модифицированная ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° CUPED

theta = Π½Π΅ΠΊΠΈΠΉ коэффициСнт, ΠΏΡ€ΠΎ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ я Π½Π°ΠΏΠΈΡˆΡƒ Π½ΠΈΠΆΠ΅

X - Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΊΠΎΠ²Π°Ρ€ΠΈΠ°Ρ‚Ρ‹ Π² ΠΏΡ€Π΅Π΄ΡΠΊΡΠΏΠ΅Ρ€ΠΈΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΌ ΠΏΠ΅Ρ€ΠΈΠΎΠ΄Π΅

Xmean - срСднСС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΊΠΎΠ²Π°Ρ€ΠΈΠ°Ρ‚Ρ‹ Π² ΠΏΡ€Π΅Π΄ΡΠΊΡΠΏΠ΅Ρ€ΠΈΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΌ ΠΏΠ΅Ρ€ΠΈΠΎΠ΄Π΅



😐 Π”Π°Π²Π°ΠΉΡ‚Π΅ рассмотрим ΠΌΠ°Ρ‚ΠΎΠΆΠΈΠ΄Π°Π½ΠΈΠ΅ Ycuped





E(Ycuped) = E(Y) - E(theta * X) + E(theta * Xmean) = E(Y) - theta * E(X) + theta * E(Xmean) = E(Y) - theta * E(X) + theta * E(X) = E(Y)



🀸 Вуаля, ΠΎΡ†Π΅Π½ΠΊΠ° получаСтся нСсмСщСнной, Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ благодаря ΠΏΠΎΠΏΡ€Π°Π²ΠΊΠ΅ Π½Π° срСднСС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΊΠΎΠ²Π°Ρ€ΠΈΠ°Ρ‚Ρ‹ ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ»ΠΈ Ρ‚Π°ΠΊΠΎΠ΅ ΠΆΠ΅ ΠΌΠ°Ρ‚ΠΎΠΆΠΈΠ΄Π°Π½ΠΈΠ΅.



😨 А Ρ‡Ρ‚ΠΎ с диспСрсиСй? Нам вСдь Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΡΡ‚ΡŒ, ΠΊΠ°ΠΊ это повлияСт Π½Π° MDE ΠΏΡ€ΠΈ Π΄ΠΈΠ·Π°ΠΉΠ½Π΅ экспСримСнта





Var(Ycuped) = Var(Y - theta * (X - Xmean))



ΠŸΡ€ΠΎΠ²Π΅Π΄Π΅ΠΌ Π·Π°ΠΌΠ΅Π½Ρƒ X - Xmean = k





Var(Ycuped) = Var(Y - theta * k) = Var(Y) - 2 * cov(Y, theta * k) + Var(theta * k) = Var(Y) - 2 * theta * cov(Y, k) + theta^2 * Var(k) = theta^2 * Var(k) - 2 * theta * cov(Y,K) + Var(Y)



🫑 Нам Π½ΡƒΠΆΠ½ΠΎ ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π΄ΠΈΡΠΏΠ΅Ρ€ΡΠΈΡŽ. РСшим ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π° theta, ΠΌΠΎΠΆΠ½ΠΎ Π²Π·ΡΡ‚ΡŒ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄Π½ΡƒΡŽ, ΠΈΠ»ΠΈ ΠΏΠΎΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Π½Π° Π²Π΅Ρ€ΡˆΠΈΠ½Ρƒ ΠΏΠ°Ρ€Π°Π±ΠΎΠ»Ρ‹.



theta (Π²Π΅Ρ€ΡˆΠΈΠ½Π°) = - b / 2a = 2 * cov(Y,k) / 2 * Var(K) = cov(Y,k) / Var(k).




ΠžΠ±Ρ€Π°Ρ‚Π½Π°Ρ Π·Π°ΠΌΠ΅Π½Π°:



theta (Π²Π΅Ρ€ΡˆΠΈΠ½Π°) = cov(Y, (X - Xmean)) / Var(X - Xmean) = cov(Y, X) / Var(X)




🚘 Нашли Ρ‚ΠΎΡ‡ΠΊΡƒ, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ диспСрсия достигаСт ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌΠ° (Π²Π΅Ρ€ΡˆΠΈΠ½Π° ΠΏΠ°Ρ€Π°Π±ΠΎΠ»Ρ‹). Π’Ρ‹Π²Π΅Π»ΠΈ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ theta.



😏 Π§Π΅ΠΌ большС ковариация, Ρ‚Π΅ΠΌ большС линСйная связь ΠΌΠ΅ΠΆΠ΄Ρƒ двумя случайными Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Π°ΠΌΠΈ, поэтому ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ ΠΈ Π±Π΅Ρ€ΡƒΡ‚ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ Π΄ΠΎ экспСримСнта, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ сильно ΠΊΠΎΡ€Ρ€Π΅Π»ΠΈΡ€ΡƒΡŽΡ‚ Π΄Ρ€ΡƒΠ³ с Π΄Ρ€ΡƒΠ³ΠΎΠΌ (эта ΠΆΠ΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° Π² ΠΏΡ€Π΅Π΄ΡΠΊΡΠΏΠ΅Ρ€ΠΈΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΌ ΠΏΠ΅Ρ€ΠΈΠΎΠ΄Π΅).



🫴 На ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ Π²Ρ‹Π±ΠΎΡ€ сильно ΠΊΠΎΡ€Ρ€Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠΉ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ Π² ΠΏΡ€Π΅Π΄ΡΠΊΡΠΏΠ΅Ρ€ΠΈΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΌ ΠΏΠ΅Ρ€ΠΈΠΎΠ΄Π΅ позволяСт ΡΠΎΠΊΡ€Π°Ρ‚ΠΈΡ‚ΡŒ Π΄ΠΈΡΠΏΠ΅Ρ€ΡΠΈΡŽ Π² нСсколько Ρ€Π°Π·, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ ΠΊ ΡƒΠ²Π΅Π»ΠΈΡ‡Π΅Π½ΠΈΡŽ Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ тСста.



😱 НО! Π΅ΡΡ‚ΡŒ ограничСния, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ‚Π°ΠΊΠΆΠ΅ я ΠΎΠΏΠΈΡˆΡƒ Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… постах.



⌨️ А ΠΊΠ°ΠΊΠΈΠ΅ способы сниТСния диспСрсии Π·Π½Π°Π΅Ρ‚Π΅ Π²Ρ‹? ΠŸΠΈΡˆΠΈΡ‚Π΅ Π² коммСнтариях, ΡΡ‚Π°Π²ΡŒΡ‚Π΅ Ρ€Π΅Π°ΠΊΡ†ΠΈΠΈ. Π‘Π»Π΅Π΄ΡƒΡŽΡ‰Π°Ρ Ρ‡Π°ΡΡ‚ΡŒ Π½Π΅ заставит сСбя Π΄ΠΎΠ»Π³ΠΎ ΠΆΠ΄Π°Ρ‚ΡŒ πŸ˜€



#Π°Π±