π CUPED ΠΊΠ°ΠΊ ΠΌΠ΅ΡΠΎΠ΄ ΡΠΎΠΊΡΠ°ΡΠ΅Π½ΠΈΡ Π΄ΠΈΡΠΏΠ΅ΡΡΠΈΠΈ Π΄Π»Ρ ΠΏΡΠΎΠ²Π΅Π΄Π΅Π½ΠΈΡ A/B ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΠΎΠ².
π€ ΠΡΠ΅ΠΌ ΠΏΡΠΈΠ²Π΅Ρ! Π ΡΡΠΎΠΌ ΠΏΠΎΡΡΠ΅ Ρ
ΠΎΡΡ ΡΠ°ΡΡΠΊΠ°Π·Π°ΡΡ ΠΎ ΡΠΎΠΌ ΡΡΠΎ ΡΠ°ΠΊΠΎΠ΅ CUPED, Π·Π°ΡΠ΅ΠΌ ΠΎΠ½ Π½ΡΠΆΠ΅Π½?
π€© CUPED (Controlled-experiment Using Pre-Experiment Data) - ΠΎΠ΄ΠΈΠ½ ΠΈΠ· ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ² ΡΠΎΠΊΡΠ°ΡΠ΅Π½ΠΈΡ Π΄ΠΈΡΠΏΠ΅ΡΡΠΈΠΈ ΠΏΡΠΈ ΠΏΡΠΎΠ²Π΅Π΄Π΅Π½ΠΈΠΈ ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΠΎΠ², ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌΡΠΉ Π² ΠΈΠ½Π΄ΡΡΡΡΠΈΠΈ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ Π΄Π°Π½Π½ΡΡ
ΠΏΡΠ΅Π΄ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΠ°Π»ΡΠ½ΠΎΠ³ΠΎ ΠΏΠ΅ΡΠΈΠΎΠ΄Π°. ΠΠ±ΡΡΠ½ΠΎ ΠΌΠ΅ΡΡΠΈΠΊΡ, ΠΊΠΎΡΠΎΡΠ°Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΡΡΡ Π΄ΠΎ ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΠ°, Π½Π°Π·ΡΠ²Π°Π΅ΡΡΡ ΠΊΠΎΠ²Π°ΡΠΈΠ°ΡΠΎΠΉ.
π¨ ΠΡΠ΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, ΠΌΡ Π΄ΠΈΠ·Π°ΠΉΠ½ΠΈΠΌ ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½Ρ, ΡΠ°ΡΡΡΠΈΡΡΠ²Π°Π΅ΠΌ MDE (Minimum Detectable Effect) ΠΈ Sample Size (Π½Π΅ΠΎΠ±Ρ
ΠΎΠ΄ΠΈΠΌΡΠΉ ΡΠ°Π·ΠΌΠ΅Ρ Π²ΡΠ±ΠΎΡΠΊΠΈ Π΄Π»Ρ ΠΏΡΠΎΠ²Π΅Π΄Π΅Π½ΠΈΡ A/B ΡΠ΅ΡΡΠ°). Π Π°ΡΡΠΌΠΎΡΡΠΈΠΌ ΡΡΠ°Π½Π΄Π°ΡΡΠ½ΡΡ ΡΠΎΡΠΌΡΠ»Ρ Π΄Π»Ρ Π½Π°Ρ
ΠΎΠΆΠ΄Π΅Π½ΠΈΡ MDE ΠΏΠΎΠ΄ΡΠΎΠ±Π½Π΅ΠΉ:
πΊ ΠΠ±ΡΡΠ½ΠΎ Π² ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΠ°Ρ
ΠΌΡ ΠΌΠΎΠΆΠ΅ΠΌ Π²Π»ΠΈΡΡΡ Π½Π° ΡΠ°Π·ΠΌΠ΅Ρ Π²ΡΠ±ΠΎΡΠΊΠΈ (ΠΏΠΎ ΡΡΡΠΈ Π΄Π»ΠΈΡΠ΅Π»ΡΠ½ΠΎΡΡΡ ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΠ° ΠΈ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΡΡΠ°ΡΠΈΠΊΠ° ΠΈ Π΄ΠΈΡΠΏΠ΅ΡΡΠΈΡ ΠΌΠ΅ΡΡΠΈΠΊΠΈ).
π΄ ΠΡΡΡΠ΄Π° Π΄Π²Π° Π²ΠΎΠΏΡΠΎΡΠ°:
Π°) ΠΠΎΠΆΠ΅ΠΌ Π»ΠΈ ΠΌΡ Π½Π°Π³Π΅Π½Π΅ΡΠΈΡΡ ΡΡΠΎΠ»ΡΠΊΠΎ ΡΡΠ°ΡΠΈΠΊΠ°, ΡΡΠΎΠ±Ρ MDE ΡΡΠ°Π»ΠΎ Π΄ΠΎΠΏΡΡΡΠΈΠΌΡΠΌ ΠΏΡΠΈ Π²ΡΠ±ΠΎΡΠ΅ ΠΎΠΏΡΠ΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΉ ΠΌΠ΅ΡΡΠΈΠΊΠΈ?
Π±) ΠΠΎΠΆΠ΅ΠΌ Π»ΠΈ ΠΌΡ ΡΡΠΎ-ΡΠΎ ΡΠ΄Π΅Π»Π°ΡΡ Ρ ΡΠ΅Π»Π΅Π²ΠΎΠΉ ΠΌΠ΅ΡΡΠΈΠΊΠΎΠΉ ΠΈ ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΡΡΡΠ΅ΠΉ Π΄ΠΈΡΠΏΠ΅ΡΡΠΈΠ΅ΠΉ, ΡΡΠΎΠ±Ρ ΡΠΎΠΊΡΠ°ΡΠΈΡΡ MDE?
πΏ Π ΠΊ ΡΠ΅ΠΌΡ Π²ΠΎΠΎΠ±ΡΠ΅ ΡΠΎΠΊΡΠ°ΡΠ°ΡΡ MDE? ΠΠ»Ρ ΡΠΎΠ³ΠΎ ΡΡΠΎΠ±Ρ Π΄Π΅ΡΠ΅ΠΊΡΠΈΡΠΎΠ²Π°ΡΡ Π±ΠΎΠ»ΡΡΠ΅Π΅ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΠΏΡΠΎΠΊΡΠ°ΡΠΈΠ²Π°Π΅ΠΌΡΡ
ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΠΎΠ² ΠΈ ΡΠΎΠΊΡΠ°ΡΠ°ΡΡ Π²ΡΠ΅ΠΌΡ Π΄Π»Ρ ΠΏΡΠΎΠ²Π΅Π΄Π΅Π½ΠΈΡ ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΠΎΠ².
ΠΡΠ°ΠΊ, ΠΊ CUPED. ΠΠ°Π½ΠΎΠ½ΠΈΡΠ΅ΡΠΊΠΈΠΉ Π²ΠΈΠ΄:
π ΠΠ°Π²Π°ΠΉΡΠ΅ ΡΠ°ΡΡΠΌΠΎΡΡΠΈΠΌ ΠΌΠ°ΡΠΎΠΆΠΈΠ΄Π°Π½ΠΈΠ΅ Ycuped
π€Έ ΠΡΠ°Π»Ρ, ΠΎΡΠ΅Π½ΠΊΠ° ΠΏΠΎΠ»ΡΡΠ°Π΅ΡΡΡ Π½Π΅ΡΠΌΠ΅ΡΠ΅Π½Π½ΠΎΠΉ, ΡΠΎ Π΅ΡΡΡ Π±Π»Π°Π³ΠΎΠ΄Π°ΡΡ ΠΏΠΎΠΏΡΠ°Π²ΠΊΠ΅ Π½Π° ΡΡΠ΅Π΄Π½Π΅Π΅ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ ΠΊΠΎΠ²Π°ΡΠΈΠ°ΡΡ ΠΌΡ ΠΏΠΎΠ»ΡΡΠΈΠ»ΠΈ ΡΠ°ΠΊΠΎΠ΅ ΠΆΠ΅ ΠΌΠ°ΡΠΎΠΆΠΈΠ΄Π°Π½ΠΈΠ΅.
π¨ Π ΡΡΠΎ Ρ Π΄ΠΈΡΠΏΠ΅ΡΡΠΈΠ΅ΠΉ? ΠΠ°ΠΌ Π²Π΅Π΄Ρ Π½ΡΠΆΠ½ΠΎ ΠΏΠΎΠ½ΡΡΡ, ΠΊΠ°ΠΊ ΡΡΠΎ ΠΏΠΎΠ²Π»ΠΈΡΠ΅Ρ Π½Π° MDE ΠΏΡΠΈ Π΄ΠΈΠ·Π°ΠΉΠ½Π΅ ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΠ°
π«‘ ΠΠ°ΠΌ Π½ΡΠΆΠ½ΠΎ ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·ΠΈΡΠΎΠ²Π°ΡΡ Π΄ΠΈΡΠΏΠ΅ΡΡΠΈΡ. Π Π΅ΡΠΈΠΌ ΠΎΡΠ½ΠΎΡΠΈΡΠ΅Π»ΡΠ½ΠΎ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠ° theta, ΠΌΠΎΠΆΠ½ΠΎ Π²Π·ΡΡΡ ΠΏΡΠΎΠΈΠ·Π²ΠΎΠ΄Π½ΡΡ, ΠΈΠ»ΠΈ ΠΏΠΎΡΠΌΠΎΡΡΠ΅ΡΡ Π½Π° Π²Π΅ΡΡΠΈΠ½Ρ ΠΏΠ°ΡΠ°Π±ΠΎΠ»Ρ.
ΠΠ±ΡΠ°ΡΠ½Π°Ρ Π·Π°ΠΌΠ΅Π½Π°:
π ΠΠ°ΡΠ»ΠΈ ΡΠΎΡΠΊΡ, Π² ΠΊΠΎΡΠΎΡΠΎΠΉ Π΄ΠΈΡΠΏΠ΅ΡΡΠΈΡ Π΄ΠΎΡΡΠΈΠ³Π°Π΅Ρ ΠΌΠΈΠ½ΠΈΠΌΡΠΌΠ° (Π²Π΅ΡΡΠΈΠ½Π° ΠΏΠ°ΡΠ°Π±ΠΎΠ»Ρ). ΠΡΠ²Π΅Π»ΠΈ ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΡΡΡΠΈΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ theta.
π Π§Π΅ΠΌ Π±ΠΎΠ»ΡΡΠ΅ ΠΊΠΎΠ²Π°ΡΠΈΠ°ΡΠΈΡ, ΡΠ΅ΠΌ Π±ΠΎΠ»ΡΡΠ΅ Π»ΠΈΠ½Π΅ΠΉΠ½Π°Ρ ΡΠ²ΡΠ·Ρ ΠΌΠ΅ΠΆΠ΄Ρ Π΄Π²ΡΠΌΡ ΡΠ»ΡΡΠ°ΠΉΠ½ΡΠΌΠΈ Π²Π΅Π»ΠΈΡΠΈΠ½Π°ΠΌΠΈ, ΠΏΠΎΡΡΠΎΠΌΡ ΠΎΠ±ΡΡΠ½ΠΎ ΠΈ Π±Π΅ΡΡΡ ΠΌΠ΅ΡΡΠΈΠΊΠΈ Π΄ΠΎ ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΠ°, ΠΊΠΎΡΠΎΡΡΠ΅ ΡΠΈΠ»ΡΠ½ΠΎ ΠΊΠΎΡΡΠ΅Π»ΠΈΡΡΡΡ Π΄ΡΡΠ³ Ρ Π΄ΡΡΠ³ΠΎΠΌ (ΡΡΠ° ΠΆΠ΅ ΠΌΠ΅ΡΡΠΈΠΊΠ° Π² ΠΏΡΠ΅Π΄ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΠ°Π»ΡΠ½ΠΎΠΌ ΠΏΠ΅ΡΠΈΠΎΠ΄Π΅).
π«΄ ΠΠ° ΠΏΡΠ°ΠΊΡΠΈΠΊΠ΅ Π²ΡΠ±ΠΎΡ ΡΠΈΠ»ΡΠ½ΠΎ ΠΊΠΎΡΡΠ΅Π»ΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠΉ ΠΌΠ΅ΡΡΠΈΠΊΠΈ Π² ΠΏΡΠ΅Π΄ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΠ°Π»ΡΠ½ΠΎΠΌ ΠΏΠ΅ΡΠΈΠΎΠ΄Π΅ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΡΠΎΠΊΡΠ°ΡΠΈΡΡ Π΄ΠΈΡΠΏΠ΅ΡΡΠΈΡ Π² Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ ΡΠ°Π·, ΡΡΠΎ ΠΏΡΠΈΠ²ΠΎΠ΄ΠΈΡ ΠΊ ΡΠ²Π΅Π»ΠΈΡΠ΅Π½ΠΈΡ ΡΡΠ²ΡΡΠ²ΠΈΡΠ΅Π»ΡΠ½ΠΎΡΡΠΈ ΡΠ΅ΡΡΠ°.
π± ΠΠ! Π΅ΡΡΡ ΠΎΠ³ΡΠ°Π½ΠΈΡΠ΅Π½ΠΈΡ, ΠΊΠΎΡΠΎΡΡΠ΅ ΡΠ°ΠΊΠΆΠ΅ Ρ ΠΎΠΏΠΈΡΡ Π² ΡΠ»Π΅Π΄ΡΡΡΠΈΡ
ΠΏΠΎΡΡΠ°Ρ
.
β¨οΈ Π ΠΊΠ°ΠΊΠΈΠ΅ ΡΠΏΠΎΡΠΎΠ±Ρ ΡΠ½ΠΈΠΆΠ΅Π½ΠΈΡ Π΄ΠΈΡΠΏΠ΅ΡΡΠΈΠΈ Π·Π½Π°Π΅ΡΠ΅ Π²Ρ? ΠΠΈΡΠΈΡΠ΅ Π² ΠΊΠΎΠΌΠΌΠ΅Π½ΡΠ°ΡΠΈΡΡ
, ΡΡΠ°Π²ΡΡΠ΅ ΡΠ΅Π°ΠΊΡΠΈΠΈ. Π‘Π»Π΅Π΄ΡΡΡΠ°Ρ ΡΠ°ΡΡΡ Π½Π΅ Π·Π°ΡΡΠ°Π²ΠΈΡ ΡΠ΅Π±Ρ Π΄ΠΎΠ»Π³ΠΎ ΠΆΠ΄Π°ΡΡ π
#Π°Π±
MDE = (F(1-alpha / 2) + F(1 - beta)) * sqrt(Var(X)) / sqrt(sample_size)
F(1-alpha / 2) - ΠΊΠ²Π°Π½ΡΠΈΠ»ΡΠ½Π°Ρ ΡΡΠ½ΠΊΡΠΈΡ Π΄Π»Ρ 1 - ΠΎΡΠΈΠ±ΠΊΠΈ ΠΏΠ΅ΡΠ²ΠΎΠ³ΠΎ ΡΠΎΠ΄Π° (Π΄Π²ΡΡΡΠΎΡΠΎΠ½Π½ΡΡ Π³ΠΈΠΏΠΎΡΠ΅Π·Π°) aka ΠΊΡΠΈΡΠΈΡΠ΅ΡΠΊΠΎΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ Π΄Π»Ρ H0
F(1 - beta) - ΠΊΠ²Π°Π½ΡΠΈΠ»ΡΠ½Π°Ρ ΡΡΠ½ΠΊΡΠΈΡ Π΄Π»Ρ ΠΌΠΎΡΠ½ΠΎΡΡΠΈ
Var(X) - Π΄ΠΈΡΠΏΠ΅ΡΡΠΈΡ ΠΌΠ΅ΡΡΠΈΠΊΠΈ
sample_size - ΡΠ°Π·ΠΌΠ΅Ρ Π²ΡΠ±ΠΎΡΠΊΠΈ (ΠΎΠ±ΡΡΠ½ΠΎ ΡΠ°ΡΡΡΠΈΡΡΠ²Π°Π΅ΡΡΡ Π½Π° ΠΎΡΠ½ΠΎΠ²Π΅ ΡΡΠ°ΡΠΈΠΊΠ°, ΡΠ΅Π»Π΅Π²ΡΡ Π΄Π΅ΠΉΡΡΠ²ΠΈΠΉ)
Π°) ΠΠΎΠΆΠ΅ΠΌ Π»ΠΈ ΠΌΡ Π½Π°Π³Π΅Π½Π΅ΡΠΈΡΡ ΡΡΠΎΠ»ΡΠΊΠΎ ΡΡΠ°ΡΠΈΠΊΠ°, ΡΡΠΎΠ±Ρ MDE ΡΡΠ°Π»ΠΎ Π΄ΠΎΠΏΡΡΡΠΈΠΌΡΠΌ ΠΏΡΠΈ Π²ΡΠ±ΠΎΡΠ΅ ΠΎΠΏΡΠ΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΉ ΠΌΠ΅ΡΡΠΈΠΊΠΈ?
Π±) ΠΠΎΠΆΠ΅ΠΌ Π»ΠΈ ΠΌΡ ΡΡΠΎ-ΡΠΎ ΡΠ΄Π΅Π»Π°ΡΡ Ρ ΡΠ΅Π»Π΅Π²ΠΎΠΉ ΠΌΠ΅ΡΡΠΈΠΊΠΎΠΉ ΠΈ ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΡΡΡΠ΅ΠΉ Π΄ΠΈΡΠΏΠ΅ΡΡΠΈΠ΅ΠΉ, ΡΡΠΎΠ±Ρ ΡΠΎΠΊΡΠ°ΡΠΈΡΡ MDE?
ΠΡΠ°ΠΊ, ΠΊ CUPED. ΠΠ°Π½ΠΎΠ½ΠΈΡΠ΅ΡΠΊΠΈΠΉ Π²ΠΈΠ΄:
Ycuped = Y - theta * (X - Xmean)
Ycuped - ΠΌΠΎΠ΄ΠΈΡΠΈΡΠΈΡΠΎΠ²Π°Π½Π½Π°Ρ ΠΌΠ΅ΡΡΠΈΠΊΠ° CUPED
theta = Π½Π΅ΠΊΠΈΠΉ ΠΊΠΎΡΡΡΠΈΡΠΈΠ΅Π½Ρ, ΠΏΡΠΎ ΠΊΠΎΡΠΎΡΡΠΉ Ρ Π½Π°ΠΏΠΈΡΡ Π½ΠΈΠΆΠ΅
X - Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ ΠΊΠΎΠ²Π°ΡΠΈΠ°ΡΡ Π² ΠΏΡΠ΅Π΄ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΠ°Π»ΡΠ½ΠΎΠΌ ΠΏΠ΅ΡΠΈΠΎΠ΄Π΅
Xmean - ΡΡΠ΅Π΄Π½Π΅Π΅ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ ΠΊΠΎΠ²Π°ΡΠΈΠ°ΡΡ Π² ΠΏΡΠ΅Π΄ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΠ°Π»ΡΠ½ΠΎΠΌ ΠΏΠ΅ΡΠΈΠΎΠ΄Π΅
E(Ycuped) = E(Y) - E(theta * X) + E(theta * Xmean) = E(Y) - theta * E(X) + theta * E(Xmean) = E(Y) - theta * E(X) + theta * E(X) = E(Y)
ΠΡΠΎΠ²Π΅Π΄Π΅ΠΌ Π·Π°ΠΌΠ΅Π½Ρ X - Xmean = k
Var(Ycuped) = Var(Y - theta * (X - Xmean))
Var(Ycuped) = Var(Y - theta * k) = Var(Y) - 2 * cov(Y, theta * k) + Var(theta * k) = Var(Y) - 2 * theta * cov(Y, k) + theta^2 * Var(k) = theta^2 * Var(k) - 2 * theta * cov(Y,K) + Var(Y)
theta (Π²Π΅ΡΡΠΈΠ½Π°) = - b / 2a = 2 * cov(Y,k) / 2 * Var(K) = cov(Y,k) / Var(k).
ΠΠ±ΡΠ°ΡΠ½Π°Ρ Π·Π°ΠΌΠ΅Π½Π°:
theta (Π²Π΅ΡΡΠΈΠ½Π°) = cov(Y, (X - Xmean)) / Var(X - Xmean) = cov(Y, X) / Var(X)
#Π°Π±