π ROC ΠΈ AUC ΠΏΡΠΎΡΡΡΠΌΠΈ ΡΠ»ΠΎΠ²Π°ΠΌΠΈ.
ΠΠ»ΠΎΡΠ°Π΄Ρ ΠΏΠΎΠ΄ ROC-ΠΊΡΠΈΠ²ΠΎΠΉ β ΠΎΠ΄ΠΈΠ½ ΠΈΠ· ΡΠ°ΠΌΡΡ ΠΏΠΎΠΏΡΠ»ΡΡΠ½ΡΡ ΡΡΠ½ΠΊΡΠΈΠΎΠ½Π°Π»ΠΎΠ² ΠΊΠ°ΡΠ΅ΡΡΠ²Π° Π² Π·Π°Π΄Π°ΡΠ°Ρ Π±ΠΈΠ½Π°ΡΠ½ΠΎΠΉ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ. ΠΠ° ΠΌΠΎΠΉ Π²Π·Π³Π»ΡΠ΄, ΠΏΡΠΎΡΡΡΡ ΠΈ ΠΏΠΎΠ»Π½ΡΡ ΠΈΡΡΠΎΡΠ½ΠΈΠΊΠΎΠ² ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ Β«ΡΡΠΎ ΠΆΠ΅ ΡΡΠΎ ΡΠ°ΠΊΠΎΠ΅Β» Π½Π΅Ρ. ΠΠ°ΠΊ ΠΏΡΠ°Π²ΠΈΠ»ΠΎ, ΠΎΠ±ΡΡΡΠ½Π΅Π½ΠΈΠ΅ Π½Π°ΡΠΈΠ½Π°ΡΡ Ρ Π²Π²Π΅Π΄Π΅Π½ΠΈΡ ΡΠ°Π·Π½ΡΡ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ² (FPR, TPR), ΠΊΠΎΡΠΎΡΡΠ΅ Π½ΠΎΡΠΌΠ°Π»ΡΠ½ΡΠΉ ΡΠ΅Π»ΠΎΠ²Π΅ΠΊ ΡΡΡ ΠΆΠ΅ Π·Π°Π±ΡΠ²Π°Π΅Ρ. Π’Π°ΠΊΠΆΠ΅ Π½Π΅Ρ ΡΠ°Π·Π±ΠΎΡΠΎΠ² ΠΊΠ°ΠΊΠΈΡ -ΡΠΎ ΠΊΠΎΠ½ΠΊΡΠ΅ΡΠ½ΡΡ Π·Π°Π΄Π°Ρ ΠΏΠΎ AUC ROC. Π ΡΡΠΎΠΌ ΠΏΠΎΡΡΠ΅ ΠΎΠΏΠΈΡΠ°Π½ΠΎ, ΠΊΠ°ΠΊ Ρ ΠΎΠ±ΡΡΡΠ½ΡΡ ΡΡΡ ΡΠ΅ΠΌΡ ΡΡΡΠ΄Π΅Π½ΡΠ°ΠΌ ΠΈ ΡΠ²ΠΎΠΈΠΌ ΡΠΎΡΡΡΠ΄Π½ΠΈΠΊΠ°ΠΌβ¦
ΠΠΎΠΏΡΡΡΠΈΠΌ, ΡΠ΅ΡΠ°Π΅ΡΡΡ Π·Π°Π΄Π°ΡΠ° ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ Ρ Π΄Π²ΡΠΌΡ ΠΊΠ»Π°ΡΡΠ°ΠΌΠΈ {0, 1}. ΠΠ»Π³ΠΎΡΠΈΡΠΌ Π²ΡΠ΄Π°ΡΡ Π½Π΅ΠΊΠΎΡΠΎΡΡΡ ΠΎΡΠ΅Π½ΠΊΡ (ΠΌΠΎΠΆΠ΅Ρ, Π½ΠΎ Π½Π΅ ΠΎΠ±ΡΠ·Π°ΡΠ΅Π»ΡΠ½ΠΎ, Π²Π΅ΡΠΎΡΡΠ½ΠΎΡΡΡ) ΠΏΡΠΈΠ½Π°Π΄Π»Π΅ΠΆΠ½ΠΎΡΡΠΈ ΠΎΠ±ΡΠ΅ΠΊΡΠ° ΠΊ ΠΊΠ»Π°ΡΡΡ 1. ΠΠΎΠΆΠ½ΠΎ ΡΡΠΈΡΠ°ΡΡ, ΡΡΠΎ ΠΎΡΠ΅Π½ΠΊΠ° ΠΏΡΠΈΠ½Π°Π΄Π»Π΅ΠΆΠΈΡ ΠΎΡΡΠ΅Π·ΠΊΡ [0, 1].
Π§Π°ΡΡΠΎ ΡΠ΅Π·ΡΠ»ΡΡΠ°Ρ ΡΠ°Π±ΠΎΡΡ Π°Π»Π³ΠΎΡΠΈΡΠΌΠ° Π½Π° ΡΠΈΠΊΡΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠΉ ΡΠ΅ΡΡΠΎΠ²ΠΎΠΉ Π²ΡΠ±ΠΎΡΠΊΠ΅ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·ΠΈΡΡΡΡ Ρ ΠΏΠΎΠΌΠΎΡΡΡ ROC-ΠΊΡΠΈΠ²ΠΎΠΉ (ROC = receiver operating characteristic, ΠΈΠ½ΠΎΠ³Π΄Π° Π³ΠΎΠ²ΠΎΡΡΡ Β«ΠΊΡΠΈΠ²Π°Ρ ΠΎΡΠΈΠ±ΠΎΠΊΒ»), Π° ΠΊΠ°ΡΠ΅ΡΡΠ²ΠΎ ΠΎΡΠ΅Π½ΠΈΠ²Π°ΡΡ ΠΊΠ°ΠΊ ΠΏΠ»ΠΎΡΠ°Π΄Ρ ΠΏΠΎΠ΄ ΡΡΠΎΠΉ ΠΊΡΠΈΠ²ΠΎΠΉ β AUC (AUC = area under the curve). ΠΠΎΠΊΠ°ΠΆΠ΅ΠΌ Π½Π° ΠΊΠΎΠ½ΠΊΡΠ΅ΡΠ½ΠΎΠΌ ΠΏΡΠΈΠΌΠ΅ΡΠ΅, ΠΊΠ°ΠΊ ΡΡΡΠΎΠΈΡΡΡ ΠΊΡΠΈΠ²Π°Ρ.
Β Π§ΠΈΡΠ°ΡΡ ΠΠ°Π»ΡΡΠ΅
@data_analysis_ml
ΠΠ»ΠΎΡΠ°Π΄Ρ ΠΏΠΎΠ΄ ROC-ΠΊΡΠΈΠ²ΠΎΠΉ β ΠΎΠ΄ΠΈΠ½ ΠΈΠ· ΡΠ°ΠΌΡΡ ΠΏΠΎΠΏΡΠ»ΡΡΠ½ΡΡ ΡΡΠ½ΠΊΡΠΈΠΎΠ½Π°Π»ΠΎΠ² ΠΊΠ°ΡΠ΅ΡΡΠ²Π° Π² Π·Π°Π΄Π°ΡΠ°Ρ Π±ΠΈΠ½Π°ΡΠ½ΠΎΠΉ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ. ΠΠ° ΠΌΠΎΠΉ Π²Π·Π³Π»ΡΠ΄, ΠΏΡΠΎΡΡΡΡ ΠΈ ΠΏΠΎΠ»Π½ΡΡ ΠΈΡΡΠΎΡΠ½ΠΈΠΊΠΎΠ² ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ Β«ΡΡΠΎ ΠΆΠ΅ ΡΡΠΎ ΡΠ°ΠΊΠΎΠ΅Β» Π½Π΅Ρ. ΠΠ°ΠΊ ΠΏΡΠ°Π²ΠΈΠ»ΠΎ, ΠΎΠ±ΡΡΡΠ½Π΅Π½ΠΈΠ΅ Π½Π°ΡΠΈΠ½Π°ΡΡ Ρ Π²Π²Π΅Π΄Π΅Π½ΠΈΡ ΡΠ°Π·Π½ΡΡ ΡΠ΅ΡΠΌΠΈΠ½ΠΎΠ² (FPR, TPR), ΠΊΠΎΡΠΎΡΡΠ΅ Π½ΠΎΡΠΌΠ°Π»ΡΠ½ΡΠΉ ΡΠ΅Π»ΠΎΠ²Π΅ΠΊ ΡΡΡ ΠΆΠ΅ Π·Π°Π±ΡΠ²Π°Π΅Ρ. Π’Π°ΠΊΠΆΠ΅ Π½Π΅Ρ ΡΠ°Π·Π±ΠΎΡΠΎΠ² ΠΊΠ°ΠΊΠΈΡ -ΡΠΎ ΠΊΠΎΠ½ΠΊΡΠ΅ΡΠ½ΡΡ Π·Π°Π΄Π°Ρ ΠΏΠΎ AUC ROC. Π ΡΡΠΎΠΌ ΠΏΠΎΡΡΠ΅ ΠΎΠΏΠΈΡΠ°Π½ΠΎ, ΠΊΠ°ΠΊ Ρ ΠΎΠ±ΡΡΡΠ½ΡΡ ΡΡΡ ΡΠ΅ΠΌΡ ΡΡΡΠ΄Π΅Π½ΡΠ°ΠΌ ΠΈ ΡΠ²ΠΎΠΈΠΌ ΡΠΎΡΡΡΠ΄Π½ΠΈΠΊΠ°ΠΌβ¦
ΠΠΎΠΏΡΡΡΠΈΠΌ, ΡΠ΅ΡΠ°Π΅ΡΡΡ Π·Π°Π΄Π°ΡΠ° ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΠΈ Ρ Π΄Π²ΡΠΌΡ ΠΊΠ»Π°ΡΡΠ°ΠΌΠΈ {0, 1}. ΠΠ»Π³ΠΎΡΠΈΡΠΌ Π²ΡΠ΄Π°ΡΡ Π½Π΅ΠΊΠΎΡΠΎΡΡΡ ΠΎΡΠ΅Π½ΠΊΡ (ΠΌΠΎΠΆΠ΅Ρ, Π½ΠΎ Π½Π΅ ΠΎΠ±ΡΠ·Π°ΡΠ΅Π»ΡΠ½ΠΎ, Π²Π΅ΡΠΎΡΡΠ½ΠΎΡΡΡ) ΠΏΡΠΈΠ½Π°Π΄Π»Π΅ΠΆΠ½ΠΎΡΡΠΈ ΠΎΠ±ΡΠ΅ΠΊΡΠ° ΠΊ ΠΊΠ»Π°ΡΡΡ 1. ΠΠΎΠΆΠ½ΠΎ ΡΡΠΈΡΠ°ΡΡ, ΡΡΠΎ ΠΎΡΠ΅Π½ΠΊΠ° ΠΏΡΠΈΠ½Π°Π΄Π»Π΅ΠΆΠΈΡ ΠΎΡΡΠ΅Π·ΠΊΡ [0, 1].
Π§Π°ΡΡΠΎ ΡΠ΅Π·ΡΠ»ΡΡΠ°Ρ ΡΠ°Π±ΠΎΡΡ Π°Π»Π³ΠΎΡΠΈΡΠΌΠ° Π½Π° ΡΠΈΠΊΡΠΈΡΠΎΠ²Π°Π½Π½ΠΎΠΉ ΡΠ΅ΡΡΠΎΠ²ΠΎΠΉ Π²ΡΠ±ΠΎΡΠΊΠ΅ Π²ΠΈΠ·ΡΠ°Π»ΠΈΠ·ΠΈΡΡΡΡ Ρ ΠΏΠΎΠΌΠΎΡΡΡ ROC-ΠΊΡΠΈΠ²ΠΎΠΉ (ROC = receiver operating characteristic, ΠΈΠ½ΠΎΠ³Π΄Π° Π³ΠΎΠ²ΠΎΡΡΡ Β«ΠΊΡΠΈΠ²Π°Ρ ΠΎΡΠΈΠ±ΠΎΠΊΒ»), Π° ΠΊΠ°ΡΠ΅ΡΡΠ²ΠΎ ΠΎΡΠ΅Π½ΠΈΠ²Π°ΡΡ ΠΊΠ°ΠΊ ΠΏΠ»ΠΎΡΠ°Π΄Ρ ΠΏΠΎΠ΄ ΡΡΠΎΠΉ ΠΊΡΠΈΠ²ΠΎΠΉ β AUC (AUC = area under the curve). ΠΠΎΠΊΠ°ΠΆΠ΅ΠΌ Π½Π° ΠΊΠΎΠ½ΠΊΡΠ΅ΡΠ½ΠΎΠΌ ΠΏΡΠΈΠΌΠ΅ΡΠ΅, ΠΊΠ°ΠΊ ΡΡΡΠΎΠΈΡΡΡ ΠΊΡΠΈΠ²Π°Ρ.
Β Π§ΠΈΡΠ°ΡΡ ΠΠ°Π»ΡΡΠ΅
@data_analysis_ml