πŸ“‰ ROC ΠΈ AUC простыми словами.



ΠŸΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ – ΠΎΠ΄ΠΈΠ½ ΠΈΠ· самых популярных Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΠΎΠ² качСства Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации. На ΠΌΠΎΠΉ взгляд, простых ΠΈ ΠΏΠΎΠ»Π½Ρ‹Ρ… источников ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ Β«Ρ‡Ρ‚ΠΎ ΠΆΠ΅ это Ρ‚Π°ΠΊΠΎΠ΅Β» Π½Π΅Ρ‚. Как ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, объяснСниС Π½Π°Ρ‡ΠΈΠ½Π°ΡŽΡ‚ с ввСдСния Ρ€Π°Π·Π½Ρ‹Ρ… Ρ‚Π΅Ρ€ΠΌΠΈΠ½ΠΎΠ² (FPR, TPR), ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΉ Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊ Ρ‚ΡƒΡ‚ ΠΆΠ΅ Π·Π°Π±Ρ‹Π²Π°Π΅Ρ‚. Π’Π°ΠΊΠΆΠ΅ Π½Π΅Ρ‚ Ρ€Π°Π·Π±ΠΎΡ€ΠΎΠ² ΠΊΠ°ΠΊΠΈΡ…-Ρ‚ΠΎ ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ ΠΏΠΎ AUC ROC. Π’ этом постС описано, ΠΊΠ°ΠΊ я объясняю эту Ρ‚Π΅ΠΌΡƒ студСнтам ΠΈ своим сотрудникам…



Допустим, Ρ€Π΅ΡˆΠ°Π΅Ρ‚ΡΡ Π·Π°Π΄Π°Ρ‡Π° классификации с двумя классами {0, 1}. Алгоритм Π²Ρ‹Π΄Π°Ρ‘Ρ‚ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΎΡ†Π΅Π½ΠΊΡƒ (ΠΌΠΎΠΆΠ΅Ρ‚, Π½ΠΎ Π½Π΅ ΠΎΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ) принадлСТности ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° ΠΊ классу 1. МоТно ΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ ΠΎΡ†Π΅Π½ΠΊΠ° ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠΈΡ‚ ΠΎΡ‚Ρ€Π΅Π·ΠΊΡƒ [0, 1].



Часто Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π½Π° фиксированной тСстовой Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·ΠΈΡ€ΡƒΡŽΡ‚ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ (ROC = receiver operating characteristic, ΠΈΠ½ΠΎΠ³Π΄Π° говорят «кривая ошибок»), Π° качСство ΠΎΡ†Π΅Π½ΠΈΠ²Π°ΡŽΡ‚ ΠΊΠ°ΠΊ ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ этой ΠΊΡ€ΠΈΠ²ΠΎΠΉ – AUC (AUC = area under the curve). ПокаТСм Π½Π° ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΠΎΠΌ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅, ΠΊΠ°ΠΊ строится кривая.



Β Π§ΠΈΡ‚Π°Ρ‚ΡŒ Π”Π°Π»ΡŒΡˆΠ΅



@data_analysis_ml