πŸ“Œ ΠŸΠΎΠ΄Π±ΠΎΡ€ΠΊΠ° интСрСсных датасСтов



IMDB reviews β€” 25 000 ΠΎΡ‚Π·Ρ‹Π²ΠΎΠ² Π½Π° Ρ„ΠΈΠ»ΡŒΠΌΡ‹ Π² Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΠΎΠΌ Π½Π°Π±ΠΎΡ€Π΅ ΠΈ 25 000 Π² тСстовом. (Π’Π°Ρ€ΠΈΠ°Π½Ρ‚ примСнСния с исходником Π½Π° R: Sentiment Analysis Data Science Project)



MS COCO dataset β€” 1,5 ΠΌΠ»Π½ Ρ€Π°Π·ΠΌΠ΅Ρ‡Π΅Π½Π½Ρ‹Ρ… ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ.



CIFAR-10 and CIFAR-100 dataset β€” CIFAR-10 содСрТит 60,000 ΠΌΠ°Π»Π΅Π½ΡŒΠΊΠΈΡ… ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ 32*32 pixels Ρ†ΠΈΡ„Ρ€ 0-9. CIFAR-100 β€” соотвСтствСнно, 0-100.



GTSRB (German traffic sign recognition benchmark) Dataset β€” 50 000 ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ 43 Π΄ΠΎΡ€ΠΎΠΆΠ½Ρ‹Ρ… Π·Π½Π°ΠΊΠΎΠ². (Π’Π°Ρ€ΠΈΠ°Π½Ρ‚ примСнСния с исходником Π½Π° Python: Traffic Signs Recognition Python Project)



ImageNet dataset β€” содСрТит Π±ΠΎΠ»Π΅Π΅ 100 000 Ρ„Ρ€Π°Π· ΠΈ ΠΎΠΊΠΎΠ»ΠΎ 1000 ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ Π½Π° Ρ„Ρ€Π°Π·Ρƒ.



Breast Histopathology Images Dataset β€” датасСт содСрТит изобраТСния ΠΎΠ±Ρ€Π°Π·Ρ†ΠΎΠ² Ρ€Π°ΠΊΠ° ΠΌΠΎΠ»ΠΎΡ‡Π½ΠΎΠΉ ΠΆΠ΅Π»Π΅Π·Ρ‹. (Π’Π°Ρ€ΠΈΠ°Π½Ρ‚ примСнСния с исходником Π½Π° Breast Cancer Classification Python Project)



Cityscapes Dataset β€” содСрТит высококачСствСнныС Π°Π½Π½ΠΎΡ‚Π°Ρ†ΠΈΠΈ Π²ΠΈΠ΄Π΅ΠΎΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ ΡƒΠ»ΠΈΡ† Ρ€Π°Π·Π½Ρ‹Ρ… Π³ΠΎΡ€ΠΎΠ΄ΠΎΠ².



Kinetics Dataset β€” содСрТит URL-ссылку Π½Π° ΠΎΠΊΠΎΠ»ΠΎ 6,5 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½ΠΎΠ² высококачСствСнных Π²ΠΈΠ΄Π΅ΠΎ.



All Reddit Sublessons β€” содСрТит всС ΠΏΠΎΠ΄Π·Π°Π³ΠΎΠ»ΠΎΠ²ΠΊΠΈ reddit Π΄ΠΎ 2015 Π³ΠΎΠ΄Π°.



Jeopardy Questions β€” вопросы ΠΈ количСство Π±Π°Π»Π»ΠΎΠ² ΠΈΠ· ΠΈΠ³Ρ€ΠΎΠ²ΠΎΠ³ΠΎ ΡˆΠΎΡƒ Jeopardy.



New York City Property Tax Data - Π΄Π°Π½Π½Ρ‹Π΅ ΠΎ нСдвиТимости ΠΈ ΠΎΡ†Π΅Π½ΠΎΡ‡Π½ΠΎΠΉ стоимости Π² Нью-Π™ΠΎΡ€ΠΊΠ΅.



ΠžΠΏΡ€ΠΎΡΡ‹ ΠΌΠΎΠ»ΠΎΠ΄Ρ‹Ρ… людСй. Π”Π°Π½Π½Ρ‹Π΅ ΠΎ прСдпочтСниях, интСрСсах, ΠΏΡ€ΠΈΠ²Ρ‹Ρ‡ΠΊΠ°Ρ…, мнСниях ΠΈ страхах ΠΌΠΎΠ»ΠΎΠ΄Ρ‹Ρ… людСй.



ΠœΠΈΡ€ΠΎΠ²Ρ‹Π΅ Ρ€Π΅ΠΉΡ‚ΠΈΠ½Π³ΠΈ унивСрситСтов. Π˜ΡΡΠ»Π΅Π΄ΡƒΠΉΡ‚Π΅ Π»ΡƒΡ‡ΡˆΠΈΠ΅ унивСрситСты ΠΌΠΈΡ€Π°.



ΠžΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅ ΠΌΠΎΡˆΠ΅Π½Π½ΠΈΡ‡Π΅ΡΡ‚Π²Π° с ΠΊΡ€Π΅Π΄ΠΈΡ‚Π½Ρ‹ΠΌΠΈ ΠΊΠ°Ρ€Ρ‚Π°ΠΌΠΈ. ДатасСт ΠΏΠΎ Π°Π½ΠΎΠ½ΠΈΠΌΠ½Ρ‹ΠΌ транзакциям ΠΊΡ€Π΅Π΄ΠΈΡ‚Π½Ρ‹Ρ… ΠΊΠ°Ρ€Ρ‚, ΠΏΠΎΠΌΠ΅Ρ‡Π΅Π½Π½Ρ‹Π΅ ΠΊΠ°ΠΊ ΠΌΠΎΡˆΠ΅Π½Π½ΠΈΡ‡Π΅ΡΠΊΠΈΠ΅ ΠΈΠ»ΠΈ ΠΏΠΎΠ΄Π»ΠΈΠ½Π½Ρ‹Π΅.



ДатасСт Π±ΠΎΠ»Π΅Π·Π½Π΅ΠΉ сСрдца. Π‘Π°Π·Π° Π΄Π°Π½Π½Ρ‹Ρ… содСрТит 76 Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚ΠΎΠ², Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ возраст, ΠΏΠΎΠ», Ρ‚ΠΈΠΏ Π±ΠΎΠ»ΠΈ Π² Π³Ρ€ΡƒΠ΄ΠΈ, Π°Ρ€Ρ‚Π΅Ρ€ΠΈΠ°Π»ΡŒΠ½ΠΎΠ΅ Π΄Π°Π²Π»Π΅Π½ΠΈΠ΅ Π² ΠΏΠΎΠΊΠΎΠ΅ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅.



ЕвропСйская Ρ„ΡƒΡ‚Π±ΠΎΠ»ΡŒΠ½Π°Ρ Π±Π°Π·Π°. Π‘ΠΎΠ»ΡŒΡˆΠ΅ 25 тысяч ΠΌΠ°Ρ‚Ρ‡Π΅ΠΉ, Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Ρ‹ ΠΈΠ³Ρ€ΠΎΠΊΠΎΠ² ΠΈ ΠΊΠΎΠΌΠ°Π½Π΄ для СвропСйского ΠΏΡ€ΠΎΡ„Π΅ΡΡΠΈΠΎΠ½Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ Ρ„ΡƒΡ‚Π±ΠΎΠ»Π°.



Π’ΠΈΠ½Π½Ρ‹Π΅ ΠΎΠ±Π·ΠΎΡ€Ρ‹. 130 тысяч Π²ΠΈΠ½Π½Ρ‹Ρ… ΠΎΠ±Π·ΠΎΡ€ΠΎΠ² с Ρ€Π°Π·Π½ΠΎΠΎΠ±Ρ€Π°Π·ΠΈΠ΅ΠΌ, мСстополоТСниСм, винодСльнСй, Ρ†Π΅Π½ΠΎΠΉ ΠΈ описаниСм.



Baidu Apolloscapes. Π‘ΠΎΠ»ΡŒΡˆΠΎΠΉ датасСт для распознавания 26 сСмантичСски Ρ€Π°Π·Π½Ρ‹Ρ… ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π²Ρ€ΠΎΠ΄Π΅ машин, вСлосипСдов, ΠΏΠ΅ΡˆΠ΅Ρ…ΠΎΠ΄ΠΎΠ², Π·Π΄Π°Π½ΠΈΠΉ, ΡƒΠ»ΠΈΡ‡Π½Ρ‹Ρ… Ρ„ΠΎΠ½Π°Ρ€Π΅ΠΉ ΠΈ Ρ‚Π°ΠΊ Π΄Π°Π»Π΅Π΅.



Comma.ai. Π‘ΠΎΠ»Π΅Π΅ сСми часов Π΅Π·Π΄Ρ‹ ΠΏΠΎ шоссС. ДатасСт Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΎ скорости ΠΌΠ°ΡˆΠΈΠ½Ρ‹, ускорСнии, ΡƒΠ³Π»Π΅ ΠΏΠΎΠ²ΠΎΡ€ΠΎΡ‚Π° руля ΠΈ GPS-ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚Π°Ρ….



РаспознаваниС Ρ†Π²Π΅Ρ‚ΠΎΠ². Набор Π΄Π°Π½Π½Ρ‹Ρ… содСрТит 4242 изобраТСния Ρ†Π²Π΅Ρ‚ΠΎΠ². Π‘Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… основан Π½Π° Π΄Π°Π½Π½Ρ‹Ρ… Flickr, изобраТСниях Google ΠΈ «ЯндСкса».



ЕТСднСвная рыночная Ρ†Π΅Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΊΡ€ΠΈΠΏΡ‚ΠΎΠ²Π°Π»ΡŽΡ‚Ρ‹. Π˜ΡΡ‚ΠΎΡ€ΠΈΡ‡Π΅ΡΠΊΠΈΠ΅ Ρ†Π΅Π½Ρ‹ Π½Π° ΠΊΡ€ΠΈΠΏΡ‚ΠΎΠ²Π°Π»ΡŽΡ‚Ρƒ для всСх Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ².



Π¨ΠΎΠΊΠΎΠ»Π°Π΄Π½Ρ‹ΠΉ Ρ€Π΅ΠΉΡ‚ΠΈΠ½Π³. ЭкспСртный Ρ€Π΅ΠΉΡ‚ΠΈΠ½Π³ Π±ΠΎΠ»Π΅Π΅ 1700 ΡˆΠΎΠΊΠΎΠ»Π°Π΄Π½Ρ‹Ρ… Π±Π°Ρ‚ΠΎΠ½Ρ‡ΠΈΠΊΠΎΠ².



@bigdatai