Pandas - отличная базовая библиотека для работы с данными, включая очистку, генерацию новых фич и интеграцию с инструментами машинного обучения. Проблема в том, что в ней, несмотря на кажущуюся простоту, есть разные тонкости, а также готовые обертки, которые могут сильно облегчить жизнь, если о них знать.



Николай Марков рассказывает о различных приёмах эффективной работы с данными. Настоятельно рекомендую к просмотру



https://www.youtube.com/watch?v=2xS_glCEuRg