​​🐼 Клёвая статья про неэффективные паттерны работы в Pandas

Часто у юзеров pandas при использовании библиотеки возникают «плохие привычки» - неэффективные способы работы. В этой статье автор описывает четыре неэффективных паттерна pandas и показывает более эффективные подходы к решению рабочих задач.



Вот паттерны и их лучшие аналоги:

1.Использование мутаций (пошаговых изменений объектов DataFrame)

Использование цепочек методов



2. Применение циклов for и встроенных методов-генераторов при работе с объектами DataFrame

Использование метода .apply / векторизованных операций



3. Неоправданное использование .apply при работе с большим объемом данных

Использование np.select, np.where и .isin



4. Использование неподходящих типов данных (например, использование строк, а не pandas.Categorical для описания категориальных признаков)



Чтобы понять, почему такие паттерны эффективнее, лучше прочитать саму статью. И оставляйте огоньки под постом, это всегда приятно!🔥