🐼 Клёвая статья про неэффективные паттерны работы в Pandas
Часто у юзеров pandas при использовании библиотеки возникают «плохие привычки» - неэффективные способы работы. В этой статье автор описывает четыре неэффективных паттерна pandas и показывает более эффективные подходы к решению рабочих задач.
Вот паттерны и их лучшие аналоги:
1.❌Использование мутаций (пошаговых изменений объектов DataFrame)
✅ Использование цепочек методов
2. ❌ Применение циклов for и встроенных методов-генераторов при работе с объектами DataFrame
✅ Использование метода .apply / векторизованных операций
3. ❌ Неоправданное использование .apply при работе с большим объемом данных
✅ Использование np.select, np.where и .isin
4. Использование неподходящих типов данных (например, использование строк, а не pandas.Categorical для описания категориальных признаков)
Чтобы понять, почему такие паттерны эффективнее, лучше прочитать саму статью. И оставляйте огоньки под постом, это всегда приятно!🔥
Часто у юзеров pandas при использовании библиотеки возникают «плохие привычки» - неэффективные способы работы. В этой статье автор описывает четыре неэффективных паттерна pandas и показывает более эффективные подходы к решению рабочих задач.
Вот паттерны и их лучшие аналоги:
1.❌Использование мутаций (пошаговых изменений объектов DataFrame)
✅ Использование цепочек методов
2. ❌ Применение циклов for и встроенных методов-генераторов при работе с объектами DataFrame
✅ Использование метода .apply / векторизованных операций
3. ❌ Неоправданное использование .apply при работе с большим объемом данных
✅ Использование np.select, np.where и .isin
4. Использование неподходящих типов данных (например, использование строк, а не pandas.Categorical для описания категориальных признаков)
Чтобы понять, почему такие паттерны эффективнее, лучше прочитать саму статью. И оставляйте огоньки под постом, это всегда приятно!🔥