
Вышла новая версия библиотеки Python для обработки и анализа структурированных данных, Pandas 2.0
Главные преимущества, представленные в новой версии:
- оптимизация производительности, благодаря внедрению серверной части Apache Arrow, большему количеству индексов
- дополнительная гибкость и настройка, позволяет пользователям управлять необязательными зависимостями и использовать преимущества типов данных Apache Arrow (включая возможность обнуления с самого начала);
- совместимость: возможно, это менее «признанное» преимущество новой версии, но имеющее огромное значение. Поскольку Arrow не зависит от языка, данные в памяти могут передаваться между программами, построенными не только на Python, но также R, Spark и другими, использующими серверную часть Apache Arrow.
Подробнее можно ознакомиться здесь и здесь
Главные преимущества, представленные в новой версии:
- оптимизация производительности, благодаря внедрению серверной части Apache Arrow, большему количеству индексов
numpy dtype
и режиму копирования при записи;- дополнительная гибкость и настройка, позволяет пользователям управлять необязательными зависимостями и использовать преимущества типов данных Apache Arrow (включая возможность обнуления с самого начала);
- совместимость: возможно, это менее «признанное» преимущество новой версии, но имеющее огромное значение. Поскольку Arrow не зависит от языка, данные в памяти могут передаваться между программами, построенными не только на Python, но также R, Spark и другими, использующими серверную часть Apache Arrow.
Подробнее можно ознакомиться здесь и здесь