Вышла новая версия библиотеки Python для обработки и анализа структурированных данных, Pandas 2.0



Главные преимущества, представленные в новой версии:



- оптимизация производительности, благодаря внедрению серверной части Apache Arrow, большему количеству индексов numpy dtype и режиму копирования при записи;



- дополнительная гибкость и настройка, позволяет пользователям управлять необязательными зависимостями и использовать преимущества типов данных Apache Arrow (включая возможность обнуления с самого начала);



- совместимость: возможно, это менее «признанное» преимущество новой версии, но имеющее огромное значение. Поскольку Arrow не зависит от языка, данные в памяти могут передаваться между программами, построенными не только на Python, но также R, Spark и другими, использующими серверную часть Apache Arrow.

Подробнее можно ознакомиться здесь и здесь