Распознование кодировки символов



Библиотека chardet способна определить кодировку текста, анализируя его содержимое.



В данном примере строка кодируется в байтовую последовательность с помощью метода encode() и передается в функцию detect() из библиотеки chardet.



Функция detect() возвращает словарь,

{'encoding': 'ascii', 'confidence': 1.0, 'language': ''}


в котором ключ 'encoding' содержит название кодировки, а ключ 'confidence' показывает уверенность в правильности определения кодировки.



Установка библиотеки:

pip install chardet




Python Tech Code - подписаться