⚡️ Извлекаем данные из HTML файлов



Beautiful soup
— модуль для python, позволяющий обработатывать XML и HTML файлы. Вместе с ним вы можете использовать самые разные парсеры, например — html5lib, lxml, html.parser, xml.



Установка: pip install beautifulsoup4



BeautifulSoup — класс, с которого начинается работа. Он принимает строку для обработки и модуль, который будет парсировать текст.



На самом деле, класс очень большой, поэтому здесь я оставлю документацию и пример для самостоятельного разбора.



Он, если что, на картинке выше.



#миниурок #bs4