
⚡️ Извлекаем данные из HTML файлов
Beautiful soup — модуль для python, позволяющий обработатывать XML и HTML файлы. Вместе с ним вы можете использовать самые разные парсеры, например — html5lib, lxml, html.parser, xml.
Установка:
На самом деле, класс очень большой, поэтому здесь я оставлю документацию и пример для самостоятельного разбора.
Он, если что, на картинке выше.
#миниурок #bs4
Beautiful soup — модуль для python, позволяющий обработатывать XML и HTML файлы. Вместе с ним вы можете использовать самые разные парсеры, например — html5lib, lxml, html.parser, xml.
Установка:
pip install beautifulsoup4
BeautifulSoup — класс, с которого начинается работа. Он принимает строку для обработки и модуль, который будет парсировать текст.На самом деле, класс очень большой, поэтому здесь я оставлю документацию и пример для самостоятельного разбора.
Он, если что, на картинке выше.
#миниурок #bs4