jsoup
Библиотека для парсинга и разбора HTML-страниц методами в стиле DOM, CSS и jQuery. Позволяет извлекать данные по URL, из локальных гипертекстовых файлов, фрагментов HTML-кода и даже из строковых переменных, содержащих разметку. Вы можете вытаскивать из страниц все ссылки или заголовки нужного уровня, управлять текстом и стилем, очищать код от атрибутов, добавленных в результате XSS-атак. Для отбора нужных данных вы можете увязать их с DOM-элементами и селекторами CSS.
Библиотека для парсинга и разбора HTML-страниц методами в стиле DOM, CSS и jQuery. Позволяет извлекать данные по URL, из локальных гипертекстовых файлов, фрагментов HTML-кода и даже из строковых переменных, содержащих разметку. Вы можете вытаскивать из страниц все ссылки или заголовки нужного уровня, управлять текстом и стилем, очищать код от атрибутов, добавленных в результате XSS-атак. Для отбора нужных данных вы можете увязать их с DOM-элементами и селекторами CSS.