Обновил датасет Фикбука: https://huggingface.co/datasets/IlyaGusev/ficbook

Теперь там 1.4 миллиона фанфиков вместо 700к, почти 70 Гб.

Парсер всё ещё работает, это где-то 30% всех фанфиков на сайте.

Там не только тексты, но и основные мета-данные, типа количества лайков.

Уверен, кому-нибудь когда-нибудь пригодится.