Обновил датасет Фикбука: https://huggingface.co/datasets/IlyaGusev/ficbook
Теперь там 1.4 миллиона фанфиков вместо 700к, почти 70 Гб.
Парсер всё ещё работает, это где-то 30% всех фанфиков на сайте.
Там не только тексты, но и основные мета-данные, типа количества лайков.
Уверен, кому-нибудь когда-нибудь пригодится.
Теперь там 1.4 миллиона фанфиков вместо 700к, почти 70 Гб.
Парсер всё ещё работает, это где-то 30% всех фанфиков на сайте.
Там не только тексты, но и основные мета-данные, типа количества лайков.
Уверен, кому-нибудь когда-нибудь пригодится.