Исследователи Корейского института науки и технологий (KAIST) представили ИИ-модель DarkBERT, способную искать "ценные научные сведения" в даркнете. Специальные фильтры обеспечивают защиту пользователей от нежелательного контента.



DarkBERT построен на основе архитектуры RoBERTa 2019 года. Обучение модели прошло на материалах из даркнета, полученных через анонимный брандмауэр сети Tor и отфильтрованных методами дедупликации, балансировки категорий и предварительной обработки данных.



DarkBERT способен анализировать контент из даркнета и извлекать из него полезную информацию. Основной характеристикой больших языковых моделей, к которым относится DarkBERT, является понимание языка. Модель была обучена на специфической смеси языков, используемых в даркнете.



Оказалось, DarkBERT превосходит другие большие языковые модели. Это должно помочь исследователям безопасности и правоохранительным органам глубже проникнуть в даркнет. Работа над DarkBERT продолжается.



Источник