Большой и хороший райтап по некоторым задачам из crucible... На примерах(с кодом) рассмотрены реализации нескольких атак:



➡️Model Extraction атака

➡️реализовали Prompt Injection

➡️Атаки с ограниченным вводом

и другое ...



По ходу чтения вы также ознакомитесь с тем что такое Data augmentation и какие техники бывают, а также с концепциями Tree of Attacks (TAP) Jailbreaking



Red Teaming with LLMs