Никто не просил, никто не ждал, но я наконец доделал и выложил самый(вероятно) быстрый captioning на русском языке.

Модель основанная на работе CLIP prefix caption, обучена на ruCOCO на 2*1080ti и выложена



Алсо моделька умеет в ZS и при должном promt может решать простенькие VQA задачки



github

hf 🤗

HFspaces🤗

collab 🔮



Лайк шер звездочка