gonzo-обзоры ML статей

Результаты на задаче определения чётности вектора

Читать далее

RNN vs. RNN with ACT

Читать далее

ACT: Adaptive Computation TimeЕсть такая хорошая и малоизвестная тема под названием Adaptive Computa...

Читать далее

Conditional BERT Contextual AugmentationXing Wu, Shangwen Lv, Liangjun Zang, Jizhong Han, Songlin Hu...

Читать далее

Небольшой follow-up со ссылками и замечаниями от читателей + то, что я сам ещё нашёл по теме.1. Идею...

Читать далее

3.3. Sparse Transformer, 2019 april, OpenAIБлогопост: https://openai.com/blog/sparse-transformer/Ста...

Читать далее

факторизация внимания в Sparced Transformer

Читать далее

схема нарезки входа Transformer-XL

Читать далее

3. Сложные модификации Трансформера -- борьба с ограничениями.Базовых ограничений у Трансформера нес...

Читать далее

2. Простые модификации Трансформера -- в основном, полученные усечением функциональности.Из относите...

Читать далее