gonzo-обзоры ML статей

Результаты на задаче определения чётности вектора
Читать далее
RNN vs. RNN with ACT
Читать далееACT: Adaptive Computation TimeЕсть такая хорошая и малоизвестная тема под названием Adaptive Computa...
Читать далееConditional BERT Contextual AugmentationXing Wu, Shangwen Lv, Liangjun Zang, Jizhong Han, Songlin Hu...
Читать далееНебольшой follow-up со ссылками и замечаниями от читателей + то, что я сам ещё нашёл по теме.1. Идею...
Читать далее3.3. Sparse Transformer, 2019 april, OpenAIБлогопост: https://openai.com/blog/sparse-transformer/Ста...
Читать далее
факторизация внимания в Sparced Transformer
Читать далее
схема нарезки входа Transformer-XL
Читать далее3. Сложные модификации Трансформера -- борьба с ограничениями.Базовых ограничений у Трансформера нес...
Читать далее2. Простые модификации Трансформера -- в основном, полученные усечением функциональности.Из относите...
Читать далее