gonzo-обзоры ML статей
2) В пятницу 17 июля в 18:00 планирую разобрать на биоинформатическом семинаре свежую статью от Sale...
Читать далееПара анонсов (от @che-shr-cat).1) Во вторник 7 июля в 14:30 МСК буду на вебинаре NTR рассказывать пр...
Читать далееКое-в-каких результатах есть сомнения, потому что в CommonCrawl могли просочиться данные этих задач,...
Читать далееGPT-3 (настоящее название: Language Models are Few-Shot Learners)Tom B. Brown, и множество другихСта...
Читать далееИдея CPC в том, чтобы предсказывать следующие элементы входа в латентном пространстве вместо того, ч...
Читать далееETC: Encoding Long and Structured Data in TransformersJoshua Ainslie, Santiago Ontanon, Chris Albert...
Читать далееПроверяют лонгформер на задаче посимвольного авторегрессионного языкового моделирования, результат -...
Читать далееLongformer: The Long-Document TransformerIz Beltagy, Matthew E. Peters, Arman CohanСтатья: https://a...
Читать далееНа этом я заканчиваю серию постов о современных неавторегрессионных генеративных моделях, я наверняк...
Читать далееЭксперименты проводили на датасетах WSJ и LibriSpeech, в качестве метрик использовали CER и WER. На...
Читать далее