gonzo-обзоры ML статей

2) В пятницу 17 июля в 18:00 планирую разобрать на биоинформатическом семинаре свежую статью от Sale...

Читать далее

Пара анонсов (от @che-shr-cat).1) Во вторник 7 июля в 14:30 МСК буду на вебинаре NTR рассказывать пр...

Читать далее

Кое-в-каких результатах есть сомнения, потому что в CommonCrawl могли просочиться данные этих задач,...

Читать далее

GPT-3 (настоящее название: Language Models are Few-Shot Learners)Tom B. Brown, и множество другихСта...

Читать далее

Идея CPC в том, чтобы предсказывать следующие элементы входа в латентном пространстве вместо того, ч...

Читать далее

ETC: Encoding Long and Structured Data in TransformersJoshua Ainslie, Santiago Ontanon, Chris Albert...

Читать далее

Проверяют лонгформер на задаче посимвольного авторегрессионного языкового моделирования, результат -...

Читать далее

Longformer: The Long-Document TransformerIz Beltagy, Matthew E. Peters, Arman CohanСтатья: https://a...

Читать далее

На этом я заканчиваю серию постов о современных неавторегрессионных генеративных моделях, я наверняк...

Читать далее

Эксперименты проводили на датасетах WSJ и LibriSpeech, в качестве метрик использовали CER и WER. На...

Читать далее