
🚀 @SBERLOGACOMPETE образовательный вебинар по data science:
👨🔬 Alexander Chervov "Hands on Hugging Face Transformers and Kaggle CommonLit challenge"
⌚️ Четверг 7 Сентября, 20.00 (Moscow time)
Link to Announcement on Kaggle. (Talk planned to be in English).
Add to Google Calendar
Образовательный вебинар для начинающих: примеры использования моделей типа DeBERTa из коллекции Hugging Face трансформеров для решения задач NLP. На примере Kaggle соревнования "CommonLit - Evaluate Student Summaries". Рассмотрим ноутбуки как файн-тюнить трансформеры под конкретные задачи. Это не так сложно, но все же несколько сложнее чем ".fit/.predict" (в sklearn), но не сильно - нужно примерно следующее 1) перевести данные в формат HF-датасета 2) токенизировть текст 3) добавить таргеты 4) подготовить параметры трейнинга 5) только потом запустить трейнинг. Мы рассмотрим как это происходит в деталях. Во второй половине обсудим соревнование "CommonLit" дадим обзор подходов и паблик ноутбуков, некоторых загадок подготовки данных организаторами, внешние данные и т.д.
Ноутбуки с моделями nb1, nb2, с обзором пабликов nb .
Zoom link will be available in https://t.me/sberlogabig shortly before start of the talk.
Предыдущий вебинар по данному соревнованию:
📹 Video: https://youtu.be/OL3ZW2AY6yg
👨🔬 Ivan Glebov "Kaggle competition: CommonLit - Evaluate Student Summaries"
Данный доклад:
📖 Presentation: https://docs.google.com/presentation/d/101mmtjEvIwKKP2klTwJZ_yIGydXyorQkKn19SrMoZnE/edit?usp=sharing
📹 Video: https://youtu.be/L6OQmXk1Am4
👨🔬 Alexander Chervov "Hands on Hugging Face Transformers and Kaggle CommonLit challenge"
⌚️ Четверг 7 Сентября, 20.00 (Moscow time)
Link to Announcement on Kaggle. (Talk planned to be in English).
Add to Google Calendar
Образовательный вебинар для начинающих: примеры использования моделей типа DeBERTa из коллекции Hugging Face трансформеров для решения задач NLP. На примере Kaggle соревнования "CommonLit - Evaluate Student Summaries". Рассмотрим ноутбуки как файн-тюнить трансформеры под конкретные задачи. Это не так сложно, но все же несколько сложнее чем ".fit/.predict" (в sklearn), но не сильно - нужно примерно следующее 1) перевести данные в формат HF-датасета 2) токенизировть текст 3) добавить таргеты 4) подготовить параметры трейнинга 5) только потом запустить трейнинг. Мы рассмотрим как это происходит в деталях. Во второй половине обсудим соревнование "CommonLit" дадим обзор подходов и паблик ноутбуков, некоторых загадок подготовки данных организаторами, внешние данные и т.д.
Ноутбуки с моделями nb1, nb2, с обзором пабликов nb .
Zoom link will be available in https://t.me/sberlogabig shortly before start of the talk.
Предыдущий вебинар по данному соревнованию:
📹 Video: https://youtu.be/OL3ZW2AY6yg
👨🔬 Ivan Glebov "Kaggle competition: CommonLit - Evaluate Student Summaries"
Данный доклад:
📖 Presentation: https://docs.google.com/presentation/d/101mmtjEvIwKKP2klTwJZ_yIGydXyorQkKn19SrMoZnE/edit?usp=sharing
📹 Video: https://youtu.be/L6OQmXk1Am4