Microsoft LongNet, в теории, может обрабатывать в 250 000 раз больше токенов, чем ChatGPT
Языковая модель LongNet от Microsoft умеет «держать в уме» до миллиарда токенов по сравнению с 4096 токенами ChatGPT. Это около 750 000 000 слов или 2 000 000 страниц текста на английском языке.
LongNet достигает этого с помощью механизма, называемого расширенным вниманием, когда внимание между двумя токенами уменьшается экспоненциально по мере того, как они удаляются друг от друга.
В настоящее время, LongNet — лишь концепт. Ее способности еще предстоит подтвердить в будущих исследованиях.
https://the-decoder.com/microsoft-longnet-could-deliver-web-scale-ai-for-future-llms/
—
@aioftheday — новости вокруг искусственного интеллекта
Языковая модель LongNet от Microsoft умеет «держать в уме» до миллиарда токенов по сравнению с 4096 токенами ChatGPT. Это около 750 000 000 слов или 2 000 000 страниц текста на английском языке.
LongNet достигает этого с помощью механизма, называемого расширенным вниманием, когда внимание между двумя токенами уменьшается экспоненциально по мере того, как они удаляются друг от друга.
В настоящее время, LongNet — лишь концепт. Ее способности еще предстоит подтвердить в будущих исследованиях.
https://the-decoder.com/microsoft-longnet-could-deliver-web-scale-ai-for-future-llms/
—
@aioftheday — новости вокруг искусственного интеллекта