
Google AI представил новый датасет для vision-and-language navigation. Он реально больше всех существующих, но главное это то, как детально он размечен — от сопоставления отдельных фраз локациям (выделено цветом), до указания конкретного поля зрения агента в этот момент (стрелочки). И как вишенка на торте, это все на разных языках.🤤