Минкомсвязи+МВД предоставили данные по авариям на дорогах на портале безопасныедороги.рф, но данные которые там опубликованы категорически неудобны для работы. Это один гигантский JSON файл в гигабайт.



Публикую набор данных на данных по ДТП с их сайта в котором сделаны следующие изменения:

- добавлены геометки

- добавлен дамп в BSON (формат для загрузки в MongoDB)

- добавлена выгрузка в JSON с каждым объектом как отдельной строкой

- добавлена выгрузка по всем субъектам федерации по отдельности - можно теперь анализировать данные только по выбранной области. С той оговоркой что у половины данных по ДТП нет привязки к региону и есть только адрес, надо будет в будущем проделать работу по распознаванию региона (геокодированию). Это не очень сложно, оставляю пока как факультативную работу.



Ссылка на набор данных:

- https://hubofdata.ru/dataset/roadcrash



Ссылка на данные и, далее код, на github'е - https://github.com/infoculture/transport-data



Все данные публикуются в открытом репозитории.



#opendata #opengov