Для тех кто любит Python, не очень любит, но вынужден работать с SQL и любит NoSQL формат работы с данными, для них подборка полезных инструментов:

- datasets: databases for lazy people http://dataset.readthedocs.io/en/latest/ инструмент для доступа к базам данных с запросами не через SQL, а в стиле MongoDB - словарями в Python

- Records: SQL for Humans https://github.com/kennethreitz/records аналогично datasets, удобная библиотека для доступа к SQL без знания SQL

- Tablib: Pythonic Tabular Datasets - http://docs.python-tablib.org/en/latest/ как работать с данными и делать наборы без баз данных.

- CsvKit https://github.com/wireservice/csvkit позволяет вытворять всякое с CSV файлами

- SmartCSV https://github.com/santiagobasulto/smartcsv умные разбиратель самых разных CSV файлов

- Docx2CSV https://github.com/ivbeg/docx2csv простая утилита извлечения таблиц из DOCX файлов



Ну а для тех кто любит Go, любит SQL и не любит NoSQL ещё есть:

- TextQL https://github.com/dinedal/textql позволяющий исполнять SQL против CSV файлов

- Q https://github.com/harelba/q аналогичный движок всё таки на Python, но давно не обновляемый



Для тех кому надо быстро обмениваться большими файлами. Есть dat - https://github.com/datproject/dat движок для обмена файлами с данными

#opendata #data #datascience