Для тех кто любит Python, не очень любит, но вынужден работать с SQL и любит NoSQL формат работы с данными, для них подборка полезных инструментов:
- datasets: databases for lazy people http://dataset.readthedocs.io/en/latest/ инструмент для доступа к базам данных с запросами не через SQL, а в стиле MongoDB - словарями в Python
- Records: SQL for Humans https://github.com/kennethreitz/records аналогично datasets, удобная библиотека для доступа к SQL без знания SQL
- Tablib: Pythonic Tabular Datasets - http://docs.python-tablib.org/en/latest/ как работать с данными и делать наборы без баз данных.
- CsvKit https://github.com/wireservice/csvkit позволяет вытворять всякое с CSV файлами
- SmartCSV https://github.com/santiagobasulto/smartcsv умные разбиратель самых разных CSV файлов
- Docx2CSV https://github.com/ivbeg/docx2csv простая утилита извлечения таблиц из DOCX файлов
Ну а для тех кто любит Go, любит SQL и не любит NoSQL ещё есть:
- TextQL https://github.com/dinedal/textql позволяющий исполнять SQL против CSV файлов
- Q https://github.com/harelba/q аналогичный движок всё таки на Python, но давно не обновляемый
Для тех кому надо быстро обмениваться большими файлами. Есть dat - https://github.com/datproject/dat движок для обмена файлами с данными
#opendata #data #datascience
- datasets: databases for lazy people http://dataset.readthedocs.io/en/latest/ инструмент для доступа к базам данных с запросами не через SQL, а в стиле MongoDB - словарями в Python
- Records: SQL for Humans https://github.com/kennethreitz/records аналогично datasets, удобная библиотека для доступа к SQL без знания SQL
- Tablib: Pythonic Tabular Datasets - http://docs.python-tablib.org/en/latest/ как работать с данными и делать наборы без баз данных.
- CsvKit https://github.com/wireservice/csvkit позволяет вытворять всякое с CSV файлами
- SmartCSV https://github.com/santiagobasulto/smartcsv умные разбиратель самых разных CSV файлов
- Docx2CSV https://github.com/ivbeg/docx2csv простая утилита извлечения таблиц из DOCX файлов
Ну а для тех кто любит Go, любит SQL и не любит NoSQL ещё есть:
- TextQL https://github.com/dinedal/textql позволяющий исполнять SQL против CSV файлов
- Q https://github.com/harelba/q аналогичный движок всё таки на Python, но давно не обновляемый
Для тех кому надо быстро обмениваться большими файлами. Есть dat - https://github.com/datproject/dat движок для обмена файлами с данными
#opendata #data #datascience