🔶 Практическая задача.
🧐 Я тут провожу ревизию файлов и обнаруживаю много одинаковых файлов, но они незначительно отличающихся именем, например:
IMG_2022.jpg и IMG_2022 (1).jpg
Книга.pdf и Книга(1).pdf
rename.exe и rename_1.exe
upd: нашел еще file_name.format и (1)_file_name.format
😎 Кто попробует написать скриптик, позволяющий избавиться от дубликатов?
Это может быть как радикальное решение — удаление всего, что покажется дублем, так и более лояльный фильтр, например, складывать "подозрительные" файлы в отдельную папку.
🤪 Исходное хранилище примерно 200 папок разного уровня вложенности в котором ≈40 тысяч файлов
😳 Язык программирования — любой
🧐 Я тут провожу ревизию файлов и обнаруживаю много одинаковых файлов, но они незначительно отличающихся именем, например:
IMG_2022.jpg и IMG_2022 (1).jpg
Книга.pdf и Книга(1).pdf
rename.exe и rename_1.exe
upd: нашел еще file_name.format и (1)_file_name.format
😎 Кто попробует написать скриптик, позволяющий избавиться от дубликатов?
Это может быть как радикальное решение — удаление всего, что покажется дублем, так и более лояльный фильтр, например, складывать "подозрительные" файлы в отдельную папку.
🤪 Исходное хранилище примерно 200 папок разного уровня вложенности в котором ≈40 тысяч файлов
😳 Язык программирования — любой