🔶 Практическая задача.



🧐 Я тут провожу ревизию файлов и обнаруживаю много одинаковых файлов, но они незначительно отличающихся именем, например:

IMG_2022.jpg и IMG_2022 (1).jpg

Книга.pdf и Книга(1).pdf

rename.exe и rename_1.exe



upd: нашел еще file_name.format и (1)_file_name.format



😎 Кто попробует написать скриптик, позволяющий избавиться от дубликатов?

Это может быть как радикальное решение — удаление всего, что покажется дублем, так и более лояльный фильтр, например, складывать "подозрительные" файлы в отдельную папку.



🤪 Исходное хранилище примерно 200 папок разного уровня вложенности в котором ≈40 тысяч файлов



😳 Язык программирования — любой