5 лучших инструментов для поиска и удаления повторяющихся файлов в Linux
Управление файлами само по себе является сложной задачей. Добавьте к этому большой объем повторяющихся файлов, которые обычно занимают место для хранения, и процесс становится все труднее.
Стандартный способ справиться с повторяющимися файлами – найти и удалить их вручную. Однако использование специальной программы для поиска дубликатов файлов может значительно ускорить процесс.
Итак, если вы планируете избавиться от повторяющихся файлов и очистить свой компьютер, вот список некоторых из лучших инструментов для поиска и удаления повторяющихся файлов в Linux.
1. Fslint
Fslint – это утилита на основе графического интерфейса и интерфейса командной строки для очистки вашей системы от разного рода беспорядка. Он называет этот беспорядок «пухом» и предлагает несколько инструментов, которые помогут вам выполнить множество задач, включая поиск дубликатов файлов, пустых каталогов и проблемных имен файлов.
Обладая графическим режимом работы и режимом командной строки, fslint упрощает новым пользователям Linux процесс освобождения памяти компьютера от всех видов системных линтов.
Чтобы получить доступ к fslint через графический интерфейс, все, что вам нужно сделать, это открыть терминал и запустить команду fslint-gui .
Что касается расширенной функциональности, программа предлагает 10 различных функций в режиме CLI, таких как findup, findu8, findnl, findtf и finded. Используя их, вы можете уточнить результаты поиска, чтобы повысить ваши шансы найти определенные типы повторяющихся файлов в вашей системе.
Как установить fslint
В дистрибутивах на основе Debian, таких как Ubuntu:
sudo apt install fslint
В дистрибутивах на основе RHEL, таких как CentOS и Fedora:
sudo yum install fslint
sudo dnf install fslint
В Arch Linux и Manjaro:
sudo pacman -S fslint
2. Fdupes
Fdupes – одна из самых простых программ для выявления и удаления дубликатов файлов, находящихся в каталогах. Выпущено под лицензией MIT на GitHub, бесплатно и с открытым исходным кодом.
Программа работает с использованием подписи md5sum и проверки побайтного сравнения для определения повторяющихся файлов в каталоге. При необходимости вы также можете выполнять рекурсивный поиск, отфильтровывать результаты поиска и получать сводное представление об обнаруженных повторяющихся файлах.
После того, как вы определили повторяющиеся файлы в каталоге, вы можете использовать fdupes, чтобы либо удалить файлы, либо заменить их ссылками на исходный файл.
Установка Fdupes
В дистрибутивах на основе Debian:
sudo apt install fdupes
В дистрибутивах на основе RHEL:
sudo yum install fdupes
sudo dnf install fdupes
Для установки в Arch Linux и Manjaro:
sudo pacman -S fdupes
3. Rdfind
Rdfind – еще одна утилита Linux, которая поможет вам найти на вашем компьютере избыточные файлы в разных каталогах. Он основан на сравнении файлов на основе их содержимого, а не имени, для выявления дубликатов, что делает его более эффективным в своей работе.
Для этого программа работает, ранжируя одинаковые файлы в каталоге и определяя оригинал и дубликаты: файл с самым высоким рейтингом выбирается как оригинал, а остальные – дубликаты.
Кроме того, rdfind также может вычислять контрольные суммы для сравнения файлов при необходимости. И что самое приятное, он сохраняет отсканированные результаты в файл results.txt в домашнем каталоге, поэтому вы можете обратиться к нему, когда собираетесь удалить дубликаты, чтобы убедиться, что вы не удалите неправильные.
Конечно, как и большинство других средств поиска дубликатов файлов, rdfind также предлагает некоторые препроцессоры для сортировки файлов, игнорирования пустых файлов или установки символических ссылок. И последнее, но не менее важное: есть возможность удалить повторяющиеся файлы.
Как установить rdfind
В Debian / Ubuntu:
sudo apt install rdfind
В Fedora / CentOS:
sudo dnf install rdfind
4. DupeGuru
DupeGuru – это кроссплатформенный инструмент для поиска и удаления дубликатов файлов на вашем компьютере. Одна из его лучших характеристик – возможность настроить механизм сопоставления в соответствии с вашими предпочтениями, чтобы увеличить ваши шансы найти правильный тип повторяющихся файлов в каталоге. И, как и несколько других программ поиска дубликатов, он также предлагает графический интерфейс для облегчения операций.
Говоря о функциональности, dupeGuru использует свой алгоритм нечеткого сопоставления для сканирования имен файлов или содержимого файлов и быстрого и эффективного поиска дубликатов.
Кроме того, он также хорошо справляется с музыкой и информацией об изображениях, что дает ему преимущество перед другими поисковиками дубликатов файлов. Более того, при необходимости у вас есть возможность настроить его механизм сопоставления, чтобы найти именно тот тип повторяющихся файлов, которые вы хотите удалить.
DupeGuru также позволяет удалять повторяющиеся файлы. И для этого у него есть справочная система каталогов, которая предотвращает случайное удаление неправильных файлов. Помимо удаления, есть возможность переместить или скопировать их в другое место.
Установка DupeGuru
В дистрибутивах на основе Debian:
sudo add-apt-repository ppa:dupeguru/ppa
sudo apt-get update
sudo apt-get install dupeguru
В Arch Linux:
sudo pacman -S dupeguru
5. Рмлинт
Rmlint – это еще один инструмент для поиска и удаления копий, а не просто дубликатов файлов для Linux. Его можно использовать бесплатно, и он очень быстро обнаруживает повторяющиеся файлы и каталоги в вашей системе. Вы также получаете поддержку формата хранения Btrfs, что выделяет его среди других инструментов в этом списке.
Кстати, некоторые из других аспектов, в которых rmlint превосходит другие конкурирующие инструменты для удаления дубликатов файлов, включают в себя возможность поиска файлов на основе определенного периода времени, поиск файлов с неработающими идентификаторами пользователей / групп и поиск неизолированных двоичных файлов, которые занимают много места. пространства. Кроме того, как и несколько других программ, он также сохраняет отсканированные результаты в файлы rmlint.json и rmlint.sh , которые могут пригодиться во время операции удаления.
Однако обратите внимание, что, в отличие от других инструментов, rmlint не самый простой в использовании: он генерирует сценарий для удаления дубликатов, который требует некоторого уровня понимания для эффективного использования.
Как установить rmlint
В дистрибутивах на основе Debian:
sudo apt install rmlint
В Fedora и CentOS:
sudo yum install rmlint
sudo dnf install rmlint
В дистрибутивах на основе Arch, таких как Manjaro:
sudo pacman -S rmlint
Защита от дублирующихся файлов в Linux
Используя перечисленные выше программы поиска дубликатов файлов, вы можете легко определить дубликаты файлов, которые могут занимать место на вашем компьютере, и полностью удалить их. Тем не менее, небольшой совет при работе с такими инструментами: будьте особенно осторожны с вашими действиями, чтобы избежать удаления важных файлов и документов в вашей системе.
Если вы немного скептически относитесь к тому, какие файлы удалить, а какие оставить, обязательно сделайте резервную копию всех данных в вашей системе, чтобы быть в безопасности.