Программа для поиска дубликатов файлов в ROSA Linux

Ответить
Аватара пользователя
Диман
Сообщения: 6
Зарегистрирован: 20 июл 2022, 20:42
Operating system: ROSA Fresh Desktop 12.2

Программа для поиска дубликатов файлов в ROSA Linux

Сообщение Диман » 20 июл 2022, 21:04

Я новичок в linux:
Помогите пожалуйста найти программу для поиска дубликатов файлов, искать надо именно все типы файлов (аудио,видео,фото,... по содержимому, типа dupeGuru и подобных...)
Недавно установил ROSA Fresh Desktop 12 ,пытаюсь перейти с Windows на отечественный софт.
Пытаюсь восстановить привычный набор программ.

Может кто подскажет как корректно попросить разработчиков сделать подобную программу, мне кажется это очень нужная для всех программа!
Из за трудностей с софтом придётся наверно ставить две системы
Последний раз редактировалось Диман 22 июл 2022, 21:51, всего редактировалось 12 раз.

va9(2)
Сообщения: 800
Зарегистрирован: 20 окт 2015, 08:06
Operating system: RF.KDE5.2021.1.x86_64

Дубликаты файлов

Сообщение va9(2) » 21 июл 2022, 06:21

Диман писал(а):
20 июл 2022, 21:04
Помогите пожалуйста найти программу для поиска дубликатов файлов (типа dupeGuru и подобных)
dupeGuru кросплатформенная. Надо чтобы кто-нибудь ее собрал в репы.

В репах есть три проги без графического интерфейса:
duperemove
fdupes
freedups

Для поиска дубликатов изображений я использую geeqie.
$ - команда должна быть выполнена от имени непривилегированного пользователя,
# - команда должна быть выполнена от имени суперпользователя.

Mad AlexX
Сообщения: 61
Зарегистрирован: 16 окт 2014, 14:49
Operating system: Rosa, OpenSuse

Дубликаты файлов

Сообщение Mad AlexX » 21 июл 2022, 09:09

Можно ещё такую команду попробовать - тогда вообще ничего устанавливать не надо:

Код: Выделить всё

find /katalog/gde/iskat -type f -exec md5sum {} \; | sort | uniq -D --check-chars=32 > duplicates.txt
На выходе получим файл в котором будут перечислены файлы с совпадающими контрольными суммами.

Аватара пользователя
Диман
Сообщения: 6
Зарегистрирован: 20 июл 2022, 20:42
Operating system: ROSA Fresh Desktop 12.2

Дубликаты файлов

Сообщение Диман » 21 июл 2022, 09:58

va9(2) писал(а):
21 июл 2022, 06:21
Диман писал(а):
20 июл 2022, 21:04
Помогите пожалуйста найти программу для поиска дубликатов файлов (типа dupeGuru и подобных)
dupeGuru кросплатформенная. Надо чтобы кто-нибудь ее собрал в репы.

В репах есть три проги без графического интерфейса:
duperemove
fdupes
freedups

Для поиска дубликатов изображений я использую geeqie.
Спасибо огромное за ответ, но я пока не силен в командной строке, в графическом интерфейсе только
Искать надо именно все типы файлов (аудио,видео,фото,... по содержимому) :(

Аватара пользователя
algri14
Сообщения: 242
Зарегистрирован: 24 янв 2020, 16:47
Operating system: Mageia 8x86_64-KDE:
ROSA.FRESH.PLASMA5.12.3.x86_64
Откуда: г.Воронеж

Программа для поиска дубликатов файлов в ROSA Linux

Сообщение algri14 » 25 июл 2022, 16:10

Mad AlexX писал(а):
21 июл 2022, 09:09
Можно ещё такую команду попробовать - тогда вообще ничего устанавливать не надо:

Код: Выделить всё

find /katalog/gde/iskat -type f -exec md5sum {} \; | sort | uniq -D --check-chars=32 > duplicates.txt
На выходе получим файл в котором будут перечислены файлы с совпадающими контрольными суммами.
Проверил её у себя, сначала просто командой md5sum — суммы видео-файлов совпадают (у них только название разное), а вот в файле duplicates.txt по факту пуст=0
Mad AlexX, поясните пожалуйста свою команду, сам я в них полный профан, пока разберусь весь моСк сломаю, а иногда требуется найти одинаковые файлы.

Жаль что это всё не работает с видео-файлами одинаковыми по содержанию видео, но разными по размеру, такие только своими глазами разыскивать.

va9(2)
Сообщения: 800
Зарегистрирован: 20 окт 2015, 08:06
Operating system: RF.KDE5.2021.1.x86_64

Программа для поиска дубликатов файлов в ROSA Linux

Сообщение va9(2) » 25 июл 2022, 17:13

algri14 писал(а):
25 июл 2022, 16:10
Mad AlexX, поясните пожалуйста свою команду, сам я в них полный профан, пока разберусь весь моСк сломаю, а иногда требуется найти одинаковые файлы.

Код: Выделить всё

find /katalog/gde/iskat -type f -exec md5sum {} \; | sort | uniq -D --check-chars=32 > duplicates.txt
find - ищет файлы в указанном каталоге,
md5sum - вычисляет контрольные суммы найденных файлов,
sort - сортирует полученные суммы,
uniq - выводит повторяющиеся суммы,
> - записывает вывод команды uniq в файл.
algri14 писал(а):
25 июл 2022, 16:10
Проверил её у себя, сначала просто командой md5sum — суммы видео-файлов совпадают (у них только название разное), а вот в файле duplicates.txt по факту пуст=0
У меня сработала:

Код: Выделить всё

$ find . -type f -exec md5sum {} \; | sort | uniq -D --check-chars=32
6a79d151bc...83628e50c09e1  ./294793755_1410258119449788_8913571127724334622_n(1).jpg
6a79d151bc...83628e50c09e1  ./294793755_1410258119449788_8913571127724334622_n.jpg
В этом каталоге было 200 изображений.

Проверьте, указали ли верно путь и в искомой директории должны быть обычные файлы. Симлинки, например, find пропускает. Чтобы и они учитывались необходимо -type f заменить на \( -type l -o -type f \).
$ - команда должна быть выполнена от имени непривилегированного пользователя,
# - команда должна быть выполнена от имени суперпользователя.

Аватара пользователя
algri14
Сообщения: 242
Зарегистрирован: 24 янв 2020, 16:47
Operating system: Mageia 8x86_64-KDE:
ROSA.FRESH.PLASMA5.12.3.x86_64
Откуда: г.Воронеж

Программа для поиска дубликатов файлов в ROSA Linux

Сообщение algri14 » 25 июл 2022, 17:45

va9(2) писал(а):
25 июл 2022, 17:13
Проверьте, указали ли верно путь и в искомой директории должны быть обычные файлы.
Путь указан правильно, а вот файлы — это видео.mp4, может быть поэтому ничего не показало?
va9(2) писал(а):
25 июл 2022, 17:13
Симлинки, например, find пропускает. Чтобы и они учитывались необходимо -type f заменить на \( -type l -o -type f \).
За это отдельное спасибо

Аватара пользователя
algri14
Сообщения: 242
Зарегистрирован: 24 янв 2020, 16:47
Operating system: Mageia 8x86_64-KDE:
ROSA.FRESH.PLASMA5.12.3.x86_64
Откуда: г.Воронеж

Программа для поиска дубликатов файлов в ROSA Linux

Сообщение algri14 » 25 июл 2022, 18:15

Не могу понять, скопировал файл 1438400.jpg , дал другое имя 1438400A.jpg , текстовый файл (и консоль) в "хомяке" пустой ~/duplicates.txt , команда не работает:

Код: Выделить всё

[algri@localhost ~]$ find /home/algri/Изображения/1438400A.jpg -type f -exec md5sum {} \; | sort | uniq -D --check-chars=32 > duplicates.txt
[algri@localhost ~]$

Код: Выделить всё

[algri@localhost ~]$ md5sum /home/algri/Изображения/1438400A.jpg
3aa522dd961add67abd85cc58187f89a  /home/algri/Изображения/1438400A.jpg
[algri@localhost ~]$ md5sum /home/algri/Изображения/1438400.jpg
3aa522dd961add67abd85cc58187f89a  /home/algri/Изображения/1438400.jpg
где ошибка не могу понять…
в искомой директории есть подпапки, но это ведь не влияет

Аватара пользователя
algri14
Сообщения: 242
Зарегистрирован: 24 янв 2020, 16:47
Operating system: Mageia 8x86_64-KDE:
ROSA.FRESH.PLASMA5.12.3.x86_64
Откуда: г.Воронеж

Программа для поиска дубликатов файлов в ROSA Linux

Сообщение algri14 » 25 июл 2022, 19:32

Всё, нашёл где ступил.
В команде надо давать только путь до файла и в конце папки ставить слеш « / » , имя сравниваемого файла в путь не вставлять.
/home/algri/Изображения/ , правильный вид команды:

Код: Выделить всё

find /home/algri/Изображения/ -type f -exec md5sum {} \; | sort | uniq -D --check-chars=32 > duplicates.txt
Команда запишет вывод в /Домашняя папка/duplicates.txt (или что тоже самое ~/duplicates.txt) все файлы суммы которых md5sum одинаковы, если дать другую команду, на другое место, то файл duplicates.txt естественно перезапишется, а не дополнится

Видеофайлы, например в папке где их 25Гб, сравнивает довольно долго, минут 10, зависит от размера этих видео.
Опять же, если видео одинаково по содержанию, но одно весит 1Гб, другое 1,5 Гб, то команда тут не поможет, только своими глазами :(

va9(2)
Сообщения: 800
Зарегистрирован: 20 окт 2015, 08:06
Operating system: RF.KDE5.2021.1.x86_64

Программа для поиска дубликатов файлов в ROSA Linux

Сообщение va9(2) » 26 июл 2022, 04:17

algri14 писал(а):
25 июл 2022, 19:32
если дать другую команду, на другое место, то файл duplicates.txt естественно перезапишется, а не дополнится
Если замените > на >>, то будет дополняться.
algri14 писал(а):
25 июл 2022, 19:32
Видеофайлы, например в папке где их 25Гб, сравнивает довольно долго, минут 10, зависит от размера этих видео.
Это md5sum долго вычисление проводит. Сравнение полученных сумм занимает микросекунды.
$ - команда должна быть выполнена от имени непривилегированного пользователя,
# - команда должна быть выполнена от имени суперпользователя.

Mad AlexX
Сообщения: 61
Зарегистрирован: 16 окт 2014, 14:49
Operating system: Rosa, OpenSuse

Программа для поиска дубликатов файлов в ROSA Linux

Сообщение Mad AlexX » 26 июл 2022, 04:54

va9(2) писал(а):
25 июл 2022, 17:13
algri14 писал(а):
25 июл 2022, 16:10
Mad AlexX, поясните пожалуйста свою команду, сам я в них полный профан, пока разберусь весь моСк сломаю, а иногда требуется найти одинаковые файлы.

Код: Выделить всё

find /katalog/gde/iskat -type f -exec md5sum {} \; | sort | uniq -D --check-chars=32 > duplicates.txt
find - ищет файлы в указанном каталоге,
md5sum - вычисляет контрольные суммы найденных файлов,
sort - сортирует полученные суммы,
uniq - выводит повторяющиеся суммы,
> - записывает вывод команды uniq в файл.
Всё так, но для понимания логики всей конструкции добавил бы что uniq ищёт совпадения только для двух соседних строк поэтому перед поиском совпадений нужно отсортировать вывод find. И что касается "\;" - запомнить что это ставится всегда, когда использовался параметр -exec.

Аватара пользователя
algri14
Сообщения: 242
Зарегистрирован: 24 янв 2020, 16:47
Operating system: Mageia 8x86_64-KDE:
ROSA.FRESH.PLASMA5.12.3.x86_64
Откуда: г.Воронеж

Программа для поиска дубликатов файлов в ROSA Linux

Сообщение algri14 » 26 июл 2022, 19:52

va9(2) писал(а):
26 июл 2022, 04:17
Если замените > на >>, то будет дополняться.
Mad AlexX писал(а):
26 июл 2022, 04:54
Всё так, но для понимания логики всей конструкции добавил бы что uniq ищёт совпадения только для двух соседних строк поэтому перед поиском совпадений нужно отсортировать вывод find. И что касается "\;" - запомнить что это ставится всегда, когда использовался параметр -exec.
Mad AlexX, va9(2), Спасибо за пояснения, а вообще жаль что у движка форума нет плагина "Спасибо". Некоторые принимают его только за градацию так сказать заслуг перед другими пользователями, но это отчасти. По этим "Спасибо" можно находить те или иные хорошие и полезные ответы на форуме, не конкретный поиск чего-либо, а просто из любопытства.
Ещё бы плагин "консоль" хотелось бы :D

зы: и исправьте команду в своих цитатах — добавьте в неё « / »

Mad AlexX
Сообщения: 61
Зарегистрирован: 16 окт 2014, 14:49
Operating system: Rosa, OpenSuse

Программа для поиска дубликатов файлов в ROSA Linux

Сообщение Mad AlexX » 27 июл 2022, 04:55

algri14 писал(а):
26 июл 2022, 19:52
зы: и исправьте команду в своих цитатах — добавьте в неё « / »
Если слеш в конце пути поиска: find /home/algri/Изображения/ то у меня одинаково отрабатывает, что со слешем в конце, что без него. Всегда find использовал без слеша в конце имени каталога и не замечал проблем.

Аватара пользователя
algri14
Сообщения: 242
Зарегистрирован: 24 янв 2020, 16:47
Operating system: Mageia 8x86_64-KDE:
ROSA.FRESH.PLASMA5.12.3.x86_64
Откуда: г.Воронеж

Программа для поиска дубликатов файлов в ROSA Linux

Сообщение algri14 » 27 июл 2022, 07:24

Mad AlexX писал(а):
27 июл 2022, 04:55
Если слеш в конце пути поиска: find /home/algri/Изображения/ то у меня одинаково отрабатывает, что со слешем в конце, что без него. Всегда find использовал без слеша в конце имени каталога и не замечал проблем.
Да, вы правы, но в прошлый раз команда никак не хотела работать без слеша в конце папки, что это было — не могу понять???

Дополнено:
algri14 писал(а):
27 июл 2022, 07:24
что это было — не могу понять???
предполагаю что при копировании команды недокопировал первую букву « f » и не заметил, вполне могло быть :D

Аватара пользователя
Диман
Сообщения: 6
Зарегистрирован: 20 июл 2022, 20:42
Operating system: ROSA Fresh Desktop 12.2

Программа для поиска дубликатов файлов в ROSA Linux

Сообщение Диман » 31 июл 2022, 17:12

Даааа, ребята, СПАСИБО ПОМОГЛИ!

va9(2)
Сообщения: 800
Зарегистрирован: 20 окт 2015, 08:06
Operating system: RF.KDE5.2021.1.x86_64

Программа для поиска дубликатов файлов в ROSA Linux

Сообщение va9(2) » 01 авг 2022, 08:14

Никто не хочет собрать dupeguru в репы, а других искальщиков с гуем там, вроде, нет.

Эта программа написана на питоне поэтому можете сами ее себе из исходников поставить.
Установите пакеты git и pip:

Код: Выделить всё

$ sudo dnf install git python3-pip
Скачайте исходники dupeguru:

Код: Выделить всё

$ git clone https://github.com/arsenetar/dupeguru.git
Перейдите в скачанный каталог:

Код: Выделить всё

$ cd dupeguru
Затем выполните эти команды:

Код: Выделить всё

$ python3 -m venv --system-site-packages ./env
$ source ./env/bin/activate
$ pip install -r requirements.txt
$ python build.py
Проверьте, работает ли:

Код: Выделить всё

$ python run.py
Если работает сделайте файл run.py исполняемым:

Код: Выделить всё

$ chmod +x run.py
В домашнем каталоге создайте директорию bin:

Код: Выделить всё

$ mkdir ~/bin
Сделайте символическую ссылку:

Код: Выделить всё

$ ln -s $PWD/run.py ~/bin/dupeguru
Откройте новую вкладку терминала и попробуйте запустить:

Код: Выделить всё

$ dupeguru
У меня работает.
Последний раз редактировалось va9(2) 07 дек 2023, 21:18, всего редактировалось 1 раз.
$ - команда должна быть выполнена от имени непривилегированного пользователя,
# - команда должна быть выполнена от имени суперпользователя.

Аватара пользователя
algri14
Сообщения: 242
Зарегистрирован: 24 янв 2020, 16:47
Operating system: Mageia 8x86_64-KDE:
ROSA.FRESH.PLASMA5.12.3.x86_64
Откуда: г.Воронеж

Программа для поиска дубликатов файлов в ROSA Linux

Сообщение algri14 » 01 авг 2022, 11:15

va9(2) писал(а):
01 авг 2022, 08:14
Никто не хочет собрать dupeguru в репы
Вообще-то программа так себе, функционал всего лишь найти дубликаты файлов, а настроек поналепили как для комбайна. Команда в консоли проще, а выполняет всё тоже самое.

va9(2), а Вы умеете собирать пакеты? это я к тому, что BoDun накидал код хорошей и простой утилитки DuplicatesFinder, функционал:
- поиск сравнения по md5sum
- контекстное меню для копирования
- сохранение вывода как в cvs, так и в txt
- таймер выполнения поиска
- прогресс-бар хода операции
- счётчик обрабатываемых файлов
- выбор цвета дубликатов и удаляемых файлов
Мне программка очень понравилась, простая, без "огородов", но функционал отличный.
Он сделал бинарник, но пакет собрать не получается (нет опыта), кое-что ещё по мелочи хочет добавить.
Как будет готово, то потребуется помощь собрать пакет, сегодня напишу ему или может быть он сам здесь увидит…

va9(2)
Сообщения: 800
Зарегистрирован: 20 окт 2015, 08:06
Operating system: RF.KDE5.2021.1.x86_64

Программа для поиска дубликатов файлов в ROSA Linux

Сообщение va9(2) » 01 авг 2022, 12:53

algri14 писал(а):
01 авг 2022, 11:15
программа так себе, функционал всего лишь найти дубликаты файлов
Она может искать похожие изображения с разным размером. Можно сразу визуально картинки сравнить. Уровень похожести настраиваемый.
Пример:
2022-08-01_1.png
algri14 писал(а):
01 авг 2022, 11:15
va9(2), а Вы умеете собирать пакеты?
Нет. Научиться есть желание, но времени на это пока нет.
$ - команда должна быть выполнена от имени непривилегированного пользователя,
# - команда должна быть выполнена от имени суперпользователя.

Аватара пользователя
algri14
Сообщения: 242
Зарегистрирован: 24 янв 2020, 16:47
Operating system: Mageia 8x86_64-KDE:
ROSA.FRESH.PLASMA5.12.3.x86_64
Откуда: г.Воронеж

Программа для поиска дубликатов файлов в ROSA Linux

Сообщение algri14 » 01 авг 2022, 15:56

va9(2) писал(а):
01 авг 2022, 12:53
Она может искать похожие изображения с разным размером. Можно сразу визуально картинки сравнить. Уровень похожести настраиваемый.
Это да, на этом в принципе и всё.
Музыку и видео таким образом не поищешь.
va9(2) писал(а):
01 авг 2022, 12:53
Нет. Научиться есть желание, но времени на это пока нет.
Жаль, у меня такая же басня, хотел бы, но не умею, а то графического ничего и нет.

va9(2)
Сообщения: 800
Зарегистрирован: 20 окт 2015, 08:06
Operating system: RF.KDE5.2021.1.x86_64

Программа для поиска дубликатов файлов в ROSA Linux

Сообщение va9(2) » 26 фев 2023, 18:31

algri14 писал(а):
01 авг 2022, 15:56
Музыку и видео таким образом не поищешь.
На гитхабе наткнулся на прогу которая называется czkawka. Написано, что может искать похожие фото, видео и музыку. Версия 5.1.0 appimage в росе не работает. Я потыкал минут 10 версию 4.0.0. Дубликаты видео с разными названиями и в разных контейнерах находит, но есть и ложные срабатывания. Конвертированную песню дубликатом не признала. Потом в виртуалке в каком-нибудь другом дистре последнюю версию потестирую.

Аватара пользователя
algri14
Сообщения: 242
Зарегистрирован: 24 янв 2020, 16:47
Operating system: Mageia 8x86_64-KDE:
ROSA.FRESH.PLASMA5.12.3.x86_64
Откуда: г.Воронеж

Программа для поиска дубликатов файлов в ROSA Linux

Сообщение algri14 » 26 фев 2023, 19:33

va9(2) писал(а):
26 фев 2023, 18:31
На гитхабе наткнулся на прогу которая называется czkawka.
Переводится как "икота", странное название. Версия 5.1.0 appimage_gui в Mageia-8 тоже не запустилась, походу библиотек не хватает,
4.0.0 работает, локализована, но вывод пишет на инглише — "Properly saved to file 87 cache entries.", не могу понять что это, куда и вообще, записано ли? если пишет, то куда?
В общем прога может и хорошая, но сильно навороченная, сейчас разбираться нет охоты. Сильно наворочена.
Локализована поляком и даже с буквой "ё", которую в последнее время русские и то почти не ставят, возможно кто-то из русских переводил, а поляк выложил.
Начало разработки октябрь 2020 года

Аватара пользователя
algri14
Сообщения: 242
Зарегистрирован: 24 янв 2020, 16:47
Operating system: Mageia 8x86_64-KDE:
ROSA.FRESH.PLASMA5.12.3.x86_64
Откуда: г.Воронеж

Программа для поиска дубликатов файлов в ROSA Linux

Сообщение algri14 » 27 фев 2023, 07:23

algri14 писал(а):
26 фев 2023, 19:33
Версия 5.1.0 appimage_gui в Mageia-8 тоже не запустилась, походу библиотек не хватает,
Версия 5.1.0 appimage_gui.AppImage — не хватает библиотеки libgtk-4, она есть в Solos (в Mageia её нет или название другое)
Версия 5.1.0 linux_czkawk_gui_alternative.AppImage — тоже не хватает библиотеки, есть glibc 2.32; нужна 2.34 и ещё про libgio пишет

Версия 4.0.0 работает, но выбранный каталог сканирует методом наоборот, т.е. галочку(чекбокс) НЕ НАДО ставить, оставить поле пустым, я такую фигню у французов видел, при настройке инета, нужный пункт оставляешь пуcтым, ненужный метишь галкой

Бегунок похожести "высокий" и "минимальный" — локализованы то ли наоборот, то ли фишка такая, выглядят так:
"Похожей Очень высокий" (здесь у бегунка 0 ) —далее сам бегунок от 0 до 20 — "Минимальный"
а должно быть так:
"Похожесть (или Сходство) Max" — бегунок — "Min"
Можно попробовать написать, но не знаю стоит ли связываться с поляками, в смысле сейчас нарываться на склоку. Или если до сих пор RU_локализацию не удалили, то на политику не смотрят, в общем не знаю, к тому же не видел что там в новой версии (самое главное)

Дополнено 27.02.23 - 18:41
algri14 писал(а):
27 фев 2023, 07:23
"Похожесть (или Сходство) Max" — бегунок — "Min"
В версии 4.1.0 уже попровлено на:
"Сходство Очень высокий — бегунок от 0(наилучшее сходство) до 20 — Минимальный"

По моему было бы лучше:
"Сходство Max — бегунок — Min"

Ответить

Вернуться в «Обсуждение ROSA Fresh R12 (платформа 2021.1)»