Deteksi duplikasi file

Walau sudah ada tools yang secara langsung mengetahui duplikasi file di linux, saya lebih suka menggunakan tools bawaan Slackware. Tools yang umum digunakan antara lain fslint, fdupes atau jdupes. Adapun tools yang biasa saya gunakan

  1. sha512sum
  2. awk
  3. uniq
  4. grep

Misalkan, akan mencari adakah duplikasi file di folder Downloads. Pertama, catat dulu hash-nya. Di sini saya gunakan sha512. Kumpulan sha512 tersebut disatukan dalam file downloads.sha512. File ini terdiri dari 2 kolom. Kolom pertama berisi hash, sedangkan kolom kedua nama filenya.

sha512sum Downloads/* > downloads.sha512

Selanjutnya difilter berdasarkan hash atau kolom pertama yang kemudian dicek keunikannya. Kalau ada hash yang sama akan tampil karena menunjukkan file yang sama.

awk '{ print $1 }' downloads.sha512|uniq -d

Kemudian, untuk mengetahui file mana saja yang sama

grep "[tulis hash nya di sini]" downloads.sha512 

 Share!

 
comments powered by Disqus