Après avoir aspiré un site avec Httrack, j’ai voulu connaître le nombre de pages .html, le nombre de fichier .jpg dans le répertore et tous les sous-répertoires afin d’estimer le temps de travail pour reconstruire ce site.

Après s’être placé dans le bon répertoire, une seule commande en console suffit pour obtenir très rapidement ces résultats :

$ find . -type f -name "*.*"|awk -F. '{a[$NF]++;} END{for (i in a) print a[i],i;}'

Immédiatement, la console me retourne le nombre de fichiers par extensions.

1966 jpg
1 log
3 gif
1 lst
1 zip
65 html
4 txt
1 ini

Magique non ? 😆