Comment utiliser la commande find sous Linux
Agence web » Actualités du digital » Comment utiliser la commande find sous Linux

Comment utiliser la commande find sous Linux

Le Linux find La commande est idéale pour rechercher des fichiers et des répertoires. Mais vous pouvez également transmettre les résultats de la recherche à d’autres programmes pour un traitement ultérieur. Nous vous montrons comment.

La commande de recherche de Linux

Le Linux find la commande est puissante et flexible. Il peut rechercher des fichiers et des répertoires en utilisant toute une série de critères différents, pas seulement des noms de fichiers. Par exemple, il peut rechercher des fichiers vides, des fichiers exécutables ou des fichiers appartenant à un utilisateur particulier. Il peut trouver et répertorier les fichiers en fonction de leurs heures d’accès ou de modification, vous pouvez utiliser des modèles regex, il est récursif par défaut et il fonctionne avec des pseudo-fichiers comme des canaux nommés (tampons FIFO).

Tout cela est incroyablement utile. Les humbles find commande emballe vraiment une certaine puissance. Mais il existe un moyen de tirer parti de ce pouvoir et de faire passer les choses à un autre niveau. Si nous pouvons prendre la sortie du find commande et l’utiliser automatiquement comme entrée d’autres commandes, nous pouvons faire en sorte que quelque chose arrive aux fichiers et aux répertoires qui se découvrent pour nous.

Le principe de rediriger la sortie d’une commande vers une autre commande est une caractéristique essentielle des systèmes d’exploitation dérivés d’Unix. Le principe de conception consistant à faire en sorte qu’un programme fasse une chose et la fasse bien, et s’attendre à ce que sa sortie puisse être l’entrée d’un autre programme – même un programme non encore écrit – est souvent décrit comme la « philosophie Unix ». Et pourtant, certains utilitaires de base, comme mkdir, n’accepte pas l’entrée canalisée.

Pour remédier à cette lacune, le xargs La commande peut être utilisée pour fragmenter l’entrée transmise et pour l’alimenter dans d’autres commandes comme s’il s’agissait de paramètres de ligne de commande pour cette commande. Cela permet d’obtenir presque la même chose que la tuyauterie simple. C’est « presque la même » chose, et pas « exactement la même chose » car il peut y avoir des différences inattendues avec les extensions de shell et l’agrégation de noms de fichiers.

Utiliser find avec xargs

On peut utiliser find avec xargs à une action effectuée sur les fichiers trouvés. C’est un long chemin à parcourir, mais nous pourrions alimenter les fichiers trouvés par find dans xargs , qui les dirige ensuite vers tar pour créer un fichier archive de ces fichiers. Nous exécuterons cette commande dans un répertoire contenant de nombreux fichiers PAGE du système d’aide.

find ./ -name "*.page" -type f -print0 | xargs -0 tar -cvzf page_files.tar.gz

Canaliser la sortie de find via xargs et dans tar

La commande est composée de différents éléments.

  • find ./ -name « *.page » -type f -print0: L’action de recherche commencera dans le répertoire actuel, en recherchant par nom les fichiers qui correspondent à la chaîne de recherche « *.page ». Les répertoires ne seront pas répertoriés car nous lui disons spécifiquement de rechercher uniquement des fichiers, avec -type f. le print0 l’argument raconte find pour ne pas traiter les espaces comme la fin d’un nom de fichier. Cela signifie que les noms de fichiers contenant des espaces seront traités correctement.
  • xargs -o: Le -0 arguments xargs pour ne pas traiter les espaces comme la fin d’un nom de fichier.
  • tar -cvzf fichiers_page.tar.gz: c’est la commande xargs va alimenter la liste des fichiers de find à. L’utilitaire tar créera un fichier d’archive appelé « page_files.tar.gz ».

On peut utiliser ls pour voir le fichier d’archive qui est créé pour nous.

ls *.gz

Le fichier d'archive créé en canalisant la sortie de find via xargs et dans tar

Le fichier d’archive est créé pour nous. Pour que cela fonctionne, tous les noms de fichiers doivent être transmis à tar en masse, c’est ce qui s’est passé. Tous les noms de fichiers ont été marqués à la fin du tar commande comme une très longue ligne de commande.

Vous pouvez choisir d’exécuter la commande finale sur tous les noms de fichiers à la fois ou d’être invoquée une fois par nom de fichier. Nous pouvons voir la différence assez facilement en canalisant la sortie de xargs à l’utilitaire de comptage de lignes et de caractères wc.

Cette commande dirige tous les noms de fichiers dans wc immediatement. Effectivement, xargs construit une longue ligne de commande pour wc avec chacun des noms de fichiers qu’il contient.

find . -name "*.page" -type f -print0 | xargs -0 wc

Canaliser plusieurs noms de fichiers vers wc à la fois

Les lignes, mots et caractères de chaque fichier sont imprimés, ainsi qu’un total pour tous les fichiers.

Statistiques de nombre de mots pour de nombreux fichiers, avec un total pour tous les fichiers

Si nous utilisons xarg‘s -I (remplacer la chaîne) et définissez un jeton de chaîne de remplacement, dans ce cas ” {}« – le jeton est remplacé dans la commande finale par chaque nom de fichier à son tour. Ça signifie wc est appelé à plusieurs reprises, une fois pour chaque fichier.

find . -name "*.page" -type f -print0 | xargs -0 -I "{}" wc "{}"

Utilisation d'une chaîne de remplacement pour envoyer les noms de fichiers à un wc un à la fois

La sortie n’est pas bien alignée. Chaque invocation de wc fonctionne sur un seul fichier donc wc n’a rien pour aligner la sortie. Chaque ligne de sortie est une ligne de texte indépendante.

Sortie de plusieurs appels de wc

Parce que wc ne peut fournir un total que lorsqu’il opère sur plusieurs fichiers à la fois, nous n’obtenons pas les statistiques récapitulatives.

L’option find -exec

le find La commande a une méthode intégrée d’appel de programmes externes pour effectuer un traitement supplémentaire sur les noms de fichiers qu’elle renvoie. le -exec (exécuter) a une syntaxe similaire mais différente de celle de xargs commander.

find . -name "*.page" -type f -exec wc -c "{}" ;

Utilisation de -exec pour envoyer des noms de fichiers uniques à wc

Cela comptera les mots dans les fichiers correspondants. La commande est constituée de ces éléments.

  • trouver .: Lancer la recherche dans le répertoire courant. le find La commande est récursive par défaut, donc les sous-répertoires seront également recherchés.
  • -nom « *.page »: Nous recherchons des fichiers dont les noms correspondent à la chaîne de recherche « *.page ».
  • -type f: Nous recherchons uniquement des fichiers, pas des répertoires.
  • -exec wc: Nous allons exécuter le wc sur les noms de fichiers qui correspondent à la chaîne de recherche.
  • -w: Toutes les options que vous souhaitez transmettre à la commande doivent être placées immédiatement après la commande.
  • « {} »: L’espace réservé « {} » représente chaque nom de fichier et doit être le dernier élément de la liste des paramètres.
  • ;: Un point-virgule « ; » est utilisé pour indiquer la fin de la liste des paramètres. Il doit être échappé avec une barre oblique inverse «  » afin que le shell ne l’interprète pas.

Lorsque nous exécutons cette commande, nous voyons la sortie de wc. le -c (nombre d’octets) limite sa sortie au nombre d’octets dans chaque fichier.

La sortie de l'utilisation de -exec pour envoyer de nombreux noms de fichiers uniques à wc

Comme vous pouvez le voir, il n’y a pas de total. le wc la commande est exécutée une fois par nom de fichier. En substituant un signe plus « +« pour le point-virgule de fin »; » nous pouvons changer -execcomportement de pour opérer sur tous les fichiers à la fois.

find . -name "*.page" -type f -exec wc -c "{}" +

Utilisation de -exec pour envoyer tous les noms de fichiers à wc à la fois

Nous obtenons le total récapitulatif et les résultats soigneusement tabulés qui nous indiquent que tous les fichiers ont été transmis à wc comme une longue ligne de commande.

Sortie de l'utilisation de -exec pour envoyer tous les noms de fichiers à wc à la fois

exec signifie vraiment exec

le -exec (exécuter) ne lance pas la commande en l’exécutant dans le shell actuel. Il utilise l’exécutable intégré de Linux pour exécuter la commande, remplaçant le processus actuel (votre shell) par la commande. Ainsi, la commande qui est lancée ne s’exécute pas du tout dans un shell. Sans shell, vous ne pouvez pas obtenir l’expansion shell des caractères génériques, et vous n’avez pas accès aux alias et aux fonctions shell.

Cet ordinateur a une fonction shell définie appelée words-only. Cela ne compte que les mots dans un fichier.

function words-only () 
{ 
  wc -w $1
}

Une fonction étrange peut-être, « words-only » est beaucoup plus long à taper que « wc -w » mais au moins cela signifie que vous n’avez pas besoin de vous souvenir des options de ligne de commande pour wc. Nous pouvons tester ce qu’il fait comme ceci:

words-only user_commands.pages

Utiliser une fonction shell pour compter les mots dans un seul fichier

Cela fonctionne très bien avec une invocation de ligne de commande normale. Si nous essayons d’invoquer cette fonction en utilisant find‘s -exec option, ça va échouer.

find . -name "*.page" -type f -exec words-only "{}" ;

Essayer d'utiliser une fonction shell avec -exec

le find la commande ne peut pas trouver la fonction shell, et le -exec l’action échoue.

-exec ne parvient pas à trouver la fonction shell, car find ne s'exécute pas dans un shell

Pour surmonter cela, nous pouvons avoir find lancez un shell Bash et transmettez-lui le reste de la ligne de commande en tant qu’arguments du shell. Nous devons placer la ligne de commande entre guillemets doubles. Cela signifie que nous devons échapper aux guillemets doubles qui entourent le « {}” remplace la chaîne.

Avant de pouvoir exécuter le find commande, nous devons exporter notre fonction shell avec la -f (en fonction) option :

export -f words-only
find . -name "*.page" -type f -exec bash -c "words-only "{}"" ;

Utilisation de find pour lancer un shell pour exécuter la fonction shell dans

Cela fonctionne comme prévu.

La fonction shell appelée dans un nouveau shell

Utiliser le nom de fichier plusieurs fois

Si vous souhaitez enchaîner plusieurs commandes, vous pouvez le faire, et vous pouvez utiliser le « {}” remplace la chaîne dans chaque commande.

find . -name "*.page" -type f -exec bash -c "basename "{}" && words-only "{}"" ;

Si nous cd monter d’un niveau dans le répertoire « pages » et exécuter cette commande, find découvrira toujours les fichiers PAGE car il recherche de manière récursive. Le nom de fichier et le chemin sont transmis à notre words-only fonctionner comme avant. Pour des raisons purement de démonstration en utilisant -exec avec deux commandes, nous appelons également le basename commande pour voir le nom du fichier sans son chemin.

Les deux basename commande et le words-only fonction shell ont les noms de fichiers qui leur sont transmis à l’aide d’un « {}” remplace la chaîne.

Appel de la commande basename et de la fonction shell mots uniquement à partir du même appel -exec

Chevaux de course

Il y a une charge CPU et une pénalité de temps pour l’appel répété d’une commande alors que vous pouvez l’appeler une fois et lui transmettre tous les noms de fichiers en une seule fois. Et si vous appelez un nouveau shell à chaque fois pour lancer la commande, cette surcharge s’aggrave.

Mais parfois, selon ce que vous essayez d’accomplir, vous n’avez peut-être pas d’autre option. Quelle que soit la méthode requise par votre situation, personne ne devrait être surpris que Linux offre suffisamment d’options pour que vous puissiez trouver celle qui convient à vos besoins particuliers.

★★★★★