Qu'est-ce que les métadonnées ?
Agence web » Actualités du digital » Qu’est-ce que les métadonnées ?

Qu’est-ce que les métadonnées ?

Même si vous n’avez jamais entendu le terme métadonnées, vous le connaissez certainement – vous l’utilisez probablement tous les jours sans même vous en rendre compte. Les métadonnées sont l’une de ces choses essentielles qui parviennent à se cacher à la vue de tous.

Qu’est-ce que les métadonnées ?

Les métadonnées sonnent comme un terme intimidant, mais ce n’est pas le cas – les métadonnées ne sont que des données qui décrivent d’autres données.

À bien des égards, les métadonnées ressemblent beaucoup à un permis de conduire ou à un autre type d’identifiant que vous connaissez bien. Une pièce d’identité officielle contiendra généralement votre date de naissance, votre taille, la couleur de vos yeux, une photo et d’autres informations vous concernant. Les métadonnées remplissent un rôle similaire pour les fichiers numériques trouvés sur les ordinateurs. Les métadonnées décrivent généralement la date de création d’un fichier ou d’un dossier, la date de sa dernière modification et d’autres attributs importants à son sujet.

Différents types de fichiers auront souvent des métadonnées différentes. Voici quelques exemples spécifiques de métadonnées que vous pourriez trouver attachées à des fichiers communs.

Exemples de métadonnées

Les informations stockées sous forme de métadonnées varient considérablement d’un type de fichier à l’autre. Comme vous pouvez l’imaginer, les images ou les images ont besoin de métadonnées différentes de, par exemple, un document texte.

Photos et vidéo

Supposons que vous ayez fait une randonnée en utilisant le GPS de votre téléphone pour vous guider. Pendant votre voyage, vous avez sorti votre téléphone et pris une photo d’un animal, d’un champignon étrange ou d’une vue panoramique. Dès que vous prenez la photo, des informations y sont attachées : les paramètres de l’appareil photo, notamment la durée d’exposition, l’ISO, le F-stop, le fabricant de l’appareil photo, l’heure à laquelle l’image a été prise, et éventuellement les coordonnées GPS du caméra lorsque l’image a été capturée.

Une fois ces données enregistrées, elles peuvent être utilisées pour trier et catégoriser les images. L’application de galerie de photos sur votre téléphone en est un bon exemple. Vous pouvez trier vos images par date et, si la géolocalisation est activée, même par emplacement. Les applications de galeries de photos modernes peuvent même joindre des données supplémentaires qui décrivent le contenu d’une image, comme « Nourriture », « Animaux de compagnie » ou le nom d’une personne spécifique. C’est ce qui vous permet de rechercher des images sur votre téléphone en fonction de leur contenu. Voici un exemple de photo prise avec le GPS d’un téléphone activé :

Un grand immeuble dans une ville.

Vous pouvez visualiser directement les métadonnées d’une image sur votre téléphone ou votre PC.

Certaines métadonnées que vous pourriez trouver dans une photo prise par un téléphone portable.

Les métadonnées GPS attachées à l’image sont aussi précises que le GPS de votre téléphone portable, mais dans la plupart des cas, elles sont précises à quelques mètres près.

Parfois, des métadonnées de localisation sont intégrées dans les images.

Les fichiers vidéo contiendront une grande partie des mêmes informations, puis quelques informations supplémentaires concernant la fréquence d’images et l’audio associés à la vidéo.

l’audio

Les métadonnées audio incluront les éléments habituels, comme la date de création du fichier, mais elles enregistrent également des informations spécifiques aux fichiers audio. Les métadonnées des fichiers audio contiennent généralement des informations sur l’artiste, l’album, le numéro et le nom de la piste, ainsi que des informations sur l’audio lui-même, comme le débit binaire, la profondeur de bits et la fréquence d’échantillonnage.

messages

Les messages que vous envoyez à d’autres personnes ont également des métadonnées associées. Des exemples typiques de métadonnées jointes aux messages sont l’heure d’envoi, le destinataire et les informations sur les pièces jointes éventuelles du message. Certaines applications de messagerie peuvent également intégrer des métadonnées supplémentaires dans leurs messages, comme l’heure de réception et les réactions emoji.

Extensions de fichiers

Un type de métadonnées particulièrement important est l’extension de fichier. Les extensions de fichiers sont des choses comme PNG, TXT, DOCX, JPG, MP3, etc. L’extension de fichier permet à Windows de savoir à quel type de données s’attendre et comment ouvrir le fichier. Sans cela, Windows ne pourra pas automatiquement savoir comment l’ouvrir et vous devrez lui dire manuellement d’ouvrir le fichier à l’aide d’un programme spécifique.

Noter: Tous les systèmes d’exploitation n’utilisent pas les extensions de fichier pour stocker les métadonnées de format de fichier.

Fichiers informatiques divers

La plupart des fichiers ont des métadonnées assez spécifiques au type de fichier, cependant, certaines métadonnées sont fondamentalement universelles. Si vous vérifiez les propriétés de presque n’importe quel fichier sur votre PC, quel que soit le type de fichier, vous verrez des informations sur l’endroit où le fichier est stocké, quand il a été créé, quand il a été accédé, quand il a été modifié et quand il a été établi. Voici un exemple de Windows 10 :

Fenêtre Propriétés de Windows 10 affichant des métadonnées sur un fichier.

Comment les métadonnées sont-elles utilisées par les particuliers ?

Si vous utilisez un ordinateur moderne, quel qu’il soit, y compris un téléphone portable, vous utilisez régulièrement des métadonnées. Les métadonnées sont ce qui vous permet de trier vos fichiers selon leur type. C’est ce qui vous permet de classer vos fichiers par « Date de création », « Date de modification » ou « Date d’accès ». La plupart des lecteurs multimédias modernes vous permettent de répertorier votre musique par débit binaire ou de trier votre bibliothèque de films en catégories en fonction de la résolution. Les sites Web contiennent souvent des « balises méta », un type spécifique de métadonnées trouvées dans l’en-tête d’un site Web et utilisées pour décrire le contenu de la page Web à un moteur de recherche.

Chaque fois que vous catégorisez des fichiers, des dossiers ou des sites Web, vous vous fiez aux métadonnées.

Comment les métadonnées sont-elles utilisées autrement ?

Les individus utilisent les métadonnées de manière spécifique, mais qu’en est-il de la vue d’ensemble ? Chaque chose que vous faites sur un ordinateur génère des données et des métadonnées. Considérez qu’il y a des dizaines de milliards d’ordinateurs en service aujourd’hui, dont quelque six à sept milliards de smartphones – nous créons collectivement une quantité insondable de métadonnées chaque jour.

Cibler les publicités et le contenu sur des personnes spécifiques

Cette information n’est pas simplement rejetée. Une grande partie de ces données est introduite dans des algorithmes sophistiqués et des modèles d’apprentissage automatique à des fins d’analyse. Ce qui se passe alors dépend vraiment de qui a collecté les métadonnées et de ce qu’ils veulent apprendre – cela peut être utilisé pour tout analyser, du comportement d’un individu aux plus grands modèles et tendances de la société.

Les cas d’utilisation les plus visibles sont la publicité ciblée et les suggestions de contenu personnalisées. Avez-vous déjà trouvé votre flux de médias sociaux chargé de publicités liées à quelque chose que vous avez recherché sur votre téléphone ? Avez-vous cliqué sur quelque chose d’inhabituel sur YouTube pour constater que vos suggestions changent pour inclure plus de résultats comme la chose sur laquelle vous venez de cliquer ? C’est-à-dire l’algorithme au travail, parcourir les données et les métadonnées qui vous sont associées pour afficher les résultats qu’il « pense » attirera probablement votre attention et vous incitera à cliquer.

L’utilisation de métadonnées pour accroître l’engagement des utilisateurs a des conséquences indésirables. Plus particulièrement, il a tendance à favoriser le contenu qui est émotionnellement extrême : il vous fait vous sentir vraiment bien ou vraiment mal – l’un ou l’autre cas est généralement plus stimulant que le contenu factuel. C’est une grande partie de ce qui rend le défilement insensé sur les réseaux sociaux si incroyablement addictif.

Cela se traduit également parfois par des publicités que les gens trouvent assez envahissantes – rien de tel que de consulter WebMD lorsque vous vous sentez mal pour trouver votre chronologie Facebook chargée de publicités pour des médicaments traitant une longue liste de conditions qui expliquent vos symptômes.

Noter: Facebook a promis de limiter certaines publicités liées à la médecine, entre autres, et a précédemment ajouté des restrictions supplémentaires à la publicité pharmaceutique. Nous verrons comment ces changements se dérouleront à l’avenir.

Bien sûr, même si les politiques des médias sociaux changent et que ces choses cessent d’apparaître sur vos flux de médias sociaux, cela ne nie pas le fait que l’information est disponible et généralement disponible pour le plus offrant. Historiquement, une grande partie de vos données sensibles a été légalement protégée – par exemple, aux États-Unis, HIPAA protège vos informations médicales contre la transmission ou l’utilisation, sauf dans des conditions très spécifiques. Cependant, peu de protections de ce type existent pour les informations extraites de vos métadonnées dans la plupart des juridictions, bien que cela soit en train de changer.

Les métadonnées sont collectées pour la surveillance

Il existe de nombreuses utilisations des métadonnées en plus de la publicité et du ciblage du contenu. La surveillance est l’une des plus controversées. Edward Snowden a lancé une énorme controverse lorsqu’il a fourni la preuve que la National Security Administration des États-Unis collectait des métadonnées à partir de centaines de millions de messages texte chaque jour, entre autres choses.

La police peut faire quelque chose de similaire, bien qu’à une échelle beaucoup plus petite, en utilisant une tour en galuchat. Les tours Stingray se font passer pour de véritables tours de téléphones portables afin que le trafic cellulaire à proximité soit acheminé à travers elles. Dans ce cas, le type de données capturées peut varier – tout ce qui est transmis non crypté sera probablement entièrement lisible, alors que seules certaines métadonnées seront exposées si les communications sont cryptées.

Noter: Certaines applications de messagerie (comme Signal) font tout leur possible pour minimiser la quantité de métadonnées non cryptées, et elles disent qu’elles ne stockent pas non plus de métadonnées.

Même sans le contenu réel de vos messages, il y a plus qu’assez d’informations disponibles dans les métadonnées pour déterminer avec qui vous vous associez, quand vous leur parlez, et potentiellement même pour glaner vos mouvements.

Les métadonnées sont-elles un problème de confidentialité ?

La plupart des fichiers numériques sont associés à des métadonnées – parfois le fichier lui-même contient des métadonnées, d’autres fois, les métadonnées sont stockées séparément par le système d’exploitation. La majorité des vidéos et des images téléchargées sur Internet voient désormais leurs métadonnées supprimées automatiquement – tous les principaux sites de médias sociaux et la plupart des plates-formes d’hébergement d’images suppriment les métadonnées, tout comme la plupart des applications de chat modernes, notamment Slack, Discord, WhatsApp, Facebook Messenger, Signal, et Télégramme.

Avertissement: Le téléchargement de vos photos sur un service de stockage en nuage ne supprimera pas les métadonnées, alors soyez prudent lorsque vous partagez des photos de cette façon. L’envoi d’images par e-mail ne supprimera pas non plus les métadonnées.

Plus important encore, tout ce que vous faites génère des métadonnées. Les métadonnées sont créées chaque fois que vous transmettez ou recevez des données sur un réseau cellulaire ou sur Internet. Ces données sont collectées par les gouvernements et les entreprises privées et peuvent être utilisées pour analyser le comportement d’individus ou de groupes.

Considérant à quel point les métadonnées sont omniprésentes – et à quel point elles peuvent être révélatrices – il s’agit sans équivoque d’un problème de confidentialité.

La plupart des appareils intelligents collectent des informations sur l’utilisation, et l’Internet des objets (IoT) est sur le point d’augmenter la quantité de données et de métadonnées collectées. Vos métadonnées peuvent souvent être aussi révélatrices que vos données. Prenez les mesures que vous pouvez pour protéger votre vie privée et faites preuve de prudence lorsque vous téléchargez des informations sur Internet.

★★★★★