Code-Garage #35 - Qu'est-ce qu'une métadonnée ?

Durée: 5m27s

Date de sortie: 10/10/2022

Une métadonnée donnée est une donnée qui décrit une donnée... Mais qu'est-ce que ça signifie exactement, et quelles sont les métadonnées indispensables en informatique ?

Notes de l'épisode :

Salut, c'est Nicolas Bondam Bernhardt et bienvenue dans ce nouvel épisode du podcast
de Code Garage.
Aujourd'hui, on va parler de ce qu'est une métadonnée.
Donc d'après Wikipédia, méta, c'est un préfixe qui vient du grec, méta, et qui
signifie après, au-delà avec.
Et ça équivaut à l'époque au concept de réflexion ou encore de profondeur.
Mais ça, ça ne nous rend pas vraiment les choses plus claires.
Pour définir, pour décrire le concept de métadonnée en quelques mots, on pourrait donner
la définition suivante.
C'est une métadonnée, c'est une information qui décrit une ressource, donc une donnée,
un document peu importe, ou qui lui donne du contexte.
On va souvent parler de données qui décrit une donnée.
Les métadonnées sont des informations indispensables.
Une donnée informatique dans la majorité des cas est inutilisable si elle est stockée
sans aucune métadonnée pour lui donner du contexte.
Si on prend, par exemple, l'exemple d'un simple fichier stocké sur le disque d'une
ordinateur, et bien simplement pour qu'il soit lu par le système d'exploitation, ce
fichier-là, il a déjà besoin de trois métadonnées indispensables.
Le nom et l'emplacement du fichier, ça, ça fait un, son poids, il faut qu'il sache
où lire, à partir de quand lire et jusqu'où s'arrêter, et son format.
Est-ce que c'est du texte, c'est du document, est-ce que c'est une archive, etc.
Une fois ouverte, c'est, par exemple, on va dire un document texte où sont inscrits
des documents et des sommes d'argent.
C'est pareil, sans métadonnée supplémentaire, ce fichier, il est lisible, certes, mais il
est inutile.
Il deviendra intéressant, une fois que deux nouvelles métadonnées auront été découvertes,
que le titre du document en question, c'est salaire de 2021, et que l'auteur, c'est
John Doe, par exemple.
Donc, je pense que vous aurez compris, c'est grâce, non pas seulement au contenu du document,
mais également aux métadonnées qu'il décrive, qu'on peut avoir suffisamment d'informations
sur ce fichier pour comprendre son contenu et qu'il est réellement de la valeur.
Alors, les exemples dans cet épisode que je prends, ça concerne des fichiers, mais
n'importe quelle donnée peut être associée à des métadonnées.
Je vais d'ailleurs vous en donner quelques exemples parce que c'est des choses qui
sont très utilisées.
On a alors des métadonnées génériques qu'on peut retrouver avec n'importe quel fichier
ou document.
On va souvent avoir un titre, une date de création, une date de modification, un auteur
ou une autrice, le poids, le format, la langue, etc.
Mais on a aussi des métadonnées qui sont spécifiques à certains types de fichiers,
comme par exemple les métadonnées pour les images et les vidéos.
Alors, ces métadonnées-là, on les appelle les exif, c'est Exchangeable Image File.
Et donc, c'est des métadonnées complémentaires qui sont vraiment très utiles parce qu'on
va les utiliser très souvent dans la programmation par exemple.
Donc, dans ces exifs, on va avoir le constructeur de l'appareil ou de la caméra, mais surtout,
on va avoir l'orientation, est-ce que c'est paysage ou est-ce que c'est portrait.
Parfois, on peut avoir la géolocalisation de la photo si jamais ça a été activé,
la compression, le temps d'exposition, l'ouverture de la focale, etc.
Et donc, ces informations-là, par exemple, on va pouvoir s'en servir pour retourner une
image selon son orientation d'origine.
Si jamais ça vous intéresse, vous avez mis un exemple de justement l'utilisation de ces données-là
pour retourner des images directement en JavaScript, vous trouverez le lien dans les notes de l'épisode.
Après, on a aussi des métadonnées audio.
L'audio, ça contient des métadonnées nécessaires pour le coup à la lecture des données,
comme l'échantillonnage par exemple.
On a 44 kHz, souvent c'est le nombre, plutôt la fréquence à laquelle on va avoir une information
un bit d'information.
Et la précision d'information, qui est par exemple pour un bon MP3, ça va être de 512 kbps.
Et dans le cas de la musique, on va retrouver des informations sur l'œuvre, donc l'album,
les artistes, l'année, le genre, etc.
Et c'est grâce à toutes ces métadonnées-là qu'on va pouvoir construire des visualisations
sur Spotify, sur iTunes, etc.
C'est là où vous allez pouvoir avoir des tri par catégorie genre, etc.
C'est parce que n'importe quel fichier audio contient ces informations-là en tant que
métadonnée.
J'espère que cet épisode vous aura été utile.
C'était vraiment un concept assez basique.
Vous le connaissiez peut-être déjà, mais voilà, c'est toujours important de revenir
un petit peu au basique et de se rappeler justement que quand vous générez un fichier
ou quoi que ce soit une donnée, c'est important d'y associer les métadonnées qui vont avec
pour donner vraiment du sens.
C'est la fin de l'épisode.
Moi, je vous dis à très bientôt sur Code Garage.
Alors Code Garage, qu'est-ce que c'est ?
C'est une plateforme de formation pour les développeurs et développeurs qui veulent
continuer à se former en continu avec des contenus de qualité.
Pour 19€89 par mois, vous avez accès à absolument tous les contenus de la plateforme
et puis à d'autres choses, des exercices, etc.
Etc.
Sur ce, je vous dis à la semaine prochaine pour un prochain épisode du podcast.
Salut !

Les infos glanées

Je suis une fonctionnalité encore en dévelopement

Signaler une erreur

Code-Garage

Découvrons ensemble des sujets passionnants autour du métier de dev et de la programmation en général !
Tags
Card title

Lien du podcast

[{'term': 'Technology', 'label': None, 'scheme': 'http://www.itunes.com/'}]

Go somewhere