Cet outil d'IA académique gratuit m'aide à atteindre de nouveaux niveaux de nerd
Les oiseaux sont assez faciles à identifier uniquement à la vue, mais les choses sont beaucoup plus difficiles lorsque vous ne pouvez entendre que leurs cris. Bonnes nouvelles! L'Université Cornell dispose d'une application qui peut faire exactement cela, et son utilisation est entièrement gratuite.
Sommaire
Identifier les cris des oiseaux est difficile
Traitez-moi de nerd (et vous ne serez pas le premier), mais je pense que les oiseaux sont plutôt cool. Je n'en suis pas au stade où je porte un bloc-notes et enregistre mes observations, mais si je repère quelque chose de nouveau, je consulte généralement « Le Livre » et j'essaie de comprendre de quoi il s'agit.
Les livres et autres aides visuelles sont parfaits si vous pouvez avoir un aperçu de ce que vous recherchez, mais les descriptions écrites des cris d'oiseaux ne signifient absolument rien pour moi. Je dois apprécier l'effort que les auteurs mettent dans leurs descriptions, et certaines sont un peu plus évidentes que d'autres, mais mon cerveau a du mal à traduire ces mots en sons.
J'ai donc été désemparé lorsque j'ai été tenu éveillé entre 2 et 4 heures du matin par un oiseau que je n'avais jamais entendu auparavant et qui ne voulait tout simplement pas se taire. Pour tous les oiseaux qui lisent ceci, ce n’est pas comme ça qu’on entre dans mes bons livres. J'ai quand même consulté le Livre un instant pour identifier l'oiseau.
Bien sûr, j’ai fait un blanc. Même après avoir eu un aperçu le lendemain, je n’étais toujours pas plus sage. C'est à ce moment-là que j'ai pensé à essayer d'identifier l'oiseau en fonction de son cri, en utilisant une sorte d'outil d'IA. J'ai déjà utilisé l'intelligence visuelle sur mon iPhone et des applications similaires pour identifier les plantes (sans jugement, s'il vous plaît), alors pourquoi pas les oiseaux aussi ?
Merlin est la meilleure application pour cette tâche
Mon premier réflexe a été de demander à Gemini, ce qui n’est pas une phrase que j’ai jamais tapée auparavant. Ma logique était que Google probablement possède le plus grand ensemble de données à partir duquel extraire des informations, donc Gemini pourrait être le meilleur outil pour ce travail. Après m'avoir dit à quel point j'étais un bon garçon de poser une question aussi intelligente (vraiment), Gemini m'a dit que les cris d'oiseaux ne faisaient pas partie de son répertoire.
Alors, à la place, je suis allé à la recherche d’une application qui ferait l’affaire et j’ai trouvé Merlin Bird ID de l’Université Cornell. Merlin est disponible pour iPhone et Android, et son utilisation est entièrement gratuite. L'application nécessite l'accès à votre microphone (évidemment), mais également à votre position afin de savoir quels oiseaux sont susceptibles d'être trouvés dans votre région.
J'ai essayé quelques autres applications, mais aucune n'a fonctionné aussi bien que Merlin. L'application vous permet de surveiller en permanence les cris d'oiseaux, les résultats apparaissant en temps réel au fur et à mesure que les appels sont détectés. D'autres applications nécessitent que vous analysiez un clip après l'avoir enregistré, ce qui est beaucoup moins intuitif.
Merlin peut également identifier les oiseaux à partir d'images, mais cela n'a rien de spécial dans le monde des outils d'IA. Au cœur de ses capacités d'apprentissage automatique se trouve Visipedia, un projet académique d'apprentissage automatique qui a été formé sur les données d'eBird.org.
La partie la plus difficile du processus de détection consiste à capturer l’appel, ce qui demande un peu de patience et un peu de chance. La possibilité de laisser le microphone ouvert pour que l’application écoute constamment est d’une grande aide.
Pas une science exacte
L'Université Cornell est franche sur les limites de l'application, notant que la détection basée sur l'IA est loin d'être parfaite et que la combinaison d'appels avec des identifiants visuels vous donnera les meilleures chances d'obtenir une identification réussie. Malgré cela, il ne m'a fallu que quelques tentatives pour capter l'appel de Merlin et réussir à identifier le coucou à bec gris comme mon visiteur matinal.
L'inclusion dans l'application d'enregistrements que vous pouvez croiser, ainsi que d'images, me permet de savoir que j'ai eu une correspondance. Cela explique également que l'oiseau est migrateur, donc j'ai probablement quelques mois de cris matinaux à endurer avant qu'ils ne disparaissent en Indonésie et en Papouasie-Nouvelle-Guinée. C'est un oiseau plutôt cool, quoique bruyant.
Merlin a noté que seulement 36 % des oiseaux de ma région pouvaient être identifiés avec l'application, mais je parierais que si vous vivez en Amérique du Nord ou en Europe, ce nombre serait bien plus élevé. Cornell améliore constamment l'application et, comme pour tout outil d'IA, vous contribuez probablement au projet simplement en utilisant l'application.
Merlin vous permet également de télécharger des ensembles de données pour votre région, afin que vous puissiez visualiser les correspondances potentielles et écouter les appels même lorsque vous êtes au milieu de nulle part sans connexion cellulaire.
Le Shazam des cris d'oiseaux est plutôt sympa, mais vous seriez pardonné d'en avoir un peu marre des fonctionnalités d'IA qui gonflent vos applications et services préférés.
