La présentation audio de NotebookLM est bonne, mais elle pourrait être géniale
Sommaire
Points clés à retenir
-
NotebookLM organise les informations provenant de diverses sources, proposant des suggestions pour travailler efficacement avec le contenu.
-
La fonction Aperçus audio crée des podcasts réalistes basés sur des documents téléchargés avec une personnalisation limitée.
-
Les améliorations possibles incluent davantage d'options de personnalisation, des voix variées pour les aperçus audio et la prise en charge des langues.
De temps en temps, quelque chose arrive qui promet de changer le jeu de l’IA – ou du moins d’y jouer différemment. NotebookLM, le bloc-notes IA de Google, est l'un de ces concurrents, notamment avec sa fonctionnalité « aperçu audio ». Alors, qu’est-ce qui distingue exactement cette fonctionnalité, et en quoi est-elle encore insuffisante ?
NotebookLM de Google est un assistant de recherche alimenté par l'IA
Avant d'entrer dans les détails des aperçus audio, prenons un moment pour apprécier l'outil qui rend cela possible : NotebookLM de Google. NotebookLM (le « LM » signifie « Modèle de langage », au cas où vous vous poseriez la question) est essentiellement la tentative de Google de réinventer la façon dont nous organisons et interagissons avec l'information. Vous lui fournissez des ressources : articles, pages Web, vidéos YouTube, PDF, notes, feuilles de calcul – à peu près tout.
Une fois vos sources téléchargées, elles apparaissent dans la barre latérale, d'où vous pouvez les activer et les désactiver, en fonction de ce sur quoi vous souhaitez vous concentrer.
De plus, NotebookLM commence immédiatement à proposer des suggestions sur la manière dont vous pouvez interagir avec votre contenu. Vous pouvez suivre ces invites, ou si vous êtes comme moi et aimez fouiner, vous pouvez taper vos propres requêtes personnalisées dans la boîte de discussion.
Une autre fonctionnalité remarquable est le « Notebook Guide », qui suggère différentes façons de travailler avec vos sources, comme la création d'une FAQ, d'une table des matières, la rédaction d'un guide d'étude ou même la génération d'une chronologie.
D'après mon expérience, NotebookLM est assez solide lorsqu'il s'agit de résumer et de synthétiser des informations provenant de plusieurs sources. Cependant, lorsque vous commencez à lancer des requêtes plus complexes, les choses peuvent devenir un peu troubles. Parfois, il mélange des informations provenant de différents documents d'une manière qui n'est pas tout à fait exacte. Heureusement, il fournit des citations cliquables, ce qui vous permet de facilement retracer la provenance des informations et de vous assurer qu'elles sont exactes.
Les aperçus audio de NotebookLM fonctionnent de la même manière qu'un podcast
Maintenant, c'est ici que NotebookLM commence vraiment à briller : avec ses aperçus audio. D'un simple clic sur « Générer », il transforme vos documents en ce qui ressemble à un podcast décontracté, dans lequel deux hôtes IA discutent du contenu que vous avez téléchargé.
Avant de générer un aperçu, vous pouvez également donner des instructions spécifiques à vos hôtes IA. Cliquez sur « Personnaliser » et entrez les instructions que vous souhaitez que l'IA suive.
Il peut s'agir de sujets ou de sources spécifiques sur lesquels vous souhaitez qu'ils se concentrent ou d'un ton de voix particulier que l'aperçu devrait avoir (peut-être plus décontracté et conversationnel ou peut-être plus formel et axé sur les données).
Après avoir défini vos préférences, NotebookLM générera une discussion basée sur ces indices. Les voix des animateurs semblent incroyablement réalistes, à tel point que j'ai eu des moments où j'ai oublié que j'écoutais AI.
Vous obtenez un podcast « approfondi » qui dure généralement entre 4 et 20 minutes, selon la quantité de matériel que vous avez téléchargé. J'ai trouvé que la durée de l'audio dépend du nombre de sources que vous avez téléchargées. Par exemple, lorsque je l'ai essayé avec cinq sources (articles de How-To Geek), le podcast résultant durait un peu plus de 16 minutes.
Soyez prêt à attendre un peu : la génération de l'audio prend du temps. Dans mon cas, cela a pris environ quatre minutes, ce qui n'est pas terrible, mais si vous êtes habitué aux réponses instantanées d'outils comme le mode vocal de ChatGPT, cela peut sembler une éternité.
Les animateurs sont particulièrement doués pour jouer les uns avec les autres, créant une conversation dynamique plutôt qu'un simple monologue sec. Il ne s’agit pas seulement de régurgiter des informations ; ils analysent vos sources, soulignent des modèles intéressants et plaisantent parfois. Vous pouvez presque les imaginer assis l'un en face de l'autre, feuilletant vos diapositives et disant : « Ah, c'est là que ça devient intéressant… »
Bien qu'impressionnante, la fonctionnalité peut encore être améliorée
À l’heure actuelle, les aperçus audio semblent un peu rigides, avec des options de personnalisation limitées. Par exemple, j'aimerais pouvoir ajuster la longueur du résumé du podcast. Parfois, je souhaite un bref aperçu de deux minutes qui aborde les points forts, et d'autres fois, je préfère une analyse plus approfondie qui approfondit le sujet. Malheureusement, pour le moment, vous ne pouvez pas décider de la longueur ou du détail du résumé audio. Vous obtenez ce que l’IA vous donne, ce qui peut sembler un peu limitant.
Un autre domaine à améliorer est le nombre d’hôtes. À l'heure actuelle, NotebookLM s'en tient à une dynamique standard à deux hôtes, qui fonctionne bien mais semble un peu répétitive après un certain temps. Et si je pouvais choisir un seul narrateur pour un résumé plus simple, de type cours magistral ? Ou peut-être ajouter un troisième ou un quatrième « hôte » pour une discussion de type table ronde ? Ce serait formidable d'avoir le contrôle sur le nombre de voix, permettant différents formats en fonction du type de contenu résumé. La variété de la dynamique vocale pourrait aider à garder le contenu frais et attrayant, en particulier pour les aperçus audio plus longs.
Une autre grande lacune à l’heure actuelle concerne la prise en charge linguistique. Actuellement, la fonctionnalité est limitée à l’anglais américain, ce qui ne fait pas grand-chose en termes d’inclusivité. Alors que les utilisateurs du monde entier s’appuient de plus en plus sur des outils comme ceux-ci, étendre les options linguistiques serait une énorme victoire. Mieux encore, l’ajout d’accents divers pourrait rendre l’expérience plus pertinente et adaptée à un public plus large.
Les aperçus audio de NotebookLM ont généré de l'enthousiasme mais aussi des inquiétudes
N'oublions pas que Google, malgré ses progrès en matière d'IA, a l'habitude de faire des promesses excessives avec ses LLM. Il y a eu plusieurs cas où les systèmes d'IA de Google ont produit des informations trompeuses ou factuellement incorrectes, et c'est quelque chose que nous devons garder à l'esprit lorsque nous utilisons NotebookLM pour des tâches importantes.
Pour cette raison, j'hésiterais à recommander aux étudiants – ou à n'importe qui, vraiment – de s'appuyer uniquement sur NotebookLM pour leurs travaux académiques, du moins pas sans émettre une mise en garde. Cet outil peut être un excellent complément à vos études, vous aidant à obtenir un aperçu ou un récapitulatif rapide de vos sources. Néanmoins, cela ne doit pas être considéré comme un remplacement pour s’engager pleinement dans le contenu original. Si vous l'utilisez pour quelque chose d'aussi important que votre éducation ou votre emploi, assurez-vous de recouper ses résumés avec le matériel source pour vous assurer de ne pas manquer de détails critiques ou, pire encore, d'être induit en erreur par une erreur générée par l'IA.