A PDF document next to a message field with Gemini logos around it.
Agence web » Actualités du digital » Vous pouvez désormais discuter avec vos PDF dans Google Drive : voici comment procéder

Vous pouvez désormais discuter avec vos PDF dans Google Drive : voici comment procéder

Une utilisation vraiment unique en son genre des modèles d'IA génératifs consiste à numériser un long document et à lui donner des invites en fonction de cela. D'une certaine manière, vous discutez avec le PDF. Je veux vous montrer comment vous pouvez faire cela directement dans Google Drive.

Pourquoi discuter avec des PDF ?

Vous pouvez demander à peu près n'importe quoi à un chatbot, et il vous donnera des informations spécifiques et précises extraites du PDF que vous avez fourni.

Par exemple, vous pouvez lui donner un manuel et lui demander de résumer un chapitre, d'expliquer un diagramme, de résoudre un problème, de dessiner un tableau, de créer une aide-mémoire, de concevoir un plan d'étude ou de créer des flashcards. Vous pourriez peut-être même lui demander de créer un quiz pratique. Le chatbot peut agir comme un tuteur et vous apprendre à partir du manuel. Les possibilités sont infinies.

Cela ressemble à quelque chose de science-fiction parce que ces robots sont étonnamment bons dans ce domaine. Lorsque vous discutez avec un PDF, le robot est moins susceptible de simplement fabriquer des informations, et vous pouvez toujours lui demander de vous renvoyer au numéro de page pour vérifier les détails.

En général, ces robots ne fonctionnent pas bien avec les gros fichiers PDF. Soit ils ont une limite sur la taille des fichiers, soit ils sont verrouillés derrière un paywall. Même s’ils vous permettent de télécharger un gros fichier, ils risquent de perdre le contexte après quelques SMS. En effet, les robots, alimentés par de grands modèles de langage, s'appuient sur ce qu'on appelle des jetons pour conserver le « contexte » d'une conversation. Un jeton est une unité composée d’environ quatre caractères de texte. Un bot IA ne dispose que d’un nombre limité de jetons avec lesquels jouer.

D'une manière générale, plus un bot prend en charge de jetons, plus il peut « se souvenir » longtemps de la conversation en cours sans perdre le contexte. Lorsqu'un robot perd le contexte, il « oublie » la conversation précédente, ce qui signifie que vous devez lui fournir à nouveau les mêmes informations. Et plus votre document est long, plus vite vous y parvenez.

Gemini de Google ne perdra pas facilement le contexte car il prend en charge environ 1 million de jetons pour la fenêtre contextuelle d'analyse de documents. Selon Google, c'est meilleur que n'importe quel autre robot commercial. Si vous travaillez avec des documents longs, Gemini fera un meilleur travail que ChatGPT.

Gemini intégré à Google Drive est le meilleur moyen que j'ai trouvé pour travailler avec des PDF. Vous pouvez poser des questions à Gemini sur les PDF, l'inviter à générer du contenu basé sur le PDF ou combiner des PDF avec d'autres fichiers dans votre Google Drive pour créer un meilleur contexte. Je dis PDF, mais les discussions fonctionnent avec n'importe quel type de document, y compris Google Docs.

Les chatbots IA sont une technologie incroyablement intelligente, mais ils crachent également des informations inventées ou incorrectes (ces informations peuvent parfois même être dangereuses). Vous ne devriez pas leur demander de conseils financiers, juridiques ou médicaux. Google met en garde contre tout conseil professionnel de Gemini. Je ne recommanderais même pas de télécharger un PDF sensible (par exemple, votre dossier médical ou vos coordonnées bancaires) sur ces services.

Gemini dans Google Drive est puissant

Peu importe le type de PDF avec lequel vous travaillez. Gemini gère très bien les PDF numérisés et les PDF longs et compliqués. Je lui ai même envoyé un PDF de partition, et il a pu comprendre de quoi il s'agissait et me l'expliquer. Même un formatage et des images compliqués ne l'ont pas gâché.

Pour être clair, je ne veux pas dire qu'il répondra à toutes les questions sur une partition – vous pourriez toujours entendre occasionnellement « J'apprends encore et je ne peux pas m'aider avec ça », mais il fonctionne étonnamment bien.

Gemini pour Google Drive est fourni avec les comptes Google premium. Si vous souhaitez l'utiliser gratuitement sur un compte personnel, vous devrez activer Google Workspace Labs. Google a verrouillé Workspace Labs derrière un système sur invitation uniquement, vous ne pouvez donc l'activer que lorsque Google vous invite à rejoindre le programme de test bêta. Vous avez peut-être vu une invitation à activer l'IA dans Google Docs ou d'autres applications Workspace. Si vous activez Labs n'importe où, vous devriez également voir immédiatement Gemini dans votre Google Drive.

L'application mobile ne dispose pas de cette fonctionnalité. Au lieu de l'application Google Drive, vous pouvez utiliser l'application Gemini Android avec les extensions Google Workspaces activées. Ce n’est qu’une solution de contournement, et cela ne fonctionne pas très bien.

Pour une expérience optimale, connectez-vous à votre Google Drive sur le navigateur Web du bureau.

Gemini dans Google Drive prend en charge ces sept langues : espagnol, français, allemand, italien, japonais, coréen et portugais.

Comment discuter avec vos PDF dans Gemini

Vous pouvez accéder à un PDF dans Gemini de deux manières :

Cliquez sur le bouton Gemini sur Google Drive (l'icône scintillante dans le coin supérieur). Une boîte de discussion devrait s'ouvrir pour demander une invite. Taper « @» ici, suivi du nom du fichier PDF. Gemini vous proposera des suggestions de remplissage automatique au fur et à mesure que vous tapez. Une fois que vous avez sélectionné le bon fichier, saisissez votre question ou votre invite et envoyez-la.

Alternativement, vous pouvez cliquer avec le bouton droit sur le fichier avec votre souris et choisir « Demander à Gemini » dans le menu contextuel. Gemini remplira automatiquement le nom du fichier avec l'invite « Parlez-moi de ce fichier » pour vous. Cela générera un aperçu détaillé du PDF. Les PDF plus longs recevront des résumés longs et détaillés. Si le fichier ne se trouve pas déjà dans votre Google Drive, vous devrez le glisser-déposer depuis le stockage de votre ordinateur.

Si vous devez importer un autre fichier (il n'est pas nécessaire qu'il s'agisse d'un PDF) pour plus de contexte, tapez «@» encore une fois et donnez à Gemini le nom du fichier. Chaque fichier doit avoir sa propre puce.

À partir de là, vous pouvez répondre à toutes vos questions ou invites. Si Gémeaux perd le contexte, vous pouvez, encore une fois, taper «@ » suivi du nom du fichier pour remettre le bot sur la bonne voie. Vous trouverez également un onglet sources au bas des réponses de Gemini. Selon le nombre de fichiers avec lesquels vous travaillez, vous pouvez avoir une seule source ou plusieurs.

Prendre Gemini dans Google Drive pour un tour

Permettez-moi de vous montrer à quoi tout cela ressemble avec un exemple concret. J'ai entamé une conversation avec Gemini en lui posant des questions sur un manuel de biologie de 400 pages, pesant environ 50 Mo. J'ai demandé à Gemini de m'apprendre une section, et cela m'a donné un aperçu de l'ensemble. Il lit le texte et « voit » même les visuels.

J'ai posé d'autres questions et elles ont répondu à merveille. Je lui ai demandé d'organiser les informations dans un tableau pour une meilleure clarté. Cela l’a fait à merveille aussi. Je lui ai même demandé d'expliquer des graphiques et des schémas en précisant simplement le numéro de page et le numéro de figure. Il a trouvé exactement ce dont j'avais besoin et l'a expliqué de manière détaillée. J'ai terminé la conversation avec une demande de flashcards et un quiz simulé. Les deux semblaient utiles et sans erreur.


Gemini dans Google Drive fait un excellent travail d'assistance avec les PDF. Et le meilleur, c'est que vous n'avez pas à vous soucier de télécharger plusieurs fichiers ou de perdre le contexte. Tout est déjà là sur votre Drive. J'ai mis l'accent sur les PDF, mais cela fonctionne également bien pour d'autres types de documents. Si vous travaillez avec Google Docs depuis un certain temps, vous pouvez désormais rechercher et interagir avec l'ensemble de cette bibliothèque à l'aide de Gemini.

★★★★★