Google Gemini peut désormais prendre vos fichiers audio
Agence web » Actualités du digital » Google Gemini peut désormais prendre vos fichiers audio

Google Gemini peut désormais prendre vos fichiers audio

Les Gémeaux de Google ont finalement ajouté la possibilité de télécharger et d'analyser les fichiers audio. Cette nouvelle fonctionnalité prend vos fichiers audio, y compris des formats communs comme MP3, M4A et WAV, et peut transcrire, résumer et extraire les détails clés du contenu.

La fonctionnalité est désormais disponible sur Android, iOS et le Web. Vous pouvez accéder à la nouvelle fonctionnalité via le menu Plus de l'application mobile Gemini ou à l'option Télécharger les fichiers sur le Web. De là, sélectionnez simplement un fichier audio dans votre appareil. Il analysera ensuite tout ce que vous y mettra et facilitera la recherche de détails dans votre contenu, qu'il s'agisse d'une réunion enregistrée, d'une interview, d'une conférence ou même d'une note vocale personnelle.

Malheureusement, le nouveau service de transcription est livré avec des limites d'utilisation à plusieurs niveaux, qui seront différentes pour les utilisateurs gratuits et ceux qui ont un abonnement payant. Pour les utilisateurs du niveau gratuit, la longueur audio totale qui peut être téléchargée et analysée est plafonnée à 10 minutes. C'est incroyablement généreux de Google, et il offre plus de temps pour les fichiers audio que tout autre service de transcription gratuit que j'ai vu.

Le délai n'est pas la seule restriction à surveiller. Vous pouvez télécharger jusqu'à 10 fichiers de n'importe quel format pris en charge sur une seule invite par défaut. Cela comprend des dossiers de code avec jusqu'à 5 000 fichiers, des référentiels GitHub et des fichiers zip contenant jusqu'à 10 fichiers compressés. La mise à jour audio n'étend pas cette limite, mais elle compte vers la limite de 10 fichiers de ce que vous pouvez télécharger en même temps.

Si vous allez l'utiliser pour transcrire, je recommanderais de remettre le script à Gemini et de demander s'il y a quelque chose qui n'est pas dans le fichier audio. C'est juste au cas où l'IA gâche à tout moment, car 10 minutes à trois heures est long pour une IA, et personnellement, je ne lui ferais pas complètement confiance pour ne pas confondre les mots ou halluciner.

Gardez à l'esprit qu'une fois qu'un fichier audio est téléchargé, Gemini peut faire plus que simplement le convertir en texte. Les utilisateurs peuvent inviter l'IA à résumer les points clés, à identifier différents haut-parleurs ou même à extraire des éléments ou des devis d'action spécifiques. Cela transforme un fichier audio brut en un document structuré, consultable et très utile.

Pour les utilisateurs puissants et les professionnels qui ont besoin de capacités de transcription plus étendues, Google propose des limites beaucoup plus élevées. Les abonnés à Google AI Pro ou Google AI Ultra peuvent télécharger jusqu'à trois heures d'audio. Il s'agit d'une énorme augmentation qui rend le service idéal pour la transcription du contenu long comme des podcasts, des interviews complètes ou des séminaires. Je peux imaginer quiconque gère une entreprise ou travaille dans la transcription pourrait profiter du coût mensuel de 20 $ du plan AI Pro.

J'ai fait gagner beaucoup de temps à mettre des liens YouTube dans les Gémeaux pour trouver un endroit que je recherche dans des vidéos d'une heure. Gemini est excellent pour prêter attention à ce qui se passe dans les liens vidéo, donc je sais que cette mise à niveau de l'audio est probablement très utile pour les utilisateurs.

★★★★★