Les sous-titres expressifs de Google donnent enfin du sens aux sous-titres
Le volet de décembre du désormais traditionnel Pixel Drop est là pour les utilisateurs de la gamme de téléphones et de tablettes Pixel de Google, avec d'autres fonctionnalités disponibles pour l'ensemble de l'écosystème Android.
Inutile de voir que la liste de nouvelles fonctionnalités de ce mois-ci est fortement orientée vers les fonctionnalités d'IA générative et l'application Gemini AI. Le choix du groupe est la nouvelle fonctionnalité Expressive Captions pour les téléphones Android, qui est une extension de la fonctionnalité Live Captions pour le contenu vidéo. C'est maintenant, eh bien, plus expressif.
Ainsi, si vous regardez un match de la NFL, par exemple, les sous-titres (ou sous-titres pour nous, Britanniques) refléteront l'émotion et l'intensité de l'appel du commentateur. Dans l'exemple utilisé aujourd'hui par Google, l'entreprise explique comment elle apportera des émotions aux sous-titres.
Ce qui auparavant aurait pu être simplement : « Aux trois. Ils vont l’arrêter net.
Ce serait maintenant : « Aux trois. [gasps] ILS VONT L'ARRÊTER COURT ! [cheers and applause]»
Il captera l'excitation dans les voix des gens avec des points d'exclamation et des majuscules, tandis que des « éclats vocaux » comme des soupirs, des grognements et des halètements ajouteront à l'expressivité des légendes.
Les légendes expressives captent également le son ambiant, comme les bruits du premier plan et de l’arrière-plan. Des choses comme les applaudissements et les acclamations seront indiquées par les légendes. Google affirme que les sous-titres expressifs sont intégrés au système d'exploitation plutôt que spécifiques à l'application et seront disponibles dans toutes les applications.
« Cela signifie que vous pouvez utiliser les sous-titres expressifs avec la plupart des choses que vous regardez, comme les diffusions en direct sur les plateformes sociales, les souvenirs de votre bobine Google Photos et les messages vidéo de vos amis et de votre famille », explique Google dans un article de blog aujourd'hui. « Lorsqu'ils sont activés, les sous-titres s'afficheront en temps réel et sur l'appareil, vous pourrez donc les utiliser même lorsque vous êtes en mode avion. »
Avec le Pixel Drop de décembre, Gemini Advanced peut désormais s'appuyer sur les informations enregistrées pour mémoriser vos intérêts et préférences. Ainsi, si vous dites aux Gémeaux que vous êtes végétarien, vous n'obtiendrez pas beaucoup de recommandations sur les plats à base de viande lorsque vous demanderez des recettes.
Il existe des options de messagerie contextuelle plus intelligentes dans la fonction de filtrage d'appel. Cela semble très utile si vous ne pouvez pas ou ne voulez pas répondre à un appel.
Google ajoute : « Si un colis est en cours de livraison, vous pouvez utiliser cette fonctionnalité pour répondre au livreur en répondant à ses questions par oui ou par non ou en posant des questions de suivi pertinentes, le tout via des invites simples qui s'afficheront sur votre écran. »
Google permet également à Gemini de vous aider dans davantage d'applications. La société ajoute : « Avec la nouvelle extension Spotify, vous pouvez écouter vos chansons préférées et découvrir des listes de lecture pour toutes les humeurs. Vous pouvez également appeler des contacts et envoyer des messages avec votre téléphone et vos applications de messagerie par défaut, définir des alarmes et contrôler les paramètres de l'appareil et de votre appareil photo. Bientôt, vous pourrez également utiliser Gemini pour contrôler vos appareils domestiques intelligents auxquels votre compte Google peut accéder et obtenir plus d'informations sur les lieux sur Maps.
Ailleurs, Google introduit de nouvelles descriptions d'images lues à haute voix, de nouveaux mashups dans Emoji Kitchen dans Gboard, la possibilité de partager des photos via des codes QR dans Quick Share et des numérisations optimisées de l'appareil photo pour les documents physiques et les reçus.