Alexa+ commence à ressembler un peu au futur, mais des réponses plus courtes seraient bien
Agence web » Actualités du digital » Alexa+ commence à ressembler un peu au futur, mais des réponses plus courtes seraient bien

Alexa+ commence à ressembler un peu au futur, mais des réponses plus courtes seraient bien

Lorsqu'Amazon a annoncé pour la première fois le haut-parleur intelligent Echo et Alexa, il semblait que l'avenir Étoile Randonnée avait promis était enfin arrivé. Il s’agissait d’un ordinateur avec lequel nous pouvions interagir naturellement, plus rapidement et plus facilement que les applications ou les interfaces traditionnelles.

Sans surprise, Amazon a vendu un grand nombre d’appareils Echo et a rapidement élargi la gamme avec des appareils pouvant s’adapter partout. Seulement, il s’est avéré que l’avenir n’était peut-être pas vraiment là.

Alexa parle

Comme indiqué dans ma chronique d'il y a quelques semaines, j'utilise largement des contrôles physiques sur les commandes vocales parallèlement à des routines automatisées : il est plus rapide d'allumer une lumière avec un bouton, ou d'éteindre mon alarme et d'ouvrir les stores lorsque la porte du bureau se déverrouille, que d'utiliser une commande vocale pour l'un ou l'autre travail.

Cela dépend en grande partie de la façon dont Alexa (et d’autres assistants vocaux) s’attend à ce que les commandes soient formulées. Bien qu'Alexa soit toujours la meilleure du groupe, sa terminologie requise a donné naissance à l'expression « Alexa parle ».

C'est cette manière légèrement peu naturelle de formuler une commande, telle que «Alexa, règle la température du radiateur du salon à 20°C». Cette phrase ne semble pas si mauvaise, mais elle comporte de nombreux problèmes potentiels.

Si vous vous trompez légèrement dans la commande, Alexa pourrait ne pas fonctionner ; nommez incorrectement l'appareil que vous souhaitez contrôler et la commande ne fonctionne pas ; ou faites simplement une pause pendant que vous essayez de réfléchir aux bons mots à utiliser, et la commande ne fonctionne pas.

En dehors du contrôle vocal, Alexa est utile pour les demandes de base ou pour répondre à des questions simples, mais elle ne peut souvent pas comprendre les demandes plus complexes, ne peut pas prendre d'actions en votre nom et vous devez toujours formuler les choses comme si vous parliez à un ordinateur.

Conversations et contexte naturels

Alexa+ promet de changer cela et, d'après ce que j'en ai vu, met fin au langage Alexa, en passant au langage naturel, afin que vous puissiez poser une question ou émettre une commande comme si vous parliez à une personne réelle. Et Alexa+ se souvient du contexte et se laisse corriger.

Lors de l'événement de lancement d'Alexa+ UK, j'ai vu une démo dans laquelle Alexa+ donnait le dernier résultat d'Arsenal ; il savait que le présentateur était un fan, alors il a raconté la partition sur un ton positif.

Ensuite, le présentateur a demandé à Alexa+ de communiquer le score de Chelsea à quelqu'un d'autre. Alexa a commencé à raconter la défaite avec enthousiasme, puisque le présentateur n'avait pas mentionné que l'autre personne était un fan de Chelsea.

Une brève interruption pour dire que l'autre personne était un fan de Chelsea a fait redémarrer Alexa+, mais avec une voix neutre. Il n'était pas nécessaire de reformuler toute la question avec quelque chose comme « Alexa, mon ami est un fan de Chelsea, dis-lui le dernier score » ou quelque chose de similaire.

Alexa+ a compris que le changement s'appliquait à la demande en cours et a ajusté sa réponse en conséquence. De plus, Alexa+ se souviendrait alors de qui est un fan de Chelsea pour les demandes futures.

Alexa+ est également agentique, ce qui signifie qu'elle peut prendre des mesures en votre nom. Dans la démo, Alexa+ pouvait réserver une table dans un restaurant en utilisant OpenTable, à partir de quelques informations simples, toutes prononcées naturellement, et où l'ordre des informations n'avait pas d'importance (le nom du restaurant, le nombre de personnes à la table, la date et quand il restait au moins deux heures libres dans l'agenda).

Ce type d’interaction semble meilleur, plus facile et plus rapide que de devoir rechercher le restaurant et effectuer le travail manuellement.

Pas parfait, mais certainement mieux

Dans le cadre du lancement d'Alexa+ au Royaume-Uni, Amazon a affiné le système pour comprendre un large éventail d'accents britanniques et comprendre notre façon de parler. Ces informations sont également utilisées dans la façon dont Alexa+ répond. Est-ce parfait ? Non.

En particulier pour les réponses sur le football, Alexa+ semble beaucoup aimer utiliser le mot « mate », ce qui semble un peu faux et trop amical. Je ne suis pas sûr de vouloir qu'Alexa+ soit mon amie ; Je veux juste qu'il fasse ce que je veux, quand je veux, avec des réponses claires. Il faudra voir, une fois que j'aurai bientôt accès à Alexa+, si je peux atténuer ses réponses.

Ensuite, il y a eu une démonstration au cours de laquelle on a demandé à Alexa+ quand le prochain match aurait lieu pour un club de football. Le résultat était bon, mais lorsqu'on lui a demandé d'ajouter le jeu au journal, Alexa+ l'a ajouté pendant une heure à partir de l'heure de début.

Certes, si Alexa+ est si intelligente et comprend le contexte, elle devrait savoir qu'un match de football dure 90 minutes, plus 15 minutes de mi-temps, plus la prolongation. Cela représente au minimum une heure et 45 minutes, mais deux heures seraient une valeur plus sûre.

On m'a dit qu'en raison du bruit de fond important, Alexa+ pourrait avoir du mal à comprendre ce qui était dit. Il a bien compris les détails du match et a compris qu'il fallait ajouter un rendez-vous dans le calendrier, nous devrons donc voir si Alexa+ peut être plus intelligent que cela dans la vraie vie.

De même, le contexte peut être difficile à comprendre. Lorsqu'on lui a demandé, sur un appareil Fire TV, qui avait remporté l'Oscar de la meilleure actrice, Alexa+ a répondu à juste titre qu'il s'agissait de Jessie Buckley pour Hamnet. Ensuite, à la question « Pouvons-nous le regarder ? », j'ai pensé que cela signifierait qu'Alexa+ trouverait un extrait de la cérémonie des Oscars et le montrerait. Au lieu de cela, Alexa+ a commencé à diffuser Hamnet depuis Prime Video (actuellement 15,99 £ à la location ou 19,99 £ à l'achat).

L’une ou l’autre réponse est correcte, mais Alexa+ a-t-elle tendance à essayer de vous vendre des choses, ou choisit-elle simplement une option parce que c’est celle qu’elle pense être la bonne ? C'est difficile à dire, car même les humains peuvent avoir du mal avec le contexte et l'ambiguïté.

Trop de clichés ?

Alexa+ semblait également apprécier ses clichés et ses réponses plus longues. Lorsqu'on lui a demandé de recommander certaines machines à café (toutes sur Amazon, bien sûr), il a décrit le prix comme quelque chose qui « ne fera pas sauter la banque ».

Entraîner une IA signifie extraire des données de nombreuses ressources, mais le problème est que beaucoup de gens utilisent des clichés, et il y a de fortes chances que n'importe quel système renforce ce comportement.

Lorsque je travaillais sur un titre imprimé, notre sous-éditeur interdisait tous les clichés et disposait d'une liste de phrases interdites, optant pour la brièveté, pour apporter de la clarté. Un exemple était le « rapport qualité-prix », car à quoi d'autre quelque chose aurait-il de la valeur ? Valeur pour le fromage ? Valeur des haricots magiques ?

De même, il n’y a pas de « utilisation ». C'est juste une utilisation. Vous ne dites pas, conduisez ma voiture, n'est-ce pas ?

Vous ne devez pas non plus surexpliquer et ajouter des mots de remplissage. Il est assez courant de voir des critiques disant quelque chose comme « le meilleur téléphone du marché ». Quel marché ? La route de Portobello ? Êtes-vous Del Boy? Existe-t-il de meilleurs téléphones non pas sur le marché, mais dans les magasins ? C'est de la merde.

Généralement, les gens utilisent des adjectifs sur un verbe fort. Comme Stephen King l'a expliqué dans On Writing, vous ne devriez pas utiliser « j'ai fermé la porte avec colère » et vous devriez écrire « j'ai claqué la porte ».

Une bonne écriture et un bon discours sont perceptibles. Beaucoup de gens utilisent peut-être trop de mots lorsqu'ils écrivent ou parlent, ou se rabattent sur des clichés, mais je veux qu'Alexa+ soit meilleure, plus claire et plus directe.

Voyons si c'est le cas, et si ce n'est pas le cas, si Alex+ peut être affiné pour ne pas jaillir de clichés et s'il peut être rendu moins verbeux. Le système Alexa d'origine avait un mode bref, bien que celui-ci remplace une réponse vocale par un court carillon pour une demande simple, comme demander à Alexa d'allumer une lumière. C'est trop loin, mais un mode bref qui rend Alexa+ moins bavard et plus précis serait bien.

Des améliorations viendront

Bien qu'il y ait des choses que je n'aime pas, mon impression générale en voyant Alexa+ dans les démonstrations en direct est que l'assistant vocal est une grande amélioration par rapport à l'ancien. Le simple fait de pouvoir parler naturellement et de faire comprendre à Alexa+ est une grande amélioration, tandis que la possibilité de modifier une réponse à mi-chemin rend tout cela beaucoup plus naturel. Au fur et à mesure que je l'essaierai au cours des prochaines semaines, je verrai si c'est l'avenir de la communication vocale. Je l'espère.

★★★★★