Comment remplacer la voix d'Alexa par la vôtre à l'aide de Home Assistant
Agence web » Actualités du digital » Comment remplacer la voix d'Alexa par la vôtre à l'aide de Home Assistant

Comment remplacer la voix d'Alexa par la vôtre à l'aide de Home Assistant

Pouvoir faire dire à Alexa tout ce que vous voulez avec Home Assistant a toujours été l'une de mes fonctionnalités préférées. Mais je me suis vite lassé de sa voix par défaut et j'ai décidé de la remplacer par une voix irlandaise beaucoup plus apaisante via le service cloud de synthèse vocale (TTS) de Home Assistant. Récemment, j’ai commencé à me demander si je pouvais remplacer cette voix par une voix encore meilleure : la mienne.

Je joue avec ElevenLabs depuis un moment

ElevenLabs est une société de logiciels qui propose une gamme d'outils vocaux d'IA. En son cœur se trouve un service TTS qui transformera n’importe quel texte en discours au son naturel avec une grande variété de voix. Il est possible de donner des indices pour changer le ton émotionnel du discours afin qu'il sonne exactement comme vous le souhaitez. Les résultats peuvent être vraiment impressionnants.

Une autre fonctionnalité proposée par ElevenLabs est le clonage vocal. En utilisant seulement dix secondes d'audio, il est possible de créer votre propre voix personnalisée que vous utilisez avec le moteur TTS. Une fois que vous avez cloné une voix, vous pouvez lui faire dire ce que vous voulez simplement en tapant le texte que vous voulez dire.

Il existe également d'autres fonctionnalités utiles, notamment un outil capable de générer de la musique uniquement à partir d'invites textuelles. ElevenLabs propose un niveau gratuit, mais avec des limitations importantes sur les fonctionnalités et sur la quantité de texte que vous pouvez convertir en parole. Je paie 5 $ par mois pour le forfait Starter, ce qui me donne suffisamment de crédits pour générer jusqu'à une heure de parole chaque mois.

Vous ne pourrez pas reproduire cette méthode sans compte ElevenLabs payant. La version gratuite d'ElevenLabs ne vous permet pas de cloner des voix ou d'utiliser des voix personnalisées pour la synthèse vocale.

Utiliser ma propre voix dans ma maison intelligente

J'ai cloné ma voix avant d'utiliser la fonction Personal Voice d'Apple. Malheureusement, vous ne pouvez pas utiliser cette voix de manière significative. Il n'est pas possible de remplacer la voix de Siri par la vôtre en utilisant Personal Voice, par exemple.

Je savais que je pouvais cloner ma voix avec ElevenLabs, alors je l'ai essayé pour voir si cela sonnerait assez bien pour être utilisé. J'ai demandé à un chatbot IA de générer pour moi un script de deux minutes qui capturerait différents tons de voix et tous les sons phonétiques clés.

J'ai cliqué sur le bouton « Créer ou cloner une voix » dans ElevenLabs, sélectionné « Instant Voice Clone » et me suis enregistré en train de lire le script par tranches de 30 secondes. Après chaque enregistrement, une icône indiquait s'il y avait suffisamment d'audio pour créer un bon clone. J'ai continué à enregistrer jusqu'à ce que le cercle vert soit plein ; il a fallu six enregistrements de 30 secondes.

Une fois que j'ai cliqué sur « Suivant », la voix a été créée en quelques secondes seulement. Je l'ai testé en tapant du texte, et les résultats étaient bons ; cela sonnait remarquablement proche de ma propre voix. Ce n'était pas un clone parfait ; les mots étranges sonnaient un peu différemment de la façon dont je les prononcerais, mais la plupart du temps, le discours était terriblement similaire.

Tout ce dont j'avais besoin était un moyen pour Home Assistant de générer de la parole à l'aide de cette voix clonée, et je pourrais utiliser ma propre voix pour faire des annonces via mes haut-parleurs intelligents Echo dans toute la maison.

L'intégration d'ElevenLabs simplifie la génération de la parole

La beauté de Home Assistant est que quoi que vous vouliez faire, vous pouvez être presque certain que quelqu'un d'autre l'a essayé en premier et a créé une intégration pour le rendre simple à faire. C'était exactement le cas ; il existe une intégration ElevenLabs que vous pouvez utiliser pour générer de la synthèse vocale via ElevenLabs en utilisant n'importe laquelle de vos voix enregistrées ; vous avez juste besoin de la clé API de votre compte et de l'identifiant vocal de la voix que vous souhaitez utiliser.

Après avoir installé l'intégration, j'ai testé la fonctionnalité sur mon Apple HomePod mini, car j'ai eu moins de problèmes avec cet appareil pour les annonces TTS dans le passé. J'ai découvert que je pouvais demander à Home Assistant de dire n'importe quoi avec ma voix via mon HomePod mini en appelant l'action « tts.speak » avec ElevenLabs comme cible, mon HomePod comme lecteur multimédia, le texte que je voulais entendre comme message et l'identifiant vocal de ma voix personnalisée dans les options.

Faire en sorte que mes appareils Echo diffusent ma voix a été la partie la plus difficile

Maintenant que je pouvais faire jouer ma voix sur mon HomePod mini, j'étais sûr de l'avoir piraté. J'ai remplacé le lecteur multimédia par l'un de mes haut-parleurs Echo exposé par l'intégration d'Alexa Media Player et j'ai réessayé. Malheureusement, au lieu d'entendre ma voix, j'ai reçu un message dans la voix standard d'Alexa disant : « J'ai du mal à accéder à votre compétence Simon Says en ce moment. »

J'ai passé beaucoup de temps à essayer de résoudre ce problème, sans grand succès. Il s'agit d'un problème courant avec l'intégration d'Alexa Media Player, car les appareils Echo n'aiment pas l'audio à moins qu'il ne soit dans un format spécifique. Je n'arrivais tout simplement pas à le faire fonctionner.

Puis, comme pour la plupart des problèmes techniques, j’ai réalisé qu’il existait une solution potentiellement simple que j’aurais dû essayer des heures plus tôt. J'ai changé le lecteur multimédia cible de celui exposé par l'intégration d'Alexa Media Player à celui exposé par Music Assistant. Pour une raison quelconque, cela a parfaitement fonctionné. Je peux désormais dire tout ce que je veux avec ma propre voix via tous mes haut-parleurs intelligents. Par exemple, mon annonce de la journée des déchets qui se déclenche chaque fois que quelqu'un entre pour la première fois dans la cuisine un vendredi matin m'indique désormais, de ma propre voix, le type de déchets que je dois éliminer ce jour-là.


Utiliser ma propre voix pour remplacer celle d'Alexa n'était au départ qu'une expérience, mais cela fonctionne très bien et rend les annonces beaucoup plus personnelles. Vous pouvez utiliser cette méthode pour potentiellement cloner n'importe quelle voix dans des limites raisonnables, comme celle d'autres membres de la famille.

Vous devez garder à l'esprit que le clonage des voix d'autres personnes sans autorisation a des implications juridiques et éthiques et pourrait entraîner la suspension de votre compte ElevenLabs. ElevenLabs détient les droits sur des voix emblématiques telles que Judy Garland et John Wayne, mais celles-ci sont destinées à un usage commercial. Cependant, si vous êtes prêt à payer, vous pouvez obtenir une licence pour la voix officielle de Michael Caine et transformer Alexa en votre propre Alfred Pennyworth des films Batman.

★★★★★