Agence web » Actualités du digital » Les services de transcription en ligne sont-ils sûrs et privés?

Les services de transcription en ligne sont-ils sûrs et privés?

La transcription était autrefois un processus manuel et fastidieux. Les médecins, les journalistes et une multitude de professionnels variés enregistraient leurs notes et leurs conversations sur une bande Dictaphone grattante, puis s'asseyaient devant leurs ordinateurs pour les taper.

Avance rapide jusqu'en 2020, et il existe une variété de services que vous pouvez utiliser pour transformer un enregistrement audio en texte sur un écran d'ordinateur. Cependant, une question demeure: sont-ils sûrs? Après tout, vous téléchargez peut-être des enregistrements vocaux de conversations sensibles et de messages vocaux privés.

Voyons ces services et comment vous pouvez protéger vos informations.

Fonctionnement des services de transcription audio

Les services de transcription audio ont tendance à se répartir en trois camps. Le premier est entièrement piloté par ordinateur et utilise l'IA et les modèles d'apprentissage automatique existants pour traiter la conversation. Le second est le plus cher car les gens font le gros du travail. Le troisième est une combinaison de traitement informatique et d'humains.

Vous êtes probablement le plus familier avec la première catégorie. Les services de transcription vocale, tels que ceux proposés par Google, Apple et Otter.ai, convertissent les ondes analogiques créées par votre voix en une représentation numérique. Il les décompose ensuite en petits segments (parfois, au millième de seconde) et les associe à des «phonèmes» ou éléments d'une langue connus.

Ces algorithmes tentent ensuite de les examiner dans le contexte d'autres phonèmes et de les soumettre à des modèles statistiques et IA qui produisent finalement du texte. Parce que ces services de transcription sont entièrement pilotés par ordinateur, ils ont tendance à être les plus économiques à exécuter. Cependant, la précision n'est pas toujours d'actualité, en particulier lorsqu'il s'agit d'extraire du texte dans des environnements bruyants ou à plusieurs personnes.

La transcription à propulsion humaine implique des plates-formes dédiées, comme Rev, qui connectent les clients à un pool de transcripteurs pré-approuvés. Vous pouvez également embaucher quelqu'un d'un marché indépendant, comme Upwork ou Fiverr, pour vous transcrire.

Enfin, il y a le mélange des deux. Pour accélérer le processus de transcription, certains sites permettent à l'IA de faire le travail préliminaire, puis quelqu'un nettoie la sortie et corrige les erreurs.

Les services de transcription se comportent mal

Ces dernières années, de nombreux services de transcription ont fait l'objet de violations et de scandales.

Peut-être le plus ancien (et, sans doute, le plus choquant) était SpinVox, qui, dans les années 2000, offrait un service qui transformait les messages vocaux en messages SMS. À l'époque, cela n'était rien de moins qu'une percée technologique. L'entreprise a rapidement attiré une presse positive, des clients et de vastes fonds de financement.

Le problème? À l'insu des clients, leurs messages vocaux ont été traités par des personnes travaillant dans des bureaux situés au Pakistan, à Maurice et en Afrique du Sud. Un initié de l'entreprise a affirmé que seulement 2% des messages vocaux étaient traités par machine et que le reste était traité par environ 10 000 travailleurs exploités.

Lorsque les employés d'un bureau pakistanais de SpinVox n'étaient pas payés, ils ont commencé à envoyer des messages directement aux clients pour protester. Finalement, la vérité est apparue et SpinVox a perdu une grande partie de sa valeur. Finalement, les restes de l'entreprise ont été vendus à Nuance, l'un des plus grands fournisseurs de reconnaissance vocale au monde.

Plus récemment, le journaliste de cybersécurité, Brian Krebs, a découvert une faille majeure survenue chez MEDantex, un fournisseur de services de transcription vocale basé au Kansas pour les professionnels de la santé. Comme on pouvait s'y attendre, des données (dont certaines remontaient à 2007) contenant des dossiers médicaux sensibles ont été divulguées. Le contenu peut être téléchargé à partir d'un portail non sécurisé sous forme de fichiers Microsoft Word.

Même les services de transcription numérique ne sont pas sûrs. Après tout, lorsque vous utilisez un service entièrement informatisé, l'entreprise peut faire appel à des sous-traitants humains pour effectuer un contrôle qualité.

En 2019, le site d'information belge VRT NWS a découvert que des sous-traitants de Google écoutaient des conversations entre des particuliers et leurs assistants intelligents Google Home. Un entrepreneur a même fourni à VRT NWS un accès à des conversations, dont beaucoup étaient de nature profondément sensible (et, dans certains cas, sexuellement intime).

Amazon, Apple et Microsoft utilisaient également des sous-traitants de cette manière. En d'autres termes, quelqu'un peut écouter les enregistrements vocaux de votre assistant virtuel.

Les services de transcription en ligne sont-ils sûrs?

La question la plus pertinente est de savoir si les services de transcription en ligne sont sûrs. Malheureusement, la réponse est un peu compliquée.

L'espace de transcription vocale est, à ce stade, largement mature. Les mauvais acteurs les plus flagrants ont été éliminés.

Néanmoins, lorsque vous confiez vos données (dans ce cas, des conversations privées) à un tiers, vous comptez sur elles pour les protéger. Cela est tout aussi vrai pour les services en ligne que pour les transcripteurs humains.

En fin de compte, vous devez vous demander deux choses: faites-vous confiance au service et quelle est la sensibilité de vos conversations?

Lorsque vous recherchez un service de transcription, cela vaut toujours la peine de faire des recherches. L'entreprise a-t-elle une bonne réputation? Est-il bien établi? At-il fait l'objet d'une violation de données dans le passé? Existe-t-il une politique de confidentialité expliquant clairement comment vos données seront traitées et sécurisées?

Comme nous l'avons mentionné précédemment, les services basés sur l'IA s'appuient fréquemment sur des employés et des sous-traitants tiers pour effectuer des contrôles de qualité. Bien que ces vérifications représentent une fraction de toutes les transcriptions, il y a toujours une chance que quelqu'un écoute votre conversation.

Dans de nombreux cas, cependant, ce n'est pas une rupture. Cependant, si votre conversation est profondément privée ou sensible au commerce, vous voudrez peut-être envisager d'ouvrir un éditeur de texte et de transcrire à l'ancienne.

★★★★★