Qui parle ?

Un crie de « Maman, regarde ! » ou  « Papa, par içi ! » émis dans une cour de récréation attirera tout de suite l’attention du parent en question, tandis que les autres adultes n’y prêteront aucune attention après avoir instinctivement reconnu que la voix n’appartenait pas à leur progéniture. L’entreprise espagnole Agnitio a développé une machine capable de reproduire le comportement du cerveau de ces parents : reconnaître LA voix importante parmi un capharnaüm.

 

(Crédit photo: Agnitio)

(Crédit photo: Agnitio)

 

C’est ce qu’on appelle la reconnaissance vocale. Un principe qui ne doit pas être confondu avec celui de la reconnaissance automatique de parole, car ils sont radicalement différents. Bien que ces deux principes requièrent un enregistrement de la voix humaine, la reconnaissance de parole vise à identifier les mots pour les retranscrire sous la forme d’un texte exploitable par une machine. La reconnaissance vocale, pour sa part, néglige le langage pour détecter plutôt la personne qui s’exprime. En bref, la biométrie vocale cherche à reconnaître le locuteur plutôt que ce qu’il dit.

 

La gamme de produits BS³ d’Agnitio forme un ensemble complet de produits d’identification du locuteur pouvant être intégrés dans diverses plateformes de surveillance destinés aux marchés militaire et du renseignement. La biométrie vocale, qui fonctionne indépendamment du texte, du canal de diffusion et du langage, utilise les informations relatives au larynx d’un individu pour obtenir un niveau élevé de précision et de fiabilité. Les fonctionnalités de la gamme BS³ s’étendent de l’interception légale aux applications d’identification sur le terrain, du déploiement à grande échelle aux solutions opérationnelles et tactiques, et des capteurs électroniques à la récolte de conversations humaines.

 

Agnitio affirme que la précision et la vitesse du processeur de BS³ lui permettent de repérer des cibles sonores parmi des millions d’appels et de trouver des relations entre les locuteurs à partir de gros fichiers audio. Il peut, par exemple, détecter jusqu’à 2000 heures de son par jour en étant hors ligne et exploiter jusqu’à 50 canaux simultanément en mode continu. Voici ce que serait une application dite « stratégique ».

 

La version tactique, quant à elle, est conçue pour effectuer une surveillance vocale lorsque des décisions doivent être prises en temps réel.

 

D’après le logo sur son site web, Agnitio fait désormais « partie du groupe Nuance », bien qu’aucune annonce de ce récent changement n’ait été officialisée ni par Agnitio ni par Nuance et que ni l’une ni l’autre n’aient voulu répondre à nos questions. De toute évidence, notre voix n’a pas été identifiée !