La reconnaissance vocale est devenue omniprésente dans notre quotidien, car elle apparaît dans de nombreux secteurs.
Elle est utilisée dans le domaine de l’automobile, avec les voitures modernes, où il suffit de citer l’adresse pour que le GPS se déclenche. De plus, ce système permet aussi d’envoyer ou d’appeler sans qu’on utilise notre téléphone. C’est donc un moyen pratique, car ça évite aux conducteurs de prendre leurs mobiles au volant.
La reconnaissance vocale, ou reconnaissance automatique de la parole, est aussi présente dans le secteur médical. Les médecins utilisent un outil, appelé le “Dragon Medical One”. Celui-ci fonctionne comme un micro. Il suffit de parler dedans pour que le texte soit traduit en même temps.
Mais, en quoi est lié l’accessibilité numérique et la reconnaissance vocale ? L’accessibilité numérique, comme vu précédemment, est un moyen permettant aux personnes en situation de handicap d’accéder à des contenus web. Son objectif principal est d'offrir les mêmes possibilités que les autres en matière de nouvelles technologies. La reconnaissance vocale permet à ces personnes de contrôler l’ouverture des fichiers, de faire des recherches sur Internet, de dicter pour écrire dans des documents à l’aide de la voix. Ce système rend énormément service aux personnes atteintes de handicap moteur, car utiliser un clavier ou une souris peut être très douloureux, voire impossible pour eux. Mais, elle n’est pas seulement bénéfique pour ce type de handicap, comme nous le verrons dans la suite de l'article.
Mais qu’est-ce que c’est ?
La reconnaissance vocale est une fonctionnalité qui utilise le langage humain pour le transcrire en texte. C’est un dispositif qui permet de capter la voix humaine à l’aide d’un microphone. Ensuite, une fois la parole obtenue, le système va analyser le signal acoustique, c’est-à-dire faire une étude des mots, des accents, de la prononciation… Par la suite, le signal sera alors converti en données numériques. Celles-ci seront interprétées puis retranscrites sous forme de texte. C’est ce qu’on appelle la “reconnaissance vocale”.
Elle se base sur cinq modèles de techniques de reconnaissances :
Le pré-traitement acoustique qui représente le moment de parole lors de l’enregistrement,
Le modèle de prononciation est l’analyse des sons individuels (phonèmes) de la parole humaine,
Le modèle acoustique est le lien entre le signal audio et les phonèmes qui composent la parole,
Le modèle linguistique est le modèle statistique de la distribution de symbole comme les lettres, les phonèmes, et les mots de la parole humaine,
Et le décodeur qui combine l’ensemble des modèles pour former la transcription.
Est-elle bénéfique pour tout le monde ?
La reconnaissance vocale est bénéfique pour différentes personnes.
Premièrement, les personnes ayant une déficience physique, motrice ou sensorielle peuvent en avoir besoin, car il apporte des solutions aux personnes ayant des difficultés à utiliser le matériel informatique.
Elle peut être utilisée par les personnes aveugles ou malvoyantes, car la commande vocale est utile pour lire ce qui est affiché à l'écran.
Ensuite, les personnes à mobilité réduite, comme les personnes en fauteuil roulant, peuvent accéder à l’information, naviguer sur Internet, communiquer, sans avoir à manipuler des objets en ayant recours à la reconnaissance vocale. Certains dispositifs permettent aussi aux personnes de contrôler des appareils domestiques intelligents.
De plus, les personnes ayant un handicap cognitif peuvent l’utiliser, car plus une interface est complexe, plus la personne aura de difficulté à l’utiliser. Le contrôle vocal va donc être important pour que la personne exécute certaines tâches.
Les personnes autistes peuvent se servir de cette reconnaissance, car ce système peut être un outil de “communication augmentée et d'alternative” (CAA), afin qu’elles puissent s’exprimer, communiquer avec tout le monde.
Elle peut être aussi bénéfique pour les personnes âgées qui rencontrent des difficultés pour utiliser les appareils informatiques.
Des exemples de reconnaissance vocale
Il existe différents types de reconnaissance vocale comme des assistants virtuels tels que Siri d’Apple, Google Assistant de Google, ou encore Alexa d’Amazon. Ce sont des intelligences artificielles qui comprennent les instructions verbales demandées par les utilisateurs, en répondant à leurs requêtes.
Des logiciels de dictée tels que Dragon NaturallySpeaking, permettent aux personnes de dicter du texte à leur ordinateur. Il convertit la parole de l’utilisateur en texte.
De plus, de nombreux téléphones proposent la fonctionnalité “dictée” pour envoyer des messages. Il suffit de parler et le système écrit ce que l’on dit. Il existe également des services de transcription audio qui transcrivent automatiquement les enregistrements en texte, comme Otter.ai.
L'iPhone dispose aussi de ce dispositif depuis la dernière mise à jour. En effet, lorsque nous faisons un audio, une transcription automatique se fait. Ceci est très pratique, car si nous sommes dans un endroit où nous ne pouvons pas écouter de message audio, nous pouvons quand même voir ce qui a été dit dedans.
En résumé …
… La reconnaissance vocale améliore l'accessibilité et l'autonomie des personnes en situation de handicap en leur permettant de communiquer, d'interagir avec la technologie. Elle est essentielle dans l’inclusion des personnes en situation de handicap.
La différence avec le contrôle vocal sera étudié dans le prochain article de MARDI, 13h !
Références
Comments