Concevoir une Application vocale

Les interfaces vocales ont des spécificités dont la conception doit tenir compte.

Nous les résumons selon 9 principes :
Immédiateté

 Naturel

 Facilité

 Linéarité

 Unidirectionnalité

 Ecoute

 Norme

 Contexte

 Expérience

 

Immédiateté

L’appel à une commande vocale est immédiat :
“ Alexa, quelle est la météo à Paris pour demain ?”

Une même demande sur une application mobile nécessite de :

– chercher et prendre son téléphone

– le déverrouiller

– chercher l’application

– l’ouvrir, attendre qu’elle se charge

– reposer son téléphone

 

L’expérience utilisateur la plus appréciée sera celle qui conserve cette immédiateté.

Les réponses longues, les listes de choix à rallonge sont à éviter.

 

Naturel

Le voicebot s’appuie sur le langage oral commun, qui ne peut être encadré. Il est bien différent de la manière dont on s’exprime par écrit.

La compréhension des mots et du langage naturel ne sera pas la même dans un bot écrit et un bot vocal, un apprentissage spécifique est à prévoir.

Dans le cas de la construction simultanée d’un chatbot et d’un voicebot, il est recommandé de commencer la construction du dialogue par la partie vocale car celle-ci doit respecter plus de contraintes. Et bien qu’il soit possible de s’inspirer du schéma de dialogue d’un chatbot pour l’interface vocale, il n’est pas recommandé de transposer le chatbot qui pourrait avoir des réponses que ne sont pas adaptées.

 

Facilité

Les mots sont dits trois fois plus vite qu’ils ne sont écrits.

Même s’il est nécessaire de demander des réponses précises, l’utilisateur ne doit pas se sentir contraint dans ses réponses comme dans un serveur vocal interactif
(“choix 1”), ni devoir retenir des fonctions et des mots d’appels.


Linéarité
Quand une personne lit un texte ou regarde une image, elle a tout le loisir de s’arrêter sur un mot qu’elle n’a pas compris. Lorsque celle-ci écoute la réponse à sa commande vocale, il lui est impossible de mettre en pause. Elle est souvent obligée d’être attentive à son assistant et d’attendre la fin de la réponse pour pouvoir le réengager. Pour limiter cette gêne, il est recommandé de marquer des temps de pause dans le dialogue si beaucoup d’informations sont énoncées.

 

Unidirectionnalité

Il sera plus difficile pour un usager de naviguer dans du contenu au format audio interactif que sur une interface tactile. Sur une interface vocale, Il ne pourra pas facilement passer un passage qui lui apportera peu de substance ou revenir en arrière sur une information qui l’a marquée. Pour dynamiser le dialogue, il est recommandé d’utiliser des énoncés concis.

Ecoute

L’usager d’une interface vocale n’a pas de support graphique pour accompagner son expérience. Il doit écouter et retenir chaque choix qui lui est proposé. Pour ne pas saturer sa charge mentale, il est conseillé de proposer un nombre d’options disponibles limités.

Quand c’est au tour de l’application vocale d’écouter, si on attend de l’utilisateur plusieurs informations, il vaut mieux lui demander en plusieurs étapes pour alléger sa charge mentale.

 

Norme

Afin de garantir une homogénéité d’interaction pour des demandes similaires faites dans des applications existantes, des normes existent : pour les transactions sur Google Home, l’écoute d’un média sur Alexa. L’utilisateur s’habitue à ces normes spécifiques à chaque plateforme et il est préférable de les suivre.

 

 

 

Contexte

L’interface vocale sera conçue différemment selon le contexte d’usage (en cuisinant, au volant, en effectuant des tâches manuelles…). Chacun de ces contextes doit être précisé dès le début de la création de l’application vocale.

 

Expérience

L’interaction vocale est ressentie comme plus “humaine” qu’une interaction texte.

On s’attend à une relation personnelle, qui nécessite le design d’une expérience personnalisée.

 

 

 

Voici 10 recommandations à suivre pour une application vocale réussie.

 

1. Se concentrer sur une fonction

– éviter un risque de confusion auprès des usagers

– optimiser la qualité d’un usage de l’application en particulier

2. Commencer par écrire le dialogue idéal

– puis gérer chaque sortie du script

– rediriger l’usager vers le chemin idéal

3. Simuler le dialogue à voix haute

– mieux visualiser le rendu du parcours à l’oral
– optimiser les tournures de dialogue

 

4. Écrire des dialogues courts

– ne pas saturer la chargement mentale de l’usager

– ne pas proposer trop d’options à l’utilisateur

 

5. Récupérer les choix de l’usager séparément

– faire énoncer les informations attendues une par une

– indiquer qu’une réponse est attendue via une forme interrogative ou impérative

 

6. Guider l’utilisateur dans la formulation du dialogue

– l’utilisateur ne sait pas forcément ce qu’il faut dire ou faire
– présenter les choix disponibles clairement : “Désirez-vous lire vos nouveaux messages ou en écrire un nouveau ?” VS “Que souhaitez-vous faire ?

7. Utiliser des silences et des “icônes” audio

– accentuer certains mots importants

– rendre l’expérience plus divertissante et se démarquer

 

8. Organiser une bêta test

– impossible de prédire comment va réagir un utilisateur au script de dialogue

– itérer en continue en fonction des retours

 

9. Personnaliser l’expérience

– raccourcir certains passage de dialogue pour les utilisateurs expérimentés

– créer une expérience sur-mesure, ex : “Bonsoir Quentin”

 

10. Faciliter la découverte de l’application

– améliorer les manières de déclencher l’application via le Voice SEO

– optimiser la présentation de l’application (titre, icône, description)

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *