SEO vocal et monétisation des applications vocales

Les assistants vocaux s’inscrivent dans les enjeux du marketing digital mais les règles et techniques du web et des applications mobiles ne s’appliquent plus.

Il est nécessaire de penser un positionnement marketing spécifique, tout en l’inscrivant dans une expérience digitale multi-support.

Découverte

L’usage premier des assistants vocaux est intuitif.

L’utilisateur ne consulte pas toujours les répertoires d’applications, ou s’il le fait, a du mal à retenir les noms précis des applications. 48% des utilisateurs d’enceintes connectées ont déjà utilisé une application tierce, hors de fonctions natives d’Alexa ou Google (source Voicebot).

Alexa nécessitait jusqu’à présent de s’abonner à des skills.

Google Assistant permet d’appeler des applications directement sans s’y abonner. Pour cela, on peut consulter un répertoire d’applications et dire le nom de l’application (“évocation explicite”), ou être conseillé par l’assistant qui propose des applications correspondant aux besoins exprimés par l’utilisateur.

Alexa évolue progressivement vers ce modèle (“évocation implicite”).

-Les répertoires d’applications et l’évocation explicite

La mise en avant dans les répertoires d’applications multiplie les visites (x10 à x1000 selon notre propre expérience) mais nécessite un travail spécifique et constant pour se maintenir.

Ces techniques s’apparent à du SEO, mais avec des règles bien spécifiques que seule l’expérience nous a permis de découvrir.

Le choix du nom de l’application est important pour l’audience, et nécessite d’être accompagné en fonction de retours d’expériences similaires. En parallèle, aux États-Unis, plusieurs skills Amazon ont mené des campagnes digitales de communication classique pour faire connaître leur nom.

 

-L’évocation implicite

La plupart du temps, l’utilisateur utilise des noms communs pour exprimer son besoin plutôt que le nom d’une marque. C’est l’assistant vocal qui l’oriente vers la bonne application.

Contrairement au SEO et au SEA sur le web, les assistants vocaux ne proposent qu’un résultat. Au mieux un nombre très restreint. Le premier remporte tout le trafic !

Les algorithmes de choix par Google et Alexa ne sont pas publics, mais là encore, l’expérience nous ont permis de mieux les appréhender.

Chaque cas doit s’étudier spécifiquement mais on citera en particulier quelques règles générales :

– l’importance des avis

– l’adaptation à l’historique de l’utilisateur

– l’importance d’être la première application à répondre à un besoin ou un mot-clef

– l’intérêt du “deep linking” vocal, et la nécessité de le concevoir de manière spécifique

Monétisation

 

Dans un marché naissant, le retour sur investissement des applications vocales est encore un pari; beaucoup essaieront sans trouver un modèle clair, mais les premiers qui réussiront trouveront un différenciant.

Il est difficile d’isoler un retour sur investissement spécifique à la voix sans l’intégrer dans un parcours plus global.

 

Les méthodes de monétisation directe reste à inventer, à ce jour on recense :

– les achats de voice commerce mentionnés au paragraphe précédent, correspondants à des situations d’achats et des types de produits précis

– des achats in-app de contenus à valeur ajoutée

 

Le retour sur investissement est encore aujourd’hui essentiellement indirect

– association de la marque à un nom propre et visibilité digitale

– accès facilité au service client, et fonctions simples de relation avec la marque ou le service client.

 

Les possibilités de monétisation sont dépendantes des fonctions mises à dispositions par Google et Amazon, qui évoluent rapidement. L’API de transaction n’a par exemple été ouverte en France qu’en Avril 2018.

Il est important d’assurer une veille pour anticiper leur ouverture et pouvoir les exploiter en premier.

Ce type d’information sur les perspectives et les roadmaps est souvent diffusé par le réseau de développeurs et notamment les animations réservés aux développeurs avancés.

Engagement et Rétention

Sans veiller à la rétention, une fois qu’un utilisateur trouve une application, il n’y a que 6% de chances qu’il continue à l’utiliser après 2 semaines (source VoiceLabs report).

Aujourd’hui, des systèmes d’abonnements et de notifications sont disponibles. Ce sont des outils efficaces pour renforcer l’engagement; il est cependant nécessaire de bien tester la pertinence et le nombre des notifications.

Le premier facteur d’engagement est la qualité de sa première expérience. La conception de l’expérience utilisateur lors du premier usage, puis lors des réusages, est essentielle.

Concevoir une Application vocale

Les interfaces vocales ont des spécificités dont la conception doit tenir compte.

Nous les résumons selon 9 principes :
Immédiateté

 Naturel

 Facilité

 Linéarité

 Unidirectionnalité

 Ecoute

 Norme

 Contexte

 Expérience

 

Immédiateté

L’appel à une commande vocale est immédiat :
“ Alexa, quelle est la météo à Paris pour demain ?”

Une même demande sur une application mobile nécessite de :

– chercher et prendre son téléphone

– le déverrouiller

– chercher l’application

– l’ouvrir, attendre qu’elle se charge

– reposer son téléphone

 

L’expérience utilisateur la plus appréciée sera celle qui conserve cette immédiateté.

Les réponses longues, les listes de choix à rallonge sont à éviter.

 

Naturel

Le voicebot s’appuie sur le langage oral commun, qui ne peut être encadré. Il est bien différent de la manière dont on s’exprime par écrit.

La compréhension des mots et du langage naturel ne sera pas la même dans un bot écrit et un bot vocal, un apprentissage spécifique est à prévoir.

Dans le cas de la construction simultanée d’un chatbot et d’un voicebot, il est recommandé de commencer la construction du dialogue par la partie vocale car celle-ci doit respecter plus de contraintes. Et bien qu’il soit possible de s’inspirer du schéma de dialogue d’un chatbot pour l’interface vocale, il n’est pas recommandé de transposer le chatbot qui pourrait avoir des réponses que ne sont pas adaptées.

 

Facilité

Les mots sont dits trois fois plus vite qu’ils ne sont écrits.

Même s’il est nécessaire de demander des réponses précises, l’utilisateur ne doit pas se sentir contraint dans ses réponses comme dans un serveur vocal interactif
(“choix 1”), ni devoir retenir des fonctions et des mots d’appels.


Linéarité
Quand une personne lit un texte ou regarde une image, elle a tout le loisir de s’arrêter sur un mot qu’elle n’a pas compris. Lorsque celle-ci écoute la réponse à sa commande vocale, il lui est impossible de mettre en pause. Elle est souvent obligée d’être attentive à son assistant et d’attendre la fin de la réponse pour pouvoir le réengager. Pour limiter cette gêne, il est recommandé de marquer des temps de pause dans le dialogue si beaucoup d’informations sont énoncées.

 

Unidirectionnalité

Il sera plus difficile pour un usager de naviguer dans du contenu au format audio interactif que sur une interface tactile. Sur une interface vocale, Il ne pourra pas facilement passer un passage qui lui apportera peu de substance ou revenir en arrière sur une information qui l’a marquée. Pour dynamiser le dialogue, il est recommandé d’utiliser des énoncés concis.

Ecoute

L’usager d’une interface vocale n’a pas de support graphique pour accompagner son expérience. Il doit écouter et retenir chaque choix qui lui est proposé. Pour ne pas saturer sa charge mentale, il est conseillé de proposer un nombre d’options disponibles limités.

Quand c’est au tour de l’application vocale d’écouter, si on attend de l’utilisateur plusieurs informations, il vaut mieux lui demander en plusieurs étapes pour alléger sa charge mentale.

 

Norme

Afin de garantir une homogénéité d’interaction pour des demandes similaires faites dans des applications existantes, des normes existent : pour les transactions sur Google Home, l’écoute d’un média sur Alexa. L’utilisateur s’habitue à ces normes spécifiques à chaque plateforme et il est préférable de les suivre.

 

 

 

Contexte

L’interface vocale sera conçue différemment selon le contexte d’usage (en cuisinant, au volant, en effectuant des tâches manuelles…). Chacun de ces contextes doit être précisé dès le début de la création de l’application vocale.

 

Expérience

L’interaction vocale est ressentie comme plus “humaine” qu’une interaction texte.

On s’attend à une relation personnelle, qui nécessite le design d’une expérience personnalisée.

 

 

 

Voici 10 recommandations à suivre pour une application vocale réussie.

 

1. Se concentrer sur une fonction

– éviter un risque de confusion auprès des usagers

– optimiser la qualité d’un usage de l’application en particulier

2. Commencer par écrire le dialogue idéal

– puis gérer chaque sortie du script

– rediriger l’usager vers le chemin idéal

3. Simuler le dialogue à voix haute

– mieux visualiser le rendu du parcours à l’oral
– optimiser les tournures de dialogue

 

4. Écrire des dialogues courts

– ne pas saturer la chargement mentale de l’usager

– ne pas proposer trop d’options à l’utilisateur

 

5. Récupérer les choix de l’usager séparément

– faire énoncer les informations attendues une par une

– indiquer qu’une réponse est attendue via une forme interrogative ou impérative

 

6. Guider l’utilisateur dans la formulation du dialogue

– l’utilisateur ne sait pas forcément ce qu’il faut dire ou faire
– présenter les choix disponibles clairement : “Désirez-vous lire vos nouveaux messages ou en écrire un nouveau ?” VS “Que souhaitez-vous faire ?

7. Utiliser des silences et des “icônes” audio

– accentuer certains mots importants

– rendre l’expérience plus divertissante et se démarquer

 

8. Organiser une bêta test

– impossible de prédire comment va réagir un utilisateur au script de dialogue

– itérer en continue en fonction des retours

 

9. Personnaliser l’expérience

– raccourcir certains passage de dialogue pour les utilisateurs expérimentés

– créer une expérience sur-mesure, ex : “Bonsoir Quentin”

 

10. Faciliter la découverte de l’application

– améliorer les manières de déclencher l’application via le Voice SEO

– optimiser la présentation de l’application (titre, icône, description)