Une nouvelle façon d'utiliser la parole pour améliorer le service client

Orange API ferme ses portes le service sera définitivement interrompu à dater du 12 septembre 2013

http://api.orange.com/fr/fermeture-orange-api

 

La plupart d'entre nous ont déjà appelé des centres de service client dotés d'un système de reconnaissance de la parole. Les avis à ce sujet sont partagés : certains apprécient de se voir rapidement proposer une solution à leur problème, alors que pour d'autres, leurs erreurs d'interprétation et leur ton condescendant sont rédhibitoires. L'avenir de ces services suscite donc des interrogations : étant donné les critiques dont elles font l'objet, les communications vocales sont-elles plus efficaces et conviviales que les systèmes à touches ? En outre, les applications de gestion de la relation client peuvent-elles utiliser la reconnaissance de la parole à d'autres fins que le simple traitement des appels téléphoniques ?

À l'heure où se généralisent les smartphones multifonctions équipés d'applications et d'accès à internet, les interactions avec les services clients se doivent d'être conviviales. Or, l'introduction des données sur le web passe nécessairement par le clavier, alors que le téléphone privilégie la parole. La possibilité d'une interaction optimale avec un service client via un smartphone est donc limitée et la plupart du temps non gérée. La majorité des smartphones sont dotés d'un clavier virtuel qui rend la saisie des données laborieuse et nécessite de nombreuses corrections pour obtenir une phrase exacte. Tout en aspirant à une solution plus pratique, de nombreux utilisateurs de smartphones ne sont pas prêts pour autant à se passer de leur grand écran, de leur interface tactile et de la possibilité de glisser l'appareil dans leur poche.


L'analyse du comportement des consommateurs peut nous permettre de dégager une tendance émergente afin de prévoir les futurs axes de développement des entreprises. L'application Siri est disponible gratuitement sur l'App Store d'Apple. Conçue comme un assistant personnel, cette application enregistre vos listes de tâches et déclenche immédiatement la requête correspondante, en l'associant aux données déjà connues sur vous-même et sur l'environnement externe (application disponible uniquement aux Etats-unis pour l'instant). Vous pouvez par exemple soumettre à Siri les demandes suivantes : « J'ai besoin d'un taxi » ou « Je souhaite contacter mon réseau social vers 17 h 30 » ou « Trouve-moi le distributeur automatique de billets le plus proche ». Ces informations s'affichent sur l'écran de l'iPhone et, la plupart du temps, vous n'avez même pas à en ajouter d'autres, car Siri comprend votre requête, localise votre emplacement et accède à vos données personnelles. L'application exécute ensuite les actions appropriées (réservation d'un taxi, affichage des films programmés à proximité de chez vous ou d'une carte indiquant l'emplacement des DAB les plus proches, par exemple). Et cela fonctionne étonnamment bien. C'est aussi l'avis de Steve Jobs, dont l'obsession pour la qualité est bien connue, si l'on en croit la récente acquisition par Apple de l'application pour plus de 200 millions de dollars.

Siri et d'autres assistants personnels similaires comme Tellme sur Windows Phone utilisent une technologie de transcription parole-texte qui permet de convertir un énoncé oral sous forme de texte. Chaque phrase est analysée au moyen d'algorithmes de lexicographie computationnelle pour en déduire la signification et en extraire un objet (cinéma, taxi, DAB...) et une action (afficher, réserver, trouver...). L'assistant personnel ajoute ensuite automatiquement des informations issues des capteurs du smartphone (comme sa localisation) et des données personnelles (nom, préférences, recherches précédentes) pour situer l'action dans son contexte. Ces données permettent à l'application d'évaluer au mieux le besoin de l'utilisateur, d'interagir avec les services web en arrière-plan et de retourner les résultats. Grâce aux débits internet toujours plus élevés proposés par les opérateurs, la plupart des traitements, notamment la reconnaissance de la parole, n'ont plus besoin d'être effectués au niveau du smartphone. Ils se déroulent en arrière-plan, où des machines plus rapides et des économies d'échelle garantissent des résultats performants.

Ces applications fonctionnent remarquablement bien. À l'inverse des systèmes de réponse vocale interactive (RVI) précédemment expérimentés, les systèmes actuels de reconnaissance de la parole sont principalement localisés dans le nuage (cloud computing) et sont accessibles par un grand nombre d'entreprises différentes. L'avantage de cette architecture dématérialisée réside dans le fait que chaque phrase prononcée par les utilisateurs ne sert pas uniquement à des fins de reconnaissance de la parole, mais permet également d'améliorer le moteur de reconnaissance vocale sous-jacent. Il en résulte que plus ce moteur sera utilisé, meilleures seront ses performances. Cette amélioration continue a un impact très positif sur la qualité de ces systèmes, notamment en termes de confort d'utilisation et de performances. Et ce n'est pas tout : avec l'accroissement des débits internet en 3G (et désormais en 4G) proposés par les opérateurs, l'interaction vocale avec un terminal mobile peut prendre moins de 30 secondes. Il est intéressant de rapprocher ce résultat du niveau de satisfaction d'un utilisateur dont la durée d'interaction moyenne est de 3 minutes pour un système de RVI ou de 5 minutes sur le web.

Mais alors quelles sont les opportunités offertes aux entreprises par ce type d'applications ? Le point positif est que, jusqu'à présent, la majorité d'entre elles sont utilisées par le grand public et que peu de services clients y recourent. Les entreprises bénéficient donc d'une opportunité de développer considérablement leur offre en proposant une interface conviviale, performante et dotée d'une fonction de reconnaissance vocale avec leur service client. Ce type d'interface peut aisément être appliquée dans de nombreux secteurs d'activité. Ainsi, dans le domaine de la santé, on pourrait concevoir un service permettant aux patients de demander « J'ai besoin de faire une demande de remboursement » ou « Je dois consulter rapidement un médecin à propos de mon rhume ». Dans le domaine des services financiers, on pourrait formuler des requêtes du type « J'ai besoin de transférer 1 000 euros de mon compte courant à mon compte épargne » ou « J'aimerais acheter 30 actions France Télécom ». La personnalisation fait déjà partie de votre smartphone : celui-ci vous permet de transmettre des données comme votre nom, vos données médicales ou votre historique bancaire, afin de les exploiter pour mieux répondre à vos demandes sans intervention de votre part. Au final, le gain de temps dans la saisie de données pour les utilisateurs et un processus de prise de décision moins coûteux pour les entreprises, constituent une une proposition de valeur selon un modèle gagnant-gagnant.

Mais quelques problèmes se posent lorsqu'il s'agit de concevoir des applications de service client dotées de systèmes de reconnaissance de la parole sur smartphone, ce qui n'est pas le cas pour les applications VoiceXML, normalisées et très répandues. Au-delà du manque de références et de savoir-faire, il n'existe pas encore de normes simples comme VoiceXML pour favoriser les développements. Et peu de développeurs sont compétents conjointement dans l'interface utilisateur du smartphone et la reconnaissance de la parole. Alors si vous trouvez des développeurs ou des entreprises possédant cette double compétence, ne tardez pas à les contacter et à vous mettre sur les rangs ! De nombreux opérateurs comme Orange commencent à proposer ce type d'offres de services ciblées vers les entreprises qui souhaitent tirer parti de la révolution des smartphones.

En conclusion, les smartphones ont créé un nouveau média interactif grâce auquel les services clients peuvent être accessibles plus efficacement et avec de meilleurs résultats. Hélas, les systèmes en vigueur actuellement pour appeler ces services ont des fonctionnalités limitées, frustrent les utilisateurs et ne sont pas vraiment optimisés pour exploiter toutes les possibilités offertes par les smartphones. Or, pour des raisons financières, les entreprises ne donneront pas de si tôt à leurs clients un accès à des interlocuteurs en direct. La meilleure façon d'optimiser l'expérience client sur les smartphones est donc d'exploiter leur écran large comme dispositif de sortie pour restituer la parole enregistrée en entrée. Pour parvenir à ce juste équilibre, n'oubliez pas d'encourager financièrement vos développeurs pour les nouvelles compétences qu'ils devront bientôt acquérir.

Nicolas Jacquey
Adam Odessky

I am a Product Manager at Orange Silicon Valley and the creative force behind Sens.ly. I have a passion for creating game-changing products and I created one of the first enterprise voice portals, a speech-based outbound IVR platform and a location-based social network. I also holds several provisional patents in the areas of healthcare, security, telecommunications and augmented reality.