Les bots et leur place dans nos vies

Cet article est une réponse de Tobias Goebel au fondateur de Kik, Ted Livingston

Tobias Goebel est directeur du département technologies émergentes chez Aspect Software

Tobias Goebel Aspect SoftwareDans un article récent publié sur Medium (et traduit en français par ContactDistance), Ted Livingston, le président de Kik, une application de messagerie instantanée majeure dont l’ambition est de devenir le prochain écosystème de nos vies digitales, expose sa vision d’un futur proche où nous serons en mesure d’interagir instantanément avec le monde autour de nous.

Un monde de bots

Il imagine que ce monde reposera sur des bots qui seront présents dans tout notre environnement immédiat : depuis les sièges d’un stade aux tables d’un restaurant et à plein d’autres choses. Son idée est qu’au lieu de télécharger l’application mobile de chaque entreprise avec laquelle nous sommes en contact, on engagera plutôt le dialogue par l’intermédiaire de plateformes de messagerie où opéreront des scripts automatiques qui permettront de réaliser les opérations souhaitées.

La fatigue des applications

Une chose s’est déjà vérifiée : ce qu’on pourrait appeler un phénomène de lassitude pour les applications. Livingston : « il existe tout un tas d’applications : des applications pour commander des billets de train en gare ; des applications pour commander à manger au restaurant ; et des applications pour commander des tickets tandis que l’on est au cinéma. Tout le monde vous exhorte : Téléchargez notre application ! Après avoir dépensé des millions pour les développer, combien de personnes les utilisent réellement ? À mon avis : très peu. »

On partage son avis. Une chose que j’entends constamment de la part de nos clients c’est qu’en ce qui concerne leurs applications mobiles de service client, les taux téléchargement sont dans des plages à 1 seul chiffre. Oups.

Un ange gardien qui murmure à votre oreille

La vision de Livingston me rappelle spontanément celle de Michael Saylor de MicroStrategy (un éditeur de logiciels de Business Intelligence). Si on revient en 2000, Saylor décrivait avec une grande évidence un futur dans lequel un réseau de communication intelligent et sans fil serait à même de vous dire où tourner pour éviter les embouteillages, ou si votre vol avait été retardé, ou encore si votre médecin vous avez prescrit un médicament qui était incompatible avec un autre traitement que vous preniez. Ce serait, disait-il, comme un ange gardien qui murmure à votre oreille. C’est à cette époque que fut créée Angel.com (une filiale de MicroStrategy).

La vision d’Angel.com ? Le serveur vocal interactif universel dans un monde où tout et n’importe quoi aurait un numéro de téléphone qu’il suffirait de composer pour obtenir plus d’informations ou engager le dialogue. Inutile de dire que cette vision ne s’est pas transformée en réalité. L’idée d’une voix comme compagnon intelligent est encore un sujet de science-fiction, notamment au cinéma (voir le film Her de Spike Jonze). Est-ce que les choses sont différentes 15 ans plus tard ? Est-ce que l’idée d’une connexion instantanée « au monde qui nous entoure » via des bots ne serait pas aussi improbable ?

Un canal bruyant

Le fait que les applications de messageries soient des interfaces extrêmement faciles à utiliser représente la principale différence entre la vision de Michael Saylor des années 2000 et celle de 2016 de Ted Livingston. L’utilisation de la reconnaissance vocale associée au téléphone n’est jamais apparue comme une solution simple et efficace. En partie à cause de contraintes techniques, mais plus certainement en raison du fait qu’il s’agit d’un « canal bruyant ».

Il est tout simplement impossible d’interagir silencieusement avec une application qui n’accepte que la voix comme moyen d’interaction. Même si vous avez un casque ou une oreillette, il faudra toujours à un moment donner parler à voix haute. Une chose impensable dans les endroits publics, qui sont quand même les lieux où nous passons la plus grande partie de nos journées. Le bureau, les transports en commun, le restaurant ou le stade, pour faire référence à l’anecdote de Livingston, sont tous des environnements où on ne peut pas ou ne veut pas forcément parler à voix haute.

Les défis du langage naturel

Avec les messages textes, vous utilisez encore une interface de communication qui est celle que les hommes préfèrent : le langage naturel. Vous utilisez juste la version silencieuse, le langage écrit.

Il reste, néanmoins, des défis à relever. Apprendre à un ordinateur à comprendre le langage naturel est loin d’être une tâche aisée. Il s’agit d’un domaine de recherche qui mêle intelligence artificielle et linguistique informatique, et qui aujourd’hui mobilise des milliers de chercheurs et d’ingénieurs. De grandes entreprises dépensent des milliards de dollars pour développer des programmes comme IBM Watson, qui à lui seul représente ce qu’IBM appelle « une nouvelle ère informatique ».

Livingston explique, « J’aurais déverrouillé mon téléphone, ouvert mon application de messagerie et scanné un code. Instantanément j’aurais discuté avec le bot du stade, qui m’aurait demandé combien je voulais de bières :  1, 2, 3 ou 4. Il m’aurait demandé de choisir la marque : Bud, Coors ou Corona. »

Des règles de conversation rigides et imposées

Ce qu’il décrit est en réalité une expérience que je détesterais vivre. Je ne veux pas être obligé de suivre des règles de conversation rigides et imposées. Je veux pouvoir exprimer librement ce dont j’ai besoin, d’une manière efficace et rapide. « Apportez-moi 2 Bud Light et 1 Corona au siège 323, s’il vous plait. » C’est ce que les linguistes et les concepteurs d’interfaces conversationnelles appellent la reconnaissance multimodale. Les technologies de compréhension du langage naturel sont capables aujourd’hui d’opérer de la sorte, à partir du moment où elles sont mises en œuvre évidemment.

La démonstration du pdg de Kik est bien entendue, et on le comprend aisément, biaisée quand il explique que le moyen le plus facile d’interagir avec un bot est de scanner un code dans sa propre application Kik.

Le retour du numéro de téléphone

Je pense moi que le moyen le plus facile d’interagir avec un bot est d’envoyer un bon vieux SMS. Pour envoyer un SMS vous n’avez pas besoin d’avoir une connexion data (parfois difficile à avoir dans un stade plein), vous n’avez pas besoin d’application mobile, vous n’avez même pas besoin d’avoir un smartphone ! N’importe quel vieux téléphone des années 90 fera l’affaire pour envoyer un SMS. Le numéro de téléphone devient le point d’entrée pour entrer en contact avec l’entreprise – encore une fois. Hé, les opérateurs télécoms, ça vous intéresse ?

Livingston conclut en disant que « la messagerie sera le prochain grand système d’exploitation : un Bot OS. » Il n’y a rien de mal à avoir des visions audacieuses. Mais j’ai envie de dire que les premiers systèmes d’exploitation reposaient déjà sur les messages. La fameuse « ligne de commande » est toujours le moyen préféré des programmeurs et des administrateurs système pour interagir avec les ordinateurs aujourd’hui.

J’ai bien l’impression que l’histoire se répète…