« La synthèse vocale est un marché de longue haleine »
La synthèse vocale souffre encore trop souvent d'une mauvaise image liée aux déboires de certaines applications de reconnaissances vocale. Pourtant les usages sont multiples. Antoine Kauffeisen, VP Marketing groupe Acapela, les explique.
R&T : Qui est Acapela ? Antoine Kauffeisen : Acapela est née en janvier 2004. Le groupe s'est constitué à partir de 3 sociétés qui travaillaient depuis plus de 20 ans sur la synthèse vocale : le Suédois Infovox, le Français Elan, et le Belge Babel Technologies. Acapela est devenu un groupe Européen qui emploie 60 personnes sur 3 sites (Belgique, France et Suède), avec un bureau au Maroc et un autre à Barcelone. En 2006, nous avons réalisé plus de 5 Millions d'euros de chiffre d'affaires, avec une croissance avoisinant les 10%. Nous sommes présents sur 7 marchés, dont 3 piliers majeurs et 4 marchés émergents. Les principaux marchés sont les Télécoms (applications téléphoniques), l'Automotiv (navigation par GPS haut de gamme) et l'Accessibilité (outils d'accès à l'information pour les personnes handicapées). Les 4 secondaires sont la mobilité (smartphones, PDA), l'industrie (supervision & alarmes, systèmes d'information voyageurs), le multimedia (modules e-learning) et électronique grand public (objets communicants). Notre outil permet de développer des applicatifs en 25 langues. R&T : Le marché de la synthèse vocale peine à décoller. Pourquoi ? A.K. : Le marché souffre du mauvais procès fait à la reconnaissance vocale. La synthèse vocale, ça marche et plutôt bien ! Ce marché existera toujours car il existe d'énormes besoins pour des interfaces Homme/Machine plus conviviales et plus fluides. Cependant, le rythme de croissance est lent, beaucoup plus lent qu'on ne l'avait imaginé. C'est une conquête de longue haleine, une sorte de quête du Graal ! Pourtant, les applications sont multiples. Il en naît tous les mois ! La synthèse vocale se fond dans le paysage. Le but ultime est le dialogue naturel. Cependant cet objectif ne repose pas uniquement sur la synthèse et la reconnaissance vocale qui sont des briques relativement mineures. R&T : Mais alors où sont les freins ? A.K. : Les freins ne sont pas réellement techniques. La synthèse vocale est un nouveau canal de communication. Il faut s'y habituer, ça demande du temps. Nous développons par exemple des Podcasts audios à partir de flux RSS. Les freins dans ce cas précis sont liés à la culture audio. Il n'est pas évident par exemple de naviguer simplement dans un flux audio. Cela pose un certain nombre de défis technologiques. Autre exemple, le marché de l'audio book explose au Royaume Uni, en Allemagne ou aux US. Les livres sont lus et reproduis sur CD. Il n'existe pas de marque page par exemple. R&T : Quels sont vos objectifs prochains ? A.K. : Nous allons augmenter notre portefeuille de langues pour nous étendre aux pays de l'Est (Pologne, Tchecoslovaquie, Russie...) et à l'Asie (Corée, Chine, Japon...). Nous allons aussi développer de plus en plus d'applications de voix « propriétaire ». Il existe en effet une demande importante pour la personnalisation du message vocal. La voix est reproduite et restituée à l'identique, avec le même timbre de voix.