Microsoft montre voix
Une nouvelle étape dans la reconnaissance vocale a été franchie par la division recherche et intelligence artificielle de Microsoft. Après 25 ans de travaux, cette dernière dispose désormais d’un réseau neuronal aussi – voire plus – efficace qu’un professionnel pour restituer un discours oral en anglais, avec un taux d’erreur de seulement 5 % par mot. Car si le taux obtenu par la machine rejoint celui de l’humain, il a été décroché dès la première écoute, alors que le professionnel, lui, avait l’avantage de pouvoir réécouter le discours à sa guise. S’inspirant du fonctionnement du cerveau, l’amélioration de l’analyse contextuelle de la conversation a permis au réseau neuronal d’affiner ses capacités d’apprentissage et de mieux prédire les mots à venir. Ces avancées se retrouveront évidemment dans l’assistant Cortana, mais aussi dans le Presentation Translator de PowerPoint ou encore les API Microsoft Cognitives Services. Nul doute que la prochaine étape dans le domaine sera la phase de compréhension de la conversation, mais ça, c’est une autre paire de manches.