Technologie
Fluent.ai est un leader en matière de compréhension de la parole et de solutions d'interface utilisateur vocale.
Comment le fait-on?
Fondée sur plus de neuf années de recherche en apprentissage automatique et en intelligence artificielle et avec plusieurs familles de brevets délivrés, la technologie de Fluent.ai est unique et incomparable.
Les solutions classiques de compréhension de la parole fonctionnent en deux étapes distinctes: premièrement, l’interprétation de la parole en un texte dans une langue cible, puis le traitement du langage naturel appliqué au texte, pour déterminer l’intention de l’utilisateur. Cette approche implique des efforts considérables de collecte de données et d’étiquetage, et nécessite une grande puissance de calcul pour développer des modèles dans une seule langue. Cette approche implique également un certain nombre de modules disjoints, tels que le modèle acoustique et le modèle de langage, pour associer une chaîne de mots à une parole en entrée. Ces modules n’ont pas une interaction optimisée et n'offrent donc pas des performances de reconnaissance vocale optimales. Cela devient particulièrement évident dans les environnements bruyants ou avec des accents variables.
La technologie de parole-intention (speech-to-intent) de Fluent.ai utilise des algorithmes uniques de réseau neuronal pour associer directement la parole entrante d’un utilisateur à l’action souhaitée, sans qu'il soit nécessaire d’effectuer une transcription parole à texte. Lors de la phase d’entraînement, la technologie Fluent.ai apprend en associant directement les représentations sémantiques des actions prévues par le locuteur aux paroles prononcées. D'une certaine manière, nos modèles sont basés sur le concept d'acquisition du vocabulaire et du langage chez l'homme. Contrairement à la reconnaissance automatique de la parole (RAP) classique, la technologie Fluent.ai ne nécessite pas de transcription phonétique. Notre approche, indépendante du texte, permet de développer des modèles de compréhension de la parole pouvant apprendre à reconnaître une nouvelle langue à partir d'une petite quantité de données et permet aux utilisateurs finaux d'interagir avec les appareils dans la langue de leur choix. L'utilisateur n'est pas obligé de se conformer à des phrases prédéfinies et est libre de choisir les mots de son choix.
Avantages concurrentiels
Avantages concurrentiels
Principaux fournisseurs de la transcription parole-texte
Parole-intention (Speech to Intent)
A
B
C
D
Comparaison
Précision
-
A50%
-
B75%
-
C50%
-
D50%
-
Fluent.ai100%
Robustesse au bruit
-
A50%
-
B50%
-
C50%
-
D50%
-
Fluent.ai100%
Apprend de l'utilisateur
-
AN/A
-
BN/A
-
CN/A
-
DN/A
-
Fluent.ai100%
Performance hors ligne
-
A50%
-
BN/A
-
C50%
-
DN/A
-
Fluent.ai100%
Vitesse de reconnaissance
-
A25%
-
B50%
-
C50%
-
D25%
-
Fluent.ai100%
Personnalisable
-
AN/A
-
BN/A
-
CN/A
-
DN/A
-
Fluent.ai100%
Quantité de données d'entraînement
-
A+10,000 hrs
-
B+10,000 hrs
-
C+10,000 hrs
-
D+10,000 hrs
-
Fluent.ai<10 hrs
Rapidité de lancement de nouvelles langues/nouveaux accents
-
A25%
-
B25%
-
C25%
-
D25%
-
Fluent.ai100%
Capacité à gérer un mélange de langues
-
A25%
-
B25%
-
C25%
-
D75%
-
Fluent.ai100%