La solution de speech-to-text avec IA Gladia sort en alpha

Gladia a lancé la version alpha de leur transcription audio ! Alimentée par leur API de conversion de la parole en texte, elle est capable de transcrire 1h d'audio en 10s, avec un taux d'erreur de mot (WER) de 1% - ce qui en fait l'une des plus grandes percées dans la technologie de transcription audio à ce jour.

Une version alpha

Gladia est très enthousiaste quant à l'impact de cette version sur l'intelligence audio et, plus largement, sur les futures applications de l'IA à toutes sortes de tâches, rendues possibles grâce aux API prêtes à l'emploi.

Vous pouvez vous inscrire pour essayer leur transcription audio alpha ici. Testez, jouez et faites-leur savoir ce que vous en pensez.

Quelle technologie de base ont-ils utilisée pour construire leur API Speech-to-Text ?

En s'appuyant sur les dernières recherches en matière de TAL, de ML et de deep learning,  ils ont créé une API de reconnaissance vocale unique alimentée par les modèles Whisper d'OpenAI, notamment le Large-v2.

En s'appuyant sur une approche propriétaire de l'optimisation des réseaux neuronaux, Gladia a amélioré la vitesse d'inférence pour la reconnaissance vocale de haute qualité d'environ 60 fois par rapport aux principaux fournisseurs de Speech-to-Text. Ils esperent améliorer encore ces chiffres prochainement.

Performances de Gladia

Bien qu'ils ne soient pas encore en mesure de communiquer le prix final, Gladia s'engage à faire en sorte que leurs API soient parmi les plus abordables du marché, tout en maintenant les normes de qualité les plus élevées.

Pour l'instant, ils travaillent avec plus de 250 modèles à la création d'une solution holistique d'intelligence audio, capable d'effectuer plus de 45 tâches, notamment la traduction, les résumés de conversation, la détection du genre et l'analyse des sentiments.

L'API alpha, désormais en ligne, permet d'accéder à sa fonction principale : la transcription. Ils sont en passe de publier le reste sous peu, suite aux commentaires de leurs utilisateurs alpha.

Pour tenter de participer à l'alpha, cliquez sur ce lien :