La reconnaissance vocale: Google élargit le Cloud API Speech

La reconnaissance vocale: Google élargit le Cloud API Speech

Le service de conversion parlé en texte écrit peut maintenant gérer les fichiers audio avec jusqu'à trois heures de longueur. Il y a aussi 30 nouvelles versions linguistiques.

API Google Cloud Speech a ajouté certaines versions linguistiques et fonctions. Le géant de l'Internet a mis en place le service de reconnaissance automatique de la parole au printemps 2016 et un an plus tard élevé à un service à part entière. Il fournit une API pour intégrer avec le développeur du service cloud dans leurs propres applications.

Au début, plus de 80 langues ou variantes sont 30 nouveaux, y compris le swahili, le javanais et l'anglais comme il est dit dans les pays africains du Ghana, au Kenya, au Nigeria et en Tanzanie. Selon le blog, les nouvelles versions couvrent ensemble de plus d'un milliard de personnes supplémentaires.

Les fichiers pour la conversion en texte peut maintenant être plus de deux fois plus longtemps que le précédent maximum de 80 minutes avec une longueur maximale de trois heures. Pour les cas particuliers, il y a aussi sans doute la possibilité d'augmenter le quota pour les cas individuels. En plus de nouvelles fonctionnalités nouvelles, le blog suggère également que le Cloud Speech fournit maintenant horodatage sur le texte correspondant peut être affiché lors de la lecture du fichier audio. De plus, les utilisateurs peuvent donc jouer pour chaque mots correspondants en lisant le texte converti.(RME)