Rozpoznawanie głosu: Google rozszerza Cloud Speech API

Rozpoznawanie głosu: Google rozszerza Cloud Speech API

Usługa do konwersji tekstu pisanego na mówiony może teraz obsługiwać pliki audio z maksymalnie trzy godziny długości. Istnieje również 30 nowych wersji językowych.

Google Cloud Speech API dodano kilka wersji językowych i funkcji. Internet gigant wprowadził usługę automatycznego rozpoznawania mowy na wiosnę 2016 roku, a rok później wyniesiony do pełnoprawnym usługi. To zapewnia API do integracji z deweloperem usługę cloud do własnych zastosowań.

Na początku, ponad 80 języków lub warianty są 30 nowe, w tym Suahili, jawajski i angielskim, jak mówi się w krajach afrykańskich, Ghany, Kenii, Nigerii i Tanzanii. Według blogu, nowe wersje pokrycia wraz z więcej niż jednego miliarda dodatkowych osób.

Pliki do konwersji do tekstu może być teraz ponad dwa razy dłużej niż w poprzednim maksimum 80 minut o maksymalnej długości trzech godzin. W szczególnych przypadkach, istnieje również opcja prawdopodobnie podnieść kwotę w odniesieniu do poszczególnych przypadków. Oprócz świeżych nowych funkcji, blogu również sugerują, że chmura mowy zapewnia teraz datownik do tekstu pasującego mogą być wyświetlane podczas odtwarzania pliku audio. Ponadto, użytkownicy mogą grać w ten sposób dla każdego dopasowania słów podczas czytania przekonwertowany tekst.(RME)