Watson Speech to Text -katsaus: Paras suurten volyymien transkriptiopalvelu?

Watson on IBM: n luonnollista kieltä käsittelevä tietokonejärjestelmä. Se käyttää kuuluisaa kysymyksiin vastaavaa supertietokonetta sekä useita tekoälypohjaisia ​​yritystuotteita, mukaan lukien Watson Speech to Text. Watson Speech to Text -katsauksessa tarkastelemme yhtä parhaista puheesta tekstiin -sovelluksista, joka on ihanteellinen kaikille, jotka haluavat muuntaa äänen tekstiksi mittakaavassa.

Watsonin puheenkäsittelyalusta on saatavana IBM Cloud -palvelussa. Se on monipuolinen työkalu, ja sitä voidaan käyttää monissa yhteyksissä, mukaan lukien sanelu ja neuvottelupuhelun transkriptio. Toisin kuin useimmat muut puheesta tekstiin -sovellukset, se on saatavana sovellusliittymänä, jonka avulla kehittäjät voivat upottaa sen muun muassa ääniohjausjärjestelmiin.

Watson Speech to Text: Suunnitelmat ja hinnoittelu

Voit käyttää Watsonin puheesta tekstiin jopa 500 minuutin äänen käsittelyä ilmaiseksi kuukaudessa. Jos haluat muuntaa enemmän, joudut maksamaan jokaisesta ääniminuutista, ja nopeus muuttuu käsitellyn äänen keston mukaan. Kustannukset vaihtelevat 0,01-0,02 dollaria minuutissa, ja lisämaksu on 0,03 dollaria minuutissa, jos tarvitset IBM: n mukautetun kielimallin. Saatavilla on myös premium-hintatarjouksia sisältäviä Watson-suunnitelmia, jotka tarjoavat pääsyn parannettuihin tietosuojaominaisuuksiin ja käyttöaikatakuisiin.

Watsonin puheesta tekstiin -palvelu hinnoitellaan sen mukaan, kuinka paljon sisältöä haluat kirjoittaa.

Voit käyttää Watson Speech to Text -järjestelmää myös yleiskäyttöisen IBM Cloud -tilauksen kautta. Luonnollinen kielenkäsittely on vain yksi sovellus monissa tekoälypalveluissa, joita voit saada IBM Cloudin kautta, joten tämä on hyvä vaihtoehto kaikille organisaatioille, jotka tarvitsevat pääsyn nopeisiin tiedonsiirtoihin, chat-robotteihin tai teksti puheeksi -työkaluihin.

Watsonin puhe tekstiksi: ominaisuudet

Joustavan sovellusliittymän integraation ja muiden IBM: n valmiiksi koottujen työkalujen ansiosta Watsonin puheentunnistuspalvelu ylittää selvästi perussiirron. Jos haluat käyttää sitä esimerkiksi asiakaspalvelukontekstissa, Watson Assistant voidaan asettaa käsittelemään luonnollisen kielen kysymyksiä suoraan tai vastaamaan kyselyihin puhelimitse.

Watsonissa IBM on koonnut monipuolisen luonnollisen kielen käsittelyalustan.

Watson toimii live-äänen kanssa 11 kielellä ja voi tuoda ääniä useilla ennalta tallennetuilla muodoilla. Suoratoistossa reaaliaikainen diagnostiikkatuki tarkoittaa, että Watson voi kehottaa käyttäjiä siirtymään lähemmäs mikrofoniaan tai vaihtamaan ympäristöään. Vaikuttavaa on myös se, että Watson pystyy erottamaan eri kaiuttimet jaetussa keskustelussa Speaker Diarization -ominaisuuden ansiosta, joka on edelleen beetatestaus.

Watsonin puhe tekstiksi: Asetus

Watsonin käyttämiseksi sinun on ensin luotava IBM Bluemix -tili. Rekisteröinti on ilmaista ja kivutonta, vaatii vain sähköpostiosoitteen ja salasanan. Kun olet kirjautunut sisään, sinun on lisättävä tilillesi Speech to Text -palvelua koskeva säännös. Sinulle annetaan tässä vaiheessa pari kirjautumistietoa, jotka sinun tulisi tallentaa omiin tietueihisi.

Rekisteröityminen IBM Bluemix -tilille on välttämätöntä, jotta pääset käyttämään Watsonin kaikkia ominaisuuksia.

Kun olet tehnyt sen, asiat monimutkaistuvat huomattavasti. Watsoniin pääsemiseksi sinun on lisättävä nämä tunnistetiedot asiakkaan yhtenäisen resurssipaikanninkoodin (cURL) erään ja suoritettava se sitten koneellasi. Tämän kätevän oppaan avulla voit selvittää tarkalleen minkä komennon soittaa. Vaihtoehtoisesti, jos haluat vain nähdä, kuinka hyvin Watson-järjestelmä toimii ilman, että sinun tarvitsee hypätä kaikkien vanteiden läpi, voit kokeilla sitä sen sijaan IBM: n demosivustolla.

Watsonin puhe tekstiksi: käyttöliittymä

Toisin kuin kuluttajille suunnatut ääni-tekstisovellukset, Watsonin palvelut on suunniteltu käytettäväksi API: n ja muihin järjestelmiin upotettujen koodien kautta. Tästä syystä ei ole todellista Watsonin "käyttöliittymää". Sen sijaan Watsoniin pääsee kolmen eri Internet-protokollan kautta. Nämä ovat WebSockets, REST API ja Watson Developer Cloud.

Watsonin puhetta tekstiksi voidaan hallita Watson Developer Cloud -järjestelmän kautta.

Watsonin hallitsemiseksi sinun on käytettävä komentorivityökalua, joka muodostaa yhteyden IBM: n pilveen yhdellä näistä kolmesta reitistä. Watsonin kanssa vuorovaikutuksessa olevan loppukäyttäjän näkemän käyttöliittymän on rakennettava joku kehitystiimistäsi erikseen.

Watson Puhe tekstiksi: Suorituskyky

Kaiken kaikkiaan meihin vaikutti tapa, jolla tämä luonnollista kieltä käsittelevä alusta käsitteli todellista puhetta. Käytimme Watsonia kirjoittaaksemme leikkeitä, jotka nauhoitimme haastavissa ympäristöissä, sekä kuuluisien puheiden äänenpurkauksia useilla Watsonin 11 tuetulla kielellä.

Huomasimme, että Watson toimi hyvin ennalta äänitetyn puheen kanssa.

Vaikka virheet kasvoivat useammin leikkeissä, joissa oli paljon taustamelua, Watson tuotti yleensä uskomattoman tarkkoja tuloksia. Arvioimme testiemme mukaan, että luvattomia virheitä tapahtui keskimäärin vain kerran 150 sanan välein. Kuitenkin tuli selväksi, miksi Watsonin kaiuttimien diarization -ominaisuus pysyy BETA-testauksessa, koska useita kertoja arviointimme aikana yksi ääni merkittiin väärin erillisiksi kaiuttimiksi.

Watsonin puhe tekstiksi: tuki

IBM: n resurssikeskus tarjoaa runsaasti dokumentaatiota, jotta ymmärrät paremmin Watsonin soveltamisen käyttötapaukseesi. Kannattaa myös käyttää Watsonin kehittäjäyhteisön luomia ja GitHubiin lähetettyjä API-integraatioita ja SDK: ita.

Watson API GitHub -sivu on hyvä tukilähde Watson Speech to Text -palvelulle.

Jos et löydä ratkaisua ongelmasi sieltä, voit ottaa suoraan yhteyttä IBM: hen avaamalla tukilipun tai ottamalla yhteyttä puhelimitse. Niin kauan kuin olet valinnut jonkin premium-luokan Watson-paketeista, Watson-käyttösi on suojattu palvelutason käyttöajan sopimuksella.

Watsonin puhe tekstiksi: lopullinen tuomio

Jos organisaatiollasi on taitotietoa ja resursseja integroida IBM Watson Speech to Text -alusta järjestelmään oikein, voit hyötyä edistyneistä toiminnoista, kuten reaaliaikaisesta ääniympäristön diagnostiikasta ja väliaikaisesta transkriptiotuloksesta. Pienet yritykset ja organisaatiot kamppailevat kuitenkin teknisen haasteen kanssa Watsonin asettamisesta kunnolla.

Kilpailu

IBM Watson Speech to Text -palvelu on suora kilpailija joukkomuotoisille transkriptiopalveluille Google Cloud Speech-to-Text ja Amazon Transcribe. Molemmat ovat huomattavasti halvempia kuin Watson, esimerkiksi Google Cloud -transkriptio alkaen 0,006 dollarista minuutissa. Kaikilla kolmella palvelulla on samanlaiset toiminnot, kuten räätälöity sanasto, mutta yksi ominaisuus, joka puuttuu IBM Watsonista, mutta joka on saatavana molempien kilpailijoiden kanssa, on automaattinen välimerkkien tunnistus.

Etsitkö toista kenkä-teksti-ratkaisua? Katso paras puheesta tekstiin -ohjelmisto-oppaamme.

Mielenkiintoisia artikkeleita...