Pitajte novinare koji im je najmanje omiljeni dio posla i skoro svi će reći da je to transkripcija ili prekucavanje teksta sa diktafona.
Da bi se kratak razgovor pretvorio u tekst, ponekad su potrebni sati prekucavanja zvučnog zapisa, što predstavlja ozbiljan problem.
Kineski tehnološki gigant Baidu možda ima pametniji pristup: vještačka inteligencija. Upravo su pustili beta verziju za SwiftScribe, aplikaciju transkripcije koja koristi tehnologiju neuronskih mreža da bi odgonetnula smislao snimljenog govora.
Softver ne samo da obećava relativno preciznu obradu govora u tekst zahvaljujući ”učenju” na višesatnim snimcima, nego se uči i na izmjenama koje korisnici unose.
Više se fokusira na to kako ljudi zapravo govore, štedeći vas od velikog broja izmjena.
Nemojte očekivati da odmah koristite beta verziju. Za sada je omogućeno za samo 30 do 50 testera da isprobaju program.
Nema sumnje da bi ova transkripcija, bazirana na vještačkoj inteligenciji, mogla biti naročito korisna u širokom spektru industrija. Tehnologija bi mogla biti korisna ne samo za intervjue – mogla bi da pomogne i u transkripciji govorne pošte i bilo gdje drugo gdje računari imaju poteškoća da shvate izgovorenu riječ.