Službu lze využít např. pro převod podcastů na text nebo zvukových nahrávek přednášek a to vč. nahrávek tlumočených. Tlumočené nahrávky je možné následně přeložit z originálu.
V jedné dávce lze zpracovat nahrávky o délce maximálně 90 minut, resp. musí být možné je zkomprimovat v dobré kvalitě do 25 MB.
Služba zahrnuje:
- Audio úprava vylepšení hlasových nahrávek
- Audio komprese audia na 25 MB
- Transkripce GPT-4 se selekcí jazyka
- Volitelné: Překlad GPT-4 během přepisu GPT-4 (omezený kontext)
- Volitelné: Ladění příkazu pro přepis pro přesnější zpracování
- Uložení přepisu do TXT souboru (bez odstavců)
Cena 500 Kč za soubor, s překladem při přepisu 600 Kč za soubor.
Volitelně lze provádět ladění příkazu pro korekci přepisu jmen či neobvyklých výrazů. Tato část je hrazena hodinově, zpravidla zabere 1 hodinu času.
V případě přepisu tlumočených nahrávek se systém pokusí rozeznat pouze požadovaný jazyk. Ostatní jazyky nebudou přepsány. Může se ale stát, že přepis zachytí i sekundární komunikaci tlumočníka z řečníkem apod. nebo se zapíší chybné fragmenty v důsledku chybné detekce jazyka. Přepis lze samozřejmě opakovat pro druhý jazyk a získat přepis originální i tlumočené verze.
Dodatečné zpracování
Volitelně je možné přepis nahrávek naformátovat do logických odstavců a odstranit případná opakování vět pomocí zpracování jazykovým modelem GPT-4. Cena zpracování je 200 Kč za soubor.
Pro dosažení vyšší přesnosti překladu přepisu a možnosti ladění pro překlad odborné terminologie, doporučuji dodatečný překlad přepisu.
Whisper je pokročilý systém automatického rozpoznávání řeči (ASR), který byl vyvinutý na základě 680 000 hodin multilingvních a multitaskových dat, shromážděných z internetu. Tento rozsáhlý a rozmanitý datový soubor přispívá k vylepšené odolnosti vůči různým akcentům, pozadí a technickému jazyku. Whisper umožňuje přepis v několika jazycích a nabízí i překlad.
V porovnání s obdobnými službami, jako jsou ty, které nabízí Office 365 a Google Workspace, Whisper vyniká především svou schopností zpracovávat velké objemy dat a poskytovat přesnější výsledky. Například služby integrované do Office 365 a Google Workspace sice nabízejí efektivní nástroje pro přepis řeči, ale mohou se potýkat s překlady nebo s náročnějšími audio nahrávkami obsahujícími technický jargon nebo silný akcent. Whisper se naopak ukázal jako robustnější ve srovnání s různými jazyky a dialekty.