Převod mluveného slova na text s využitím OpenAI Whisper

Službu lze využít např. pro převod podcastů na text nebo zvukových nahrávek přednášek a to vč. nahrávek tlumočených. Tlumočené nahrávky je možné následně přeložit z originálu.

V jedné dávce lze zpracovat nahrávky o délce maximálně 90 minut, resp. musí být možné je zkomprimovat v dobré kvalitě do 25 MB.

Služba zahrnuje:

  • Audio úprava vylepšení hlasových nahrávek
  • Audio komprese audia na 25 MB
  • Transkripce GPT-4 se selekcí jazyka
  • Volitelné: Překlad GPT-4 během přepisu GPT-4 (omezený kontext)
  • Volitelné: Ladění příkazu pro přepis pro přesnější zpracování
  • Uložení přepisu do TXT souboru (bez odstavců)

Cena 500 Kč za soubor, s překladem při přepisu 600 Kč za soubor.

Volitelně lze provádět ladění příkazu pro korekci přepisu jmen či neobvyklých výrazů. Tato část je hrazena hodinově, zpravidla zabere 1 hodinu času.

V případě přepisu tlumočených nahrávek se systém pokusí rozeznat pouze požadovaný jazyk. Ostatní jazyky nebudou přepsány. Může se ale stát, že přepis zachytí i sekundární komunikaci tlumočníka z řečníkem apod. nebo se zapíší chybné fragmenty v důsledku chybné detekce jazyka. Přepis lze samozřejmě opakovat pro druhý jazyk a získat přepis originální i tlumočené verze.

Dodatečné zpracování

Volitelně je možné přepis nahrávek naformátovat do logických odstavců a odstranit případná opakování vět pomocí zpracování jazykovým modelem GPT-4. Cena zpracování je 200 Kč za soubor.

Pro dosažení vyšší přesnosti překladu přepisu a možnosti ladění pro překlad odborné terminologie, doporučuji dodatečný překlad přepisu.


Whisper je pokročilý systém automatického rozpoznávání řeči (ASR), který byl vyvinutý na základě 680 000 hodin multilingvních a multitaskových dat, shromážděných z internetu. Tento rozsáhlý a rozmanitý datový soubor přispívá k vylepšené odolnosti vůči různým akcentům, pozadí a technickému jazyku. Whisper umožňuje přepis v několika jazycích a nabízí i překlad.

V porovnání s obdobnými službami, jako jsou ty, které nabízí Office 365 a Google Workspace, Whisper vyniká především svou schopností zpracovávat velké objemy dat a poskytovat přesnější výsledky. Například služby integrované do Office 365 a Google Workspace sice nabízejí efektivní nástroje pro přepis řeči, ale mohou se potýkat s překlady nebo s náročnějšími audio nahrávkami obsahujícími technický jargon nebo silný akcent. Whisper se naopak ukázal jako robustnější ve srovnání s různými jazyky a dialekty.

Jiří Procházka

Kostelní 24/859
170 00 Praha 7

+420 603 874 917
info@norbou.com

Copyright 2024 © Všechna práva vyhrazena

Live Chat

Hi, I am ready to answer your questions... You can use your native language.