Skip to content
Vest TechCrunch mar 2026.

Speechify lansira Windows aplikaciju sa lokalnom AI transkripcijom i diktiranjem

  1. marta 2026, Speechify je lansirao native Windows aplikaciju koja pokreće ključne AI funkcije — sintezu govora, detekciju glasovne aktivnosti i transkripciju zasnovanu na Whisper-u — potpuno na uređaju, bez slanja zvuka i teksta na Speechifyjeve servere.

Aplikacija koristi tri lokalno uskladištena modela: neuralni model za sintezu govora (VITS Neural) za glasno čitanje dokumenata i članaka, open-source Silero model za detekciju glasovne aktivnosti u realnom vremenu (prepoznaje kada korisnik počne da govori) i lokalnu verziju OpenAI Whisper-a za transkripciju i diktiranje. Na kompatibilnom hardveru, sve funkcioniše bez pristupa oblaku. Na Copilot+ PC uređajima — Windows računarima sa neuronskim procesorima AMD, Intel ili Qualcomm — modeli se pokreću na NPU. Podržani su i Windows 11 računari sa Intel i AMD GPU karticama; korisnici mogu po želji prebaciti na cloud obradu ili promeniti modele tokom sesije.

Za novinare i autore koji rade sa osetljivim materijalom, praktični značaj ovoga je direktan: snimci intervjua, neobjavljeni dokumenti i radne verzije tekstova koji se obrađuju u Speechifyjovoj Windows aplikaciji ne napuštaju uređaj. Ovo je suštinska razlika u odnosu na pretraživačke ili cloud-zavisne alate u istoj kategoriji. Speechify je u februaru 2026. lansirao transkripciju sastanaka, ali samo u pretraživaču; native aplikacija proširuje transkripciju i diktiranje na bilo koju Windows aplikaciju.

Speechify pozicionira aplikaciju kao korak ka „full-stack glasovnoj aplikaciji” pored postojećeg fokusa na sintezu govora — pokrivajući čitanje, diktiranje i transkripciju, a ne samo audio izlaz. Kompanija ima više od 50 miliona korisnika.

Aplikacija je dostupna u Microsoft Store-u. Konkurenti u kategoriji diktiranja i transkripcije su Wispr Flow, Willow i Superwhisper.