Microsoft lansira MAI-Transcribe-1 i dva dodatna fundamentalna AI modela

Šta se desilo

Dana 2. aprila 2026., Microsoftova AI divizija (MAI) objavila je tri fundamentalna modela izgrađena u potpunosti interno: MAI-Transcribe-1, model za generisanje glasa i model za kreiranje slika. MAI je osnovan pre otprilike šest meseci kao Microsoftov napor da razvije sopstvene AI kapacitete pored postojećeg partnerstva sa OpenAI-jem.

MAI-Transcribe-1 podržava transkripciju govora u tekst na 25 jezika i radi 2,5 puta brže od postojećeg Azure Fast servisa za transkripciju. Model za generisanje glasa proizvodi sintetički audio iz teksta, a kreator slika generiše vizuele iz tekstualnih opisa. Microsoft sve tri modele pozicionira kao jeftinije alternative uporedivim ponudama od Googlea i OpenAI-ja.

Zašto je to važno za pisce i kreatore sadržaja

Za novinare, istraživače i content timove, MAI-Transcribe-1 je najdirektniji od tri modela. Transkripcija je postala standardni korak u radnim tokovima pisanja zasnovanim na intervjuima — snimanje razgovora, press poziva i razgovora sa izvorima, pa konvertovanje u tekst pretraživ po sadržaju. Brži, jeftiniji model transkripcije od dobavljača kojeg mnoge organizacije već koriste putem Microsoft 365 i Azure može smanjiti cenu i latenciju ovog koraka bez zahteva za novim alatima.

Šira slika je da Microsoft gradi ka potpunijem AI content creation stack-u unutar sopstvene infrastrukture. Timovi koji se oslanjaju na Microsoft alate za pisanje, uređivanje i objavljivanje sve više će nailaziti na AI kapacitete direktno ugrađene u te radne tokove, umesto da dolaze putem integracija trećih strana. Ovo izdanje označava korak u tom pravcu.