Skip to content
Vest TechCrunch apr 2026.

TechCrunch: Microsoft AI objavljuje tri bazična modela za tekst, glas i slike

Microsoft-ovo AI odeljenje (MAI), na čelu sa Mustafom Sulejmanom, objavilo je tri bazična modela 2. aprila 2026. Modeli pokrivaju transkripicju govora, generisanje audia i generisanje slika — oblasti u kojima je Microsoft do sada u velikoj meri zavisio od trećih strana, uključujući OpenAI.

Tri modela

MAI-Transcribe-1 pretvara govorni jezik u tekst na 25 jezika. Pozicioniran je kao speech-to-text rešenje za korporativne aplikacije i developer integracije.

MAI-Voice-1 generiše audio iz teksta, proizvodeći do 60 sekundi zvuka u sekundi. Podržava kreiranje prilagođenih glasova, što aplikacijama omogućava generisanje konzistentnih sintetičkih glasova podešenih za specifičan brend ili personu.

Treći model bavi se generisanjem slika i bio je dostupan na MAI Playground-u od 19. marta pre formalnog objavljivanja.

Kontekst

MAI je formirano otprilike šest meseci pre ovog objavljivanja kao zasebna jedinica unutar Microsoft-a, odvojena od produktnog tima koji isporučuje Copilot i Microsoft 365 AI funkcije. Mandat odeljenja je izgradnja sopstvenog stacka bazičnih modela umesto oslanjanja na OpenAI modele kroz postojeće partnerstvo.

Tajming je bitan: Microsoft-ov sporazum sa OpenAI se razvijao kako je OpenAI postajao sve nezavisniji i konkurentniji na korporativnim tržištima. Izgradnja sopstvenih multimodalnih kapaciteta daje Microsoft-u više fleksibilnosti u cenama, deploymentu i diferencijaciji AI proizvoda tokom vremena.

Zašto je važno za product managere

Za PM-ove koji evaluiraju korporativne AI alate, ovaj release dodaje Microsoft na listu dobavljača koji nude sopstvene kapacitete za prepoznavanje govora i generisanje slika, zajedno sa OpenAI, Google, Anthropic i ElevenLabs. Timovi koji grade na Azure ili Microsoft 365 mogu dobiti pristup ovim modelima bez promene dobavljača.

Širi obrazac je vredan praćenja: velike platformske kompanije se konzistentno kreću ka posedovanju kompletnog stacka od bazičnih modela do end-user aplikacija. Za PM-ove koji grade na tim platformama, ta konsolidacija utiče na cene API-ja, dostupnost modela i strateški uticaj koji svaki pojedinačni dobavljač ima nad njihovim proizvodom.