TechCrunch: Microsoft AI objavljuje tri bazična modela za tekst, glas i slike
Microsoft-ovo AI odeljenje (MAI), na čelu sa Mustafom Sulejmanom, objavilo je tri bazična modela 2. aprila 2026. Modeli pokrivaju transkripicju govora, generisanje audia i generisanje slika — oblasti u kojima je Microsoft do sada u velikoj meri zavisio od trećih strana, uključujući OpenAI.
Tri modela
MAI-Transcribe-1 pretvara govorni jezik u tekst na 25 jezika. Pozicioniran je kao speech-to-text rešenje za korporativne aplikacije i developer integracije.
MAI-Voice-1 generiše audio iz teksta, proizvodeći do 60 sekundi zvuka u sekundi. Podržava kreiranje prilagođenih glasova, što aplikacijama omogućava generisanje konzistentnih sintetičkih glasova podešenih za specifičan brend ili personu.
Treći model bavi se generisanjem slika i bio je dostupan na MAI Playground-u od 19. marta pre formalnog objavljivanja.
Kontekst
MAI je formirano otprilike šest meseci pre ovog objavljivanja kao zasebna jedinica unutar Microsoft-a, odvojena od produktnog tima koji isporučuje Copilot i Microsoft 365 AI funkcije. Mandat odeljenja je izgradnja sopstvenog stacka bazičnih modela umesto oslanjanja na OpenAI modele kroz postojeće partnerstvo.
Tajming je bitan: Microsoft-ov sporazum sa OpenAI se razvijao kako je OpenAI postajao sve nezavisniji i konkurentniji na korporativnim tržištima. Izgradnja sopstvenih multimodalnih kapaciteta daje Microsoft-u više fleksibilnosti u cenama, deploymentu i diferencijaciji AI proizvoda tokom vremena.
Zašto je važno za product managere
Za PM-ove koji evaluiraju korporativne AI alate, ovaj release dodaje Microsoft na listu dobavljača koji nude sopstvene kapacitete za prepoznavanje govora i generisanje slika, zajedno sa OpenAI, Google, Anthropic i ElevenLabs. Timovi koji grade na Azure ili Microsoft 365 mogu dobiti pristup ovim modelima bez promene dobavljača.
Širi obrazac je vredan praćenja: velike platformske kompanije se konzistentno kreću ka posedovanju kompletnog stacka od bazičnih modela do end-user aplikacija. Za PM-ove koji grade na tim platformama, ta konsolidacija utiče na cene API-ja, dostupnost modela i strateški uticaj koji svaki pojedinačni dobavljač ima nad njihovim proizvodom.