TechCrunch: Cloud infrastruktura se redizajnira za AI agente, a ne za ljude
Provajderi cloud infrastrukture redizajniraju svoje sisteme kako bi prilagodili AI agentima, a ne ljudskim korisnicima. AWS je lansirao novu generaciju OpenSearch Serverless-a koja razdvaja računanje i skladištenje, omogućavajući trenutno skaliranje tokom agentne aktivnosti i spuštanje na nulu u periodima mirovanja. Razlog je jasan: agenti stvaraju iznenadne, nepredvidive skokove saobraćaja — razdvajajući pod-agente koji istovremeno upituju baze podataka i API-je — a zatim utihnu. Tradicionalna cloud infrastruktura bila je optimizovana za stabilno, predvidljivo ponašanje ljudi koji klikću, strimuju i pretražuju.
Cloudflare izveštava da ne-ljudski saobraćaj već čini 31% HTTP aktivnosti, pri čemu AI crawleri čine oko 25% bot zahteva. Jedan analitičar citiran u tekstu predviđa da će ne-ljudski saobraćaj premašiti ljudski u prvoj polovini 2027. godine.
Za product manager-e koji grade proizvode sa AI agentima kao primarnim korisnicima — interni alati za automatizaciju, agentni pipeline-ovi ili sistemi za multi-agent orkestraciju — ovo ima nekoliko praktičnih posledica. Proizvodi koji se oslanjaju na agentne radne tokove zahtevaju infrastrukturno planiranje koje anticipira nagle poraste i periode mirovanja, a ne ravnomerni rast. Modeli troškova zasnovani na stabilnoj potrošnji potceniće stvarne troškove kada agenti uđu u produkciju.
Tekst takođe napominje da razlika između infrastrukture dizajnirane za ljude i infrastrukture dizajnirane za agente postaje differentiator. Proizvodi koji se ranije integrišu sa backend-ovima optimizovanim za agente — odvojeno računanje, vektorske baze podataka, naplate po korišćenju — suočiće se sa manje neočekivanih kapacitetnih i troškovnih problema dok agentne radne obaveze rastu.