TechCrunch: Облачная инфраструктура переосмысливается для AI-агентов, а не для людей
Облачные провайдеры перепроектируют свои системы под AI-агентов, а не под людей. AWS выпустила новое поколение OpenSearch Serverless с разделением вычислений и хранилища — это позволяет мгновенно масштабироваться при всплеске агентной активности и опускаться до нуля в периоды простоя. Причина: агенты создают внезапные, непредсказуемые пики трафика — порождая суб-агентов, одновременно запрашивающих базы данных и API, — а затем замолкают. Традиционная облачная инфраструктура создавалась под стабильное, предсказуемое поведение людей: клики, стриминг, поиск.
По данным Cloudflare, нечеловеческий трафик уже составляет 31% HTTP-активности, причём AI-краулеры — около 25% бот-запросов. Один из аналитиков, цитируемых в статье, прогнозирует, что нечеловеческий трафик превысит человеческий в первой половине 2027 года.
Для product manager’ов, создающих продукты с AI-агентами как первостепенными пользователями — внутренние инструменты автоматизации, агентные пайплайны или системы мультиагентной оркестрации, — это влечёт ряд практических следствий. Продукты, зависящие от агентных рабочих процессов, нуждаются в инфраструктурном планировании с учётом пиков и периодов простоя, а не плавного роста. Модели затрат, построенные на стационарном потреблении, будут недооценивать реальные счета при запуске агентов в продакшне.
Статья также отмечает, что разрыв между инфраструктурой, спроектированной для людей, и инфраструктурой, спроектированной для агентов, становится точкой дифференциации. Продукты, которые раньше интегрируются с агентно-оптимизированными бэкендами — отвязанные вычисления, векторные базы данных, оплата за использование, — вероятно, столкнутся с меньшим числом неожиданных проблем с мощностью и стоимостью по мере роста агентных нагрузок.