Содержание
Бум agentic AI добрался до облаков так, что теперь не хватает уже CPU. Аналитик Dylan Patel из Semianalysis говорит, что у крупных провайдеров закончились свободные процессоры, и это уже влияет на стабильность сервисов.
Почему в дата-центрах внезапно упёрлись в процессоры
По словам Дилана Пателя, раньше главным ограничением для облака были GPU. Их ставили под классические AI-задачи, где упор шёл на видеоускорители, а CPU в стойке оставался «обслуживающим персоналом».
С ростом agentic AI картина поменялась. Такие системы чаще дергают базы данных и цепляют внешние инструменты. Плюс растёт доля задач, где CPU важен сам по себе: physics и simulation. В итоге процессорная нагрузка в дата-центрах резко выросла.
Патель описывает это через соотношение железа в стойках. Раньше типичный сценарий выглядел как «8 GPU на один CPU в стойке». Сейчас, по его словам, пропорция сдвигается к более равному балансу, и CPU перестаёт быть второстепенным компонентом.
Amazon и Microsoft распродали запас CPU под AI-клиентов
Ключевой факт из рассказа Пателя: Amazon и Microsoft, по его словам, исчерпали запас доступных CPU, потому что продали «всё лишнее» AI-компаниям. В числе клиентов он называет OpenAI и Entropic.
Отдельно он утверждает, что Amazon за год утроила объёмы CPU-серверов. Но даже этого, по его оценке, не хватило: провайдер «всё равно» вышел в дефицит и уже не закрывает будущий спрос.
Патель связывает с нехваткой CPU и проблемы со стабильностью баз и сервисов. В пример он приводит жалобы на сбои GitHub: у части пользователей сервис «падает» и иногда не принимает коммиты.
Arm пострадал сильнее, а приоритет AI может ударить по обычным CPU
Ещё одна деталь из Semianalysis: сильнее задело Arm-направление. Патель говорит, что OpenAI переключалась с x86 на Arm, потому что у Amazon раньше было больше свободных CPU-ресурсов. Компании портировали кодовую базу под Arm, когда x86 «проседал» по доступности. Теперь этот манёвр, по его словам, бьёт по AI-командам обратной стороной, потому что дефицит дошёл и туда.
Если провайдеры и заказчики продолжат выкупать всё, что возможно, приоритет производства сместится в сторону облака и AI. В зоне риска и x86: значимую долю серверных CPU для облака поставляют AMD и Intel.
Патель также упоминает, что NVIDIA наращивает серверные стойки с Vera CPU, где одновременно много чипов и много DRAM. Это важная связка: DRAM и так остаётся «AI-ориентированной», а теперь туда же уходит и производственный фокус по CPU. В таком сценарии потребительские и корпоративные линейки могут получить меньше мощностей, а значит — выше цены и хуже доступность.
«Nowadays, the ratio is like getting much, much closer … so then you’ve just seen everyone run out of CPUs. Amazon’s volumes on CPUs», — сказал Dylan Patel из Semianalysis в своём комментарии.
Профиль Дилана Пателя: Dylan Patel of Semianalysis.