Google готовит сразу два новых ускорителя в семействе TPUv8. Компания разделила стратегию на два чипа: отдельный для обучения моделей и отдельный для инференса. Ожидается, что линейку покажут на следующей неделе.
У Google уже есть TPUv7 под кодовым именем Ironwood, который компания предлагает с 2025 года. TPUv8 должен сменить это поколение в дата-центрах Google и в её AI-инфраструктуре.
TPUv8t и TPUv8i: разные задачи, разные разработчики
В TPUv8 Google делает разделение по типу нагрузки. TPUv8i нацелен на инференс и экономичность, а TPUv8t — на максимальную производительность в обучении моделей.
По кодовым именам тоже всё разнесли. TPUv8i проходит как Zebrafish, а TPUv8t — как Sunfish.
- TPUv8i (Zebrafish): ускоритель для инференса, упор на стоимость
- TPUv8t (Sunfish): ускоритель для обучения, упор на производительность
- Разработка TPUv8i: MediaTek
- Разработка TPUv8t: Broadcom
И это важный штрих. В этой паре не фигурирует Marvell, хотя ранее компанию связывали с работой над следующим поколением TPU. Судя по текущей картине, сотрудничество с Marvell может относиться к отдельному кастомному решению или к серии уже после TPUv8.
Интеграция с Axion и эффект на «железо» вокруг дата-центров
Обе версии TPUv8, по текущим данным, Google плотно увяжет с серверными Arm-процессорами Axion. Эти CPU построены на архитектуре Neoverse N3 (Armv9.2), и Google разворачивает их в инфраструктуре с 2024 года.
Параллельно ожидается эффект на поставщиков и «обвязку» дата-центров. Вокруг нового поколения TPU обычно растёт спрос не только на сами чипы и сборку, но и на соседние компоненты.
- OCS all-optical switches: оптические коммутаторы
- Жидкостное охлаждение: стойки и контуры под более плотные конфигурации
- Блоки питания: под рост энергопотребления и плотности
- Оптические коммуникации: линк между стойками и кластерами
Ещё один практичный вывод: крупные заказы под серверы Google могут сильнее зажать общий рынок поставок. TPUv8 планируют использовать для глобальной серверной инфраструктуры и AI-экосистемы компании, а значит, объёмы будут большими.
Ожидаемую дату публикаций и обсуждений по теме можно привязать к отметке April 20, 2026.