Содержание
AMD Ryzen X3D с 3D V-Cache внезапно показали себя не только в играх. В бенчмарке X3D RAG Benchmark такие процессоры оказались до 88% быстрее близких моделей без X3D в задачах, которые упираются в CPU-кэш при RAG-пайплайнах.
Цифры опубликовал ресурс GiggleHD, который прогнал открытый тест на наборе настольных x86-систем. Речь про локальные и on-prem RAG-сценарии для одного узла, где база векторных представлений лежит в пределах примерно 100-200 тысяч векторов.
Почему 3D V-Cache внезапно важен для RAG
Вокруг ИИ сейчас чаще говорят про LLM-инференс на GPU. Но в RAG (Retrieval-Augmented Generation) часть работы уезжает на CPU. Модель генерирует ответ, а перед этим система ищет релевантные куски знаний во внешней базе. И этот поиск часто превращается в узкое место.
Векторный поиск нередко опирается на графовые структуры и алгоритмы вроде HNSW (Hierarchical Navigable Small World). В таких задачах кэш решает: чем больше данных и графа помещается ближе к ядрам, тем меньше дорогих походов в оперативную память. Отсюда и практический выигрыш у чипов с увеличенным кэшем.
Что показал X3D RAG Benchmark на 100K и 200K векторах
X3D RAG Benchmark — это open-source тест, который измеряет, как кэш и архитектура CPU влияют на графовый векторный поиск и соседние этапы в локальных RAG-пайплайнах. Он рассчитан на персональные ПК и небольшие команды, а не на распределённые облачные векторные сервисы.
В бенчмарке GiggleHD разница между X3D и обычными Ryzen оказалась крупной уже на старте.
- 100K Batch Search: Ryzen с 3D V-Cache оказались до 88% быстрее, чем версии без X3D.
- 200K Batch Search: Ryzen 7 9850X3D дал 50%+ к скорости относительно Ryzen 7 9700X (оба — 8-ядерные).
- Сравнение с 16 ядрами: 8-ядерный Ryzen X3D в этих тестах оказался быстрее, чем Ryzen 9 9950X на 16 ядер.
Отдельно выделился этап построения индекса. В 100K Index Build время сократилось на 50%, а в 200K — на 39%. Пропускная способность тоже выросла на X3D-чипах.
В тестах Concurrent RAG Throughput 8-ядерные Ryzen X3D выступили уверенно. А вот в TTFT Throughput разрыв между CPU оказался меньше, потому что задача сильнее зависит от GPU, а не от процессора.
Что это значит для сборки под локальный ИИ
Эти результаты хорошо ложатся в тренд на агентные сценарии, где запросов к базе становится больше, а задержки на поиске начинают кусать сильнее, чем чистый инференс. Мы привыкли думать про видеокарту как про главный ИИ-компонент, но в RAG системный баланс часто решают CPU и память.
И тут 3D V-Cache выглядит логично: он ускоряет именно те участки, где CPU гоняет графы и индексы, а не просто «считает» матрицы. Для домашнего или офисного on-prem RAG это может быть более практичный апгрейд, чем переход на большее число ядер без роста кэша.
Если хотите посмотреть методику и код, бенчмарк лежит на GitHub: X3D RAG Benchmark. А сами результаты тестов GiggleHD опубликованы отдельно: GiggleHD.
Ещё один конкретный факт на ближайшие дни: AMD собирается выпустить Ryzen 9 9950X3D2 с двумя 3D V-Cache-дайсами — это будет самый ёмкий по кэшу настольный Ryzen на момент запуска.