Unigen Amaretti E1.S: AI-модуль M.2 на 60 TOPS

У Unigen появился необычный модуль: Amaretti E1.S ставится в стандартный слот M.2 (или E1.S) и превращает его в локальный ускоритель ИИ. По спецификациям это до 60 TOPS INT8, до 32 ГБ памяти и энергопотребление около 10 Вт.

Идея простая: во многих ПК и ноутбуках M.2-слоты простаивают. Unigen предлагает занять их не SSD, а отдельным NPU-модулем для локальных LLM и агентных сценариев.

Что внутри Amaretti E1.S: SAKURA-II, 10 Вт и до 68 ГБ/с

В основе Amaretti E1.S стоит ускоритель SAKURA-II от EdgeCortix. Этот чип проектировали под низкое энергопотребление, в том числе для компактных платформ уровня Raspberry Pi 5 и других ARM-устройств.

Изображение к статье: Unigen выпустила AI-модуль M.2: 60 TOPS и до 32 ГБ памяти

По данным Unigen и EdgeCortix, характеристики ускорителя такие: 60 TOPS INT8 и 30 TFLOPS BF16. У чипа два 64-битных контроллера LPDDR4x и 20 МБ SRAM-кэша на кристалле. Сам кристалл в корпусе 19×19 BGA, типичное потребление — около 8-10 Вт.

Продолжение после рекламы

Unigen взяла этот ускоритель и собрала на плате формата E1.S модуль, совместимый по установке с M.2. Память — 16 ГБ или 32 ГБ, заявленная пропускная способность — до 68 ГБ/с. Паспортная мощность модуля — 10 Вт, то есть около 6 TOPS на ватт.

Модуль Unigen сразу отгружает с предустановленным радиатором.

Зачем это нужно: локальные LLM до 20B параметров и масштабирование по слотам

Ключевой момент тут — память. Unigen заявляет, что версия на 32 ГБ рассчитана на запуск LLM до 20B параметров локально, без обращения к облаку. Компания позиционирует это как вариант для low-power решений, где нужно крутить GenAI и agentic AI-пайплайны на месте.

Ещё одна деталь — масштабирование. Такие модули можно ставить в несколько M.2-слотов в одной системе и наращивать суммарные возможности. При этом у EdgeCortix уже есть более «тяжёлая» PCIe-конфигурация с двумя такими чипами и расширенными возможностями, но M.2-формат интересен именно простотой интеграции.

По совместимости Unigen перечисляет популярные фреймворки: TensorFlow, PyTorch, ONNX и Hugging Face.