У Unigen появился необычный модуль: Amaretti E1.S ставится в стандартный слот M.2 (или E1.S) и превращает его в локальный ускоритель ИИ. По спецификациям это до 60 TOPS INT8, до 32 ГБ памяти и энергопотребление около 10 Вт.
Идея простая: во многих ПК и ноутбуках M.2-слоты простаивают. Unigen предлагает занять их не SSD, а отдельным NPU-модулем для локальных LLM и агентных сценариев.
Что внутри Amaretti E1.S: SAKURA-II, 10 Вт и до 68 ГБ/с
В основе Amaretti E1.S стоит ускоритель SAKURA-II от EdgeCortix. Этот чип проектировали под низкое энергопотребление, в том числе для компактных платформ уровня Raspberry Pi 5 и других ARM-устройств.
По данным Unigen и EdgeCortix, характеристики ускорителя такие: 60 TOPS INT8 и 30 TFLOPS BF16. У чипа два 64-битных контроллера LPDDR4x и 20 МБ SRAM-кэша на кристалле. Сам кристалл в корпусе 19×19 BGA, типичное потребление — около 8-10 Вт.
Unigen взяла этот ускоритель и собрала на плате формата E1.S модуль, совместимый по установке с M.2. Память — 16 ГБ или 32 ГБ, заявленная пропускная способность — до 68 ГБ/с. Паспортная мощность модуля — 10 Вт, то есть около 6 TOPS на ватт.
Модуль Unigen сразу отгружает с предустановленным радиатором.
Зачем это нужно: локальные LLM до 20B параметров и масштабирование по слотам
Ключевой момент тут — память. Unigen заявляет, что версия на 32 ГБ рассчитана на запуск LLM до 20B параметров локально, без обращения к облаку. Компания позиционирует это как вариант для low-power решений, где нужно крутить GenAI и agentic AI-пайплайны на месте.
Ещё одна деталь — масштабирование. Такие модули можно ставить в несколько M.2-слотов в одной системе и наращивать суммарные возможности. При этом у EdgeCortix уже есть более «тяжёлая» PCIe-конфигурация с двумя такими чипами и расширенными возможностями, но M.2-формат интересен именно простотой интеграции.
По совместимости Unigen перечисляет популярные фреймворки: TensorFlow, PyTorch, ONNX и Hugging Face.
- Форм-фактор: E1.S (установка через M.2/E1.S)
- Ускоритель: EdgeCortix SAKURA-II
- Производительность: до 60 TOPS (INT8), 30 TFLOPS (BF16)
- Память: 16 или 32 ГБ LPDDR4x, до 68 ГБ/с
- Энергопотребление: около 10 Вт
- Целевые модели: LLM до 20B параметров (для версии 32 ГБ)
- Сроки поставки: 14 недель
Для серверного применения Unigen отдельно упоминает цифру до 1920 TOPS суммарной производительности инференса в двухпроцессорных серверах с воздушным охлаждением (речь про конфигурации с несколькими модулями).
Цена пока не раскрыта. Страница продукта и описание модуля доступны на сайте компании: Unigen Amaretti E1.S.