Содержание
Anthropic запустила Project Glasswing — инициативу, где ИИ-модель ищет и помогает закрывать уязвимости в критическом софте. Внутри проекта используют Claude Mythos Preview, который компания называет «frontier model» и не выпускает в публичный доступ из-за рисков.
Идея простая: ИИ-атаки растут, и индустрия отвечает «огнём на огонь». Но тут есть тонкий момент. Модель умеет не только находить баги, но и генерировать эксплойты. Поэтому доступ дают строго ограниченному кругу.
Кто участвует в Project Glasswing и что именно делает Mythos
Anthropic объявила, что ведёт Project Glasswing вместе с крупной коалицией компаний. В списке — AWS, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia и Palo Alto Networks.
По заявлению Anthropic, Mythos уже нашёл «тысячи» уязвимостей высокой критичности. Компания отдельно подчёркивает охват: потенциальные проблемы обнаружили «в каждой» крупной ОС и веб-браузере, включая баги, которым «десятки лет» и которые пропустили люди.
- Поиск уязвимостей: выявляет дефекты в критическом ПО.
- Генерация эксплойтов: способен создавать рабочие сценарии эксплуатации.
- Патчи: предлагает или генерирует исправления.
Anthropic формулирует мотивацию так: «We formed Project Glasswing because of capabilities we’ve observed in a new frontier model trained by Anthropic that we believe could reshape cybersecurity». По смыслу это про то, что компания увидела в модели практические навыки, которые меняют подход к защите.
Почему Claude Mythos не отдают всем: риск автономных эксплойтов
Anthropic прямо говорит, что Claude Mythos Preview слишком мощный для открытого релиза. Причина в том, что при неправильном использовании он может резко усилить кибератаки. Ключевой риск — способность автономно генерировать эксплойты.
Поэтому модель используют «осторожно» и только утверждённые компании. Доступ организуют через облачных провайдеров, в том числе AWS и Google Cloud. При этом ещё «40+» организаций, которые поддерживают критически важный софт, тоже смогут получить доступ.
Anthropic добавляет, что ответственность не должна лежать только на компаниях. По позиции компании, в теме кибербезопасности с ИИ должны участвовать разработчики frontier-моделей, софтверные компании, исследователи безопасности, мейнтейнеры open-source и государства.
Бенчмарки: Mythos обходит Opus 4.6 и вдвое ускоряется на SWE-bench
Anthropic заявляет, что Mythos стабильно сильнее, чем собственный Claude Opus 4.6, в тестах на agentic coding, reasoning и agentic search/computer use. Самая конкретная цифра — Mythos «более чем вдвое» улучшает результат Opus 4.6 на SWE-bench Multimodal.
Публичного релиза у Mythos пока нет. Anthropic оставляет модель в режиме Preview и ограничивает доступ списком одобренных участников.
Первоисточник: страница Project Glasswing на сайте Anthropic.