Рейтинг AI недели — 28 июня – 5 июля 2026
Топ-5 AI-моделей недели
На этой неделе Anthropic представила Claude Sonnet 5, которая стала доступна широкой аудитории, включая бесплатный доступ. Модель позиционируется как более дешёвый рабочий дефолт с объявленной ценовой сеткой.
Claude Sonnet 5 предлагает API с ценами $2 за 1M input и $10 за 1M output, что делает её доступной для разработчиков.
Z.ai выпустила ZCode 3.0, AI-native IDE, поддерживающую multi-agent рабочие процессы. Этот релиз стал значимым шагом для разработки с агентами.
ZCode 3.0 включает ревью кода и тесную интеграцию с GLM-5.2, что делает его мощным инструментом для разработчиков.
GLM-5.2 на этой неделе обошла Claude Opus 4.8 на Terminal Bench 2.1, что вызвало обсуждения о её производительности. Также модель интегрирована в ZCode 3.0.
На Terminal Bench 2.1 GLM-5.2 получила 82.7, в то время как Claude Opus 4.8 показала 78.9, что подчеркивает её конкурентоспособность.
Meituan анонсировала LongCat 2.0, обученную на китайских чипах, что привлекло внимание к архитектурным решениям для длинного контекста.
LongCat 2.0 включает информацию о стоимости API и параметрах обучения на большом масштабе.
Mistral обновила Leanstral до версии 1.5, что стало важным шагом для поддержки формальной верификации в языке Lean 4.
Leanstral 1.5 ориентирована на помощь в составлении и проверке доказательств, что делает её полезной для разработчиков.
Топ-5 AI-инструментов недели
На этой неделе Anthropic выпустила официальную библиотеку шаблонов для Claude Code, что стало значительным шагом для разработчиков. Также компания ограничила доступ к инструменту для разработчиков из Китая.
Библиотека включает шаблоны для планирования, отладки и автоматизации, что делает её полезной для реальных инженерных сценариев.
Сбер открыл GFusion — диффузионную LLM на базе GigaChat, что привлекло внимание к её нетипичной механике вывода. Модель была опубликована в open source.
GFusion пытается генерировать и править текст блоками, что отличается от традиционных autoregressive моделей.
Caveman Code стал популярным плагином, который экономит токены за счёт сжатия стиля ответов LLM. Этот инструмент привлек внимание разработчиков на фоне роста цен на токены.
Caveman Code позволяет экономить до 75% токенов за счёт сокращения вводных пояснений и длинных переходов.
Сбер открыл KVAE-Audio для аудиосжатия, что стало важным шагом в генеративных моделях. Инструмент демонстрирует значительное сжатие времени обработки звука.
KVAE-Audio обрабатывает звук в формате 48 кГц и показывает сжатие до 960× по времени.
Сбер открыл KVAE-Audio для аудиосжатия, что стало важным шагом в генеративных моделях. Инструмент демонстрирует значительное сжатие времени обработки звука.
KVAE-Audio обрабатывает звук в формате 48 кГц и показывает сжатие до 960× по времени.