Рейтинг AI недели — 28 июня – 5 июля 2026

Топ-5 AI-моделей недели

#1 Claude Sonnet 5 NEW

На этой неделе Anthropic представила Claude Sonnet 5, которая стала доступна широкой аудитории, включая бесплатный доступ. Модель позиционируется как более дешёвый рабочий дефолт с объявленной ценовой сеткой.

Claude Sonnet 5 предлагает API с ценами $2 за 1M input и $10 за 1M output, что делает её доступной для разработчиков.

#2 ZCode 3.0 NEW

Z.ai выпустила ZCode 3.0, AI-native IDE, поддерживающую multi-agent рабочие процессы. Этот релиз стал значимым шагом для разработки с агентами.

ZCode 3.0 включает ревью кода и тесную интеграцию с GLM-5.2, что делает его мощным инструментом для разработчиков.

#3 GLM-5.2 ↑3

GLM-5.2 на этой неделе обошла Claude Opus 4.8 на Terminal Bench 2.1, что вызвало обсуждения о её производительности. Также модель интегрирована в ZCode 3.0.

На Terminal Bench 2.1 GLM-5.2 получила 82.7, в то время как Claude Opus 4.8 показала 78.9, что подчеркивает её конкурентоспособность.

#4 LongCat 2.0 NEW

Meituan анонсировала LongCat 2.0, обученную на китайских чипах, что привлекло внимание к архитектурным решениям для длинного контекста.

LongCat 2.0 включает информацию о стоимости API и параметрах обучения на большом масштабе.

#5 Leanstral 1.5 NEW

Mistral обновила Leanstral до версии 1.5, что стало важным шагом для поддержки формальной верификации в языке Lean 4.

Leanstral 1.5 ориентирована на помощь в составлении и проверке доказательств, что делает её полезной для разработчиков.

Топ-5 AI-инструментов недели

#1 Claude Code ↑1

На этой неделе Anthropic выпустила официальную библиотеку шаблонов для Claude Code, что стало значительным шагом для разработчиков. Также компания ограничила доступ к инструменту для разработчиков из Китая.

Библиотека включает шаблоны для планирования, отладки и автоматизации, что делает её полезной для реальных инженерных сценариев.

#2 GFusion NEW

Сбер открыл GFusion — диффузионную LLM на базе GigaChat, что привлекло внимание к её нетипичной механике вывода. Модель была опубликована в open source.

GFusion пытается генерировать и править текст блоками, что отличается от традиционных autoregressive моделей.

#3 Caveman Code NEW

Caveman Code стал популярным плагином, который экономит токены за счёт сжатия стиля ответов LLM. Этот инструмент привлек внимание разработчиков на фоне роста цен на токены.

Caveman Code позволяет экономить до 75% токенов за счёт сокращения вводных пояснений и длинных переходов.

#4 KVAE-Audio NEW

Сбер открыл KVAE-Audio для аудиосжатия, что стало важным шагом в генеративных моделях. Инструмент демонстрирует значительное сжатие времени обработки звука.

KVAE-Audio обрабатывает звук в формате 48 кГц и показывает сжатие до 960× по времени.

#5 KVAE-Audio weights NEW

Сбер открыл KVAE-Audio для аудиосжатия, что стало важным шагом в генеративных моделях. Инструмент демонстрирует значительное сжатие времени обработки звука.

KVAE-Audio обрабатывает звук в формате 48 кГц и показывает сжатие до 960× по времени.