Рейтинг AI недели — 3–10 мая 2026

Топ-5 AI-моделей недели

#1 Claude Opus 4.7 ↑1

На этой неделе Claude Opus 4.7 оказался в центре обсуждений из-за выхода нового бенчмарка ProgramBench, который показал, что ни одна из моделей, включая Claude, не смогла полностью решить задачи. Это вызвало вопросы о реальных возможностях coding-агентов и их применимости в сложных сценариях.

Claude Opus 4.7 имеет повышенные лимиты на токены и мощность, благодаря аренде Colossus 1 у SpaceX, что позволяет обрабатывать до 10M input и 800K output токенов в минуту.

#2 Claude Mythos Preview NEW

Claude Mythos Preview активно обсуждался на этой неделе после успешной оценки его возможностей в обнаружении уязвимостей в Firefox, где он помог найти 271 уязвимость. Это подчеркивает его потенциал в области кибербезопасности.

По оценкам METR, Claude Mythos Preview продемонстрировал 50% успеха на задачах с горизонтом не менее 16 часов, что указывает на его высокую эффективность.

#3 GPT-5.4 NEW

GPT-5.4 обсуждался в контексте нового бенчмарка ProgramBench, который показал, что ни одна из моделей не смогла решить задачи, что подчеркивает ограничения текущих coding-агентов.

GPT-5.4 продемонстрировал свои возможности в решении математических задач, но также столкнулся с проблемами в контексте многофайлового проектирования.

#4 GPT-5.5 Instant NEW

GPT-5.5 Instant стал новой моделью по умолчанию для ChatGPT, что вызвало обсуждения о его улучшениях, включая сокращение галлюцинаций и обновленный интерфейс памяти.

Модель показала значительное улучшение в AIME 2025, достигнув 81.2, что значительно выше, чем у предшественника.

#5 Claude Opus 4.6 NEW

Claude Opus 4.6 обсуждался в свете новых архитектурных решений, таких как SubQ, которые обещают ускорение инференса и улучшение обработки длинных контекстов.

SubQ анонсировала поддержку контекста до 12M токенов и ускорение до 52× по сравнению с FlashAttention.

Топ-5 AI-инструментов недели

#1 Claude Code

Claude Code стал темой обсуждения из-за повышения лимитов и улучшений, связанных с арендой Colossus 1 у SpaceX, что позволило увеличить токены для платных тарифов.

В результате изменений, Claude Code теперь может обрабатывать до 10M input и 800K output токенов в минуту.

#2 SubQ NEW

SubQ был анонсирован на этой неделе и привлек внимание благодаря своим архитектурным решениям, которые обещают значительное ускорение инференса.

SubQ поддерживает контекст до 12M токенов и предлагает ускорение до 52× по сравнению с существующими решениями.

#3 CAPTCHA Verification NEW

CAPTCHA Verification обсуждался в контексте повышения лимитов Claude, что сделало его более доступным для долгих сессий и сложных задач.

Повышение лимитов связано с новыми вычислительными сделками, включая партнерство с SpaceX.

#4 OpenAI Codex NEW

OpenAI Codex получил расширение для Chrome, что позволило ему работать непосредственно в браузере, что стало темой обсуждения на этой неделе.

Расширение доступно на macOS и Windows, но пока не поддерживается в ЕС и Великобритании.

#5 Claude vs ChatGPT vs Copilot ↑15

Обсуждение о сравнении Claude, ChatGPT и Copilot стало актуальным на этой неделе, когда участники делились опытом использования мульти-модельного подхода.

Мульти-модельный подход позволяет использовать разные модели для различных задач, что повышает эффективность работы.