Рейтинг AI недели — 3–10 мая 2026

Топ-5 AI-моделей недели

#1 Claude Opus 4.7 ↑1

На этой неделе Claude Opus 4.7 оказался в центре обсуждений из-за выхода нового бенчмарка ProgramBench, который показал, что ни одна из моделей, включая Claude, не смогла полностью решить задачи. Это вызвало вопросы о реальных возможностях coding-агентов и их применимости в сложных сценариях.

Claude Opus 4.7 имеет повышенные лимиты на токены и мощность, благодаря аренде Colossus 1 у SpaceX, что позволяет обрабатывать до 10M input и 800K output токенов в минуту.

Claude Opus 4.7 Qwen3.6-35B-A3B on my laptop drew me a better pelican than Claude Opus 4.7 Claude Opus 4.7 Anthropic: Higher limits through expanded compute

#2 Claude Mythos Preview NEW

Claude Mythos Preview активно обсуждался на этой неделе после успешной оценки его возможностей в обнаружении уязвимостей в Firefox, где он помог найти 271 уязвимость. Это подчеркивает его потенциал в области кибербезопасности.

По оценкам METR, Claude Mythos Preview продемонстрировал 50% успеха на задачах с горизонтом не менее 16 часов, что указывает на его высокую эффективность.

Hardening Firefox with Claude Mythos Preview Evaluation of Claude Mythos Preview's cyber capabilities Behind the Scenes Hardening Firefox with Claude Mythos Preview METR Evals — Mythos Preview horizon eval

#3 GPT-5.4 NEW

GPT-5.4 обсуждался в контексте нового бенчмарка ProgramBench, который показал, что ни одна из моделей не смогла решить задачи, что подчеркивает ограничения текущих coding-агентов.

GPT-5.4 продемонстрировал свои возможности в решении математических задач, но также столкнулся с проблемами в контексте многофайлового проектирования.

GPT-5.4 Pro solves Erdős Problem #1196 Comparing GPT-5.4, Opus 4.6, GLM-5.1, Kimi K2.5, MiMo V2 Pro and MiniMax M2.7 A GPT-5.4 bug led to OpenAI banning goblins and raccoons ProgramBench

#4 GPT-5.5 Instant NEW

GPT-5.5 Instant стал новой моделью по умолчанию для ChatGPT, что вызвало обсуждения о его улучшениях, включая сокращение галлюцинаций и обновленный интерфейс памяти.

Модель показала значительное улучшение в AIME 2025, достигнув 81.2, что значительно выше, чем у предшественника.

GPT-5.5 Instant: Benchmarking the 52% Hallucination Reduction GPT‑5.5 Instant OpenAI releases GPT-5.5 Instant, a new default model for ChatGPT OpenAI представила GPT-5.5 Instant как новую модель по умолчанию в ChatGPT

#5 Claude Opus 4.6 NEW

Claude Opus 4.6 обсуждался в свете новых архитектурных решений, таких как SubQ, которые обещают ускорение инференса и улучшение обработки длинных контекстов.

SubQ анонсировала поддержку контекста до 12M токенов и ускорение до 52× по сравнению с FlashAttention.

Changes in the system prompt between Claude Opus 4.6 and 4.7 Claude Opus 4.6 accuracy on BridgeBench hallucination test drops from 83% to 68% Google — Multi-Token Prediction for Gemma 4 Gemma 4 MTP drafters collection

Топ-5 AI-инструментов недели

#1 Claude Code →

Claude Code стал темой обсуждения из-за повышения лимитов и улучшений, связанных с арендой Colossus 1 у SpaceX, что позволило увеличить токены для платных тарифов.

В результате изменений, Claude Code теперь может обрабатывать до 10M input и 800K output токенов в минуту.

Claude Code refuses requests or charges extra if your commits mention "OpenClaw" An update on recent Claude Code quality reports Claude Code Routines Anthropic: Higher limits through expanded compute

#2 SubQ NEW

SubQ был анонсирован на этой неделе и привлек внимание благодаря своим архитектурным решениям, которые обещают значительное ускорение инференса.

SubQ поддерживает контекст до 12M токенов и предлагает ускорение до 52× по сравнению с существующими решениями.

SubQ: a sub-quadratic LLM with 12M-token context SubQ: Sub-quadratic LLM built for 12M-token context SubQ Google — Multi-Token Prediction for Gemma 4

#3 CAPTCHA Verification NEW

CAPTCHA Verification обсуждался в контексте повышения лимитов Claude, что сделало его более доступным для долгих сессий и сложных задач.

Повышение лимитов связано с новыми вычислительными сделками, включая партнерство с SpaceX.

Show HN: OQP – A verification protocol for AI agents Show HN: OQP – A verification protocol for AI agents The Verge — Anthropic’s Claude usage limits are getting a boost after compute deals CAPTCHA Verification

#4 OpenAI Codex NEW

OpenAI Codex получил расширение для Chrome, что позволило ему работать непосредственно в браузере, что стало темой обсуждения на этой неделе.

Расширение доступно на macOS и Windows, но пока не поддерживается в ЕС и Великобритании.

OpenAI Codex system prompt includes directive: "never talk about goblins" OpenAI Models, Codex, and Managed Agents Come to AWS OpenAI Wants Codex to Shut Up About Goblins OpenAI

#5 Claude vs ChatGPT vs Copilot ↑15

Обсуждение о сравнении Claude, ChatGPT и Copilot стало актуальным на этой неделе, когда участники делились опытом использования мульти-модельного подхода.

Мульти-модельный подход позволяет использовать разные модели для различных задач, что повышает эффективность работы.

Claude vs ChatGPT vs Copilot для кода: сравнение 2026 Релиз Claude 3.7 Sonnet — лучшая LLM для кодинга Год с Claude Code: как собрать рабочую конфигурацию с первого запуска / Хабр InsForge

Каждый день получайте такие сигналы в Telegram →