Автоматический fallback между моделями
Если upstream-провайдер вернёт ошибку, запрос автоматически повторится на резервной модели. Для Claude-моделей fallback настроен по умолчанию, а каждый пользователь может задать свои правила в настройках.
Мы добавили автоматический fallback между моделями. Если upstream-провайдер вернёт ошибку на запросе к одной модели — мы молча повторим запрос к резервной модели, и вы получите нормальный ответ, а не 5xx. Работает для /v1/chat/completions и Anthropic Messages API /v1/messages.
Как это работает
При ошибке апстрима (5xx, 429, timeout) запрос прозрачно переотправляется на fallback-модель. Клиентские ошибки (400, 401, 403, 404, 422, 402) не ретраятся — другая модель их не исправит. Биллинг идёт по той модели, которая реально ответила.
Для всех моделей Claude семейства fallback уже настроен по умолчанию: claude-opus-4-7 → claude-opus-4-7-r, claude-sonnet-4-6 → claude-sonnet-4-6-r и так далее. Резервные *-r копии дешевле примерно в 2 раза и покрывают те же запросы.
Как настроить свои fallback-правила
В разделе Настройки появился блок «Резервные модели». Там можно:
- выбрать fallback по умолчанию для всех запросов, если для конкретной модели правило не задано;
- добавить индивидуальные правила вида
исходная модель → резервнаядля любой пары моделей.
Порядок приоритета при ошибке:
- Ваше индивидуальное правило для этой модели
- Глобальный fallback, настроенный для модели
- Ваш fallback по умолчанию
Если ни одно правило не задано — запрос вернёт ошибку как и раньше.
Зачем это нужно
Апстримы иногда падают или режутся по лимитам — особенно новые Claude-модели в пиковые часы. Раньше такой запрос приходил к вам как ошибка. Теперь в большинстве случаев вы получите ответ, просто от резервной копии модели.
Ничего менять в коде не нужно — fallback работает автоматически для всех, у кого он настроен.