Ко всем новостям
Обновление

Автоматический fallback между моделями

Если upstream-провайдер вернёт ошибку, запрос автоматически повторится на резервной модели. Для Claude-моделей fallback настроен по умолчанию, а каждый пользователь может задать свои правила в настройках.

Мы добавили автоматический fallback между моделями. Если upstream-провайдер вернёт ошибку на запросе к одной модели — мы молча повторим запрос к резервной модели, и вы получите нормальный ответ, а не 5xx. Работает для /v1/chat/completions и Anthropic Messages API /v1/messages.

Как это работает

При ошибке апстрима (5xx, 429, timeout) запрос прозрачно переотправляется на fallback-модель. Клиентские ошибки (400, 401, 403, 404, 422, 402) не ретраятся — другая модель их не исправит. Биллинг идёт по той модели, которая реально ответила.

Для всех моделей Claude семейства fallback уже настроен по умолчанию: claude-opus-4-7claude-opus-4-7-r, claude-sonnet-4-6claude-sonnet-4-6-r и так далее. Резервные *-r копии дешевле примерно в 2 раза и покрывают те же запросы.

Как настроить свои fallback-правила

В разделе Настройки появился блок «Резервные модели». Там можно:

  • выбрать fallback по умолчанию для всех запросов, если для конкретной модели правило не задано;
  • добавить индивидуальные правила вида исходная модель → резервная для любой пары моделей.

Порядок приоритета при ошибке:

  1. Ваше индивидуальное правило для этой модели
  2. Глобальный fallback, настроенный для модели
  3. Ваш fallback по умолчанию

Если ни одно правило не задано — запрос вернёт ошибку как и раньше.

Зачем это нужно

Апстримы иногда падают или режутся по лимитам — особенно новые Claude-модели в пиковые часы. Раньше такой запрос приходил к вам как ошибка. Теперь в большинстве случаев вы получите ответ, просто от резервной копии модели.

Ничего менять в коде не нужно — fallback работает автоматически для всех, у кого он настроен.