Pular para o conteúdo principal
Os limites de taxa variam por modelo e tier. Os limites padrão abaixo são uma referência útil, mas o endpoint /api_keys/rate_limits da API é a forma canônica de buscar seus limites atuais. Você pode verificar seus limites exatos a qualquer momento:

Veja seus limites

Playground interativo

Logs de limite de taxa

Veja quais requisições atingiram limites
curl https://api.venice.ai/api/v1/api_keys/rate_limits \
  -H "Authorization: Bearer $VENICE_API_KEY"

Limites padrão

Modelos de texto

Os modelos de texto são agrupados em tiers com base no tamanho. Cada cartão de modelo na página de modelos exibe seu badge de tier.
TierRequisições/minTokens/min
XS5001.000.000
S75750.000
M50750.000
L20500.000
XS qwen3-4b llama-3.2-3bS mistral-31-24b venice-uncensoredM zai-org-glm-5 qwen3-next-80b google-gemma-3-27b-itL qwen3-235b-a22b-instruct-2507 qwen3-235b-a22b-thinking-2507 deepseek-ai-DeepSeek-R1 grok-41-fast kimi-k2-thinking gemini-3-pro-preview hermes-3-llama-3.1-405b qwen3-coder-480b-a35b-instruct zai-org-glm-4.7 openai-gpt-oss-120b

Outros modelos

TipoRequisições/min
Imagem20
Áudio60
Embedding500
Vídeo (queue)40
Vídeo (retrieve)120

Tratamento de erros

Requisições com falha (500, 503, 429) devem ser repetidas com backoff exponencial. Para erros 429 especificamente, verifique o cabeçalho x-ratelimit-reset-requests para o timestamp Unix exato em que você pode tentar novamente. A maioria das bibliotecas HTTP tem mecanismos de retry integrados que tratam isso automaticamente.

Proteção contra abuso

Se você gerar mais de 20 requisições com falha em 30 segundos, a API bloqueará novas requisições por 30 segundos:
Too many failed attempts (> 20) resulting in a non-success status code. Please wait 30s and try again.

Cabeçalhos de resposta

Toda resposta inclui estes cabeçalhos:
CabeçalhoDescrição
x-ratelimit-limit-requestsMáximo de requisições permitidas na janela atual
x-ratelimit-remaining-requestsRequisições restantes na janela atual
x-ratelimit-reset-requestsTimestamp Unix de quando a janela é redefinida
x-ratelimit-limit-tokensMáximo de tokens permitidos por minuto
x-ratelimit-remaining-tokensTokens restantes no minuto atual
x-ratelimit-reset-tokensSegundos até o limite de tokens ser redefinido

Tier Partner

Parceiros recebem limites de taxa significativamente maiores:
TierRequisições/minTokens/min
XS5002.000.000
S1501.500.000
M1001.500.000
L601.000.000
TipoRequisições/min
Imagem60
Áudio120
Embedding500
Se você está atingindo seus limites de taxa consistentemente e seus padrões de uso mostram demanda sustentada ao longo do tempo, entre em contato para discutir acesso de parceiro: [email protected]. Os limites do tier Partner podem ser ajustados com base em suas necessidades específicas.