Pular para o conteúdo principal
GET
/
models
/api/v1/models
curl --request GET \
  --url https://api.venice.ai/api/v1/models \
  --header 'Authorization: Bearer <token>'
{
  "data": [
    {
      "created": 1727966436,
      "id": "llama-3.2-3b",
      "model_spec": {
        "availableContextTokens": 131072,
        "capabilities": {
          "optimizedForCode": false,
          "quantization": "fp16",
          "supportsAudioInput": false,
          "supportsFunctionCalling": true,
          "supportsLogProbs": true,
          "supportsMultipleImages": false,
          "supportsReasoning": false,
          "supportsReasoningEffort": false,
          "supportsResponseSchema": true,
          "supportsTeeAttestation": false,
          "supportsE2EE": false,
          "supportsVision": false,
          "supportsVideoInput": false,
          "supportsWebSearch": true,
          "supportsXSearch": false
        },
        "constraints": {
          "temperature": {
            "default": 0.8
          },
          "top_p": {
            "default": 0.9
          }
        },
        "description": "Compact and efficient model for quick responses and lighter workloads.",
        "name": "Llama 3.2 3B",
        "modelSource": "https://huggingface.co/meta-llama/Llama-3.2-3B",
        "offline": false,
        "privacy": "private",
        "pricing": {
          "input": {
            "usd": 0.15,
            "diem": 0.15
          },
          "output": {
            "usd": 0.6,
            "diem": 0.6
          }
        },
        "traits": [
          "fastest"
        ]
      },
      "object": "model",
      "owned_by": "venice.ai",
      "type": "text"
    }
  ],
  "object": "list",
  "type": "text"
}

Preço por nível de qualidade

Para os modelos de imagem que aceitam o parâmetro opcional quality (atualmente gpt-image-2 e gpt-image-2-edit), a resposta expõe uma matriz de preços por qualidade em model_spec.pricing.quality. Cada chave de primeiro nível é um nível de resolução (1K, 2K, 4K) e cada chave aninhada é um nível de qualidade (low, medium, high) carregando seu próprio preço usd e diem:
"pricing": {
  "resolutions": {
    "1K": { "usd": 0.27, "diem": 0.27 },
    "2K": { "usd": 0.51, "diem": 0.51 },
    "4K": { "usd": 0.84, "diem": 0.84 }
  },
  "quality": {
    "1K": {
      "low":    { "usd": 0.02, "diem": 0.02 },
      "medium": { "usd": 0.07, "diem": 0.07 },
      "high":   { "usd": 0.26, "diem": 0.26 }
    },
    "2K": {
      "low":    { "usd": 0.03, "diem": 0.03 },
      "medium": { "usd": 0.13, "diem": 0.13 },
      "high":   { "usd": 0.50, "diem": 0.50 }
    },
    "4K": {
      "low":    { "usd": 0.05, "diem": 0.05 },
      "medium": { "usd": 0.21, "diem": 0.21 },
      "high":   { "usd": 0.83, "diem": 0.83 }
    }
  }
}
pricing.resolutions é a tabela legada por imagem, mantida para compatibilidade retroativa. pricing.quality é a matriz por (resolução, qualidade) que se aplica sempre que o parâmetro quality é suportado. Ambos os campos são mantidos na resposta para que os clientes possam detectar o suporte a qualidade e exibir a matriz em suas próprias UIs.

Coleção do Postman

Para exemplos adicionais, consulte esta coleção do Postman.

Autorizações

Authorization
string
header
obrigatório

Bearer authentication header of the form Bearer <token>, where <token> is your auth token.

Parâmetros de consulta

type

Filter models by type. Use "all" to get all model types.

Opções disponíveis:
asr,
embedding,
image,
music,
text,
tts,
upscale,
inpaint,
video
Exemplo:

"text"

Resposta

OK

data
object[]
obrigatório

List of available models

object
enum<string>
obrigatório
Opções disponíveis:
list
type
obrigatório

Type of models returned.

Opções disponíveis:
asr,
embedding,
image,
music,
text,
tts,
upscale,
inpaint,
video
Exemplo:

"text"