Saltar al contenido principal
GET
/
models
/api/v1/models
curl --request GET \
  --url https://api.venice.ai/api/v1/models \
  --header 'Authorization: Bearer <token>'
{
  "data": [
    {
      "created": 1727966436,
      "id": "llama-3.2-3b",
      "model_spec": {
        "availableContextTokens": 131072,
        "capabilities": {
          "optimizedForCode": false,
          "quantization": "fp16",
          "supportsAudioInput": false,
          "supportsFunctionCalling": true,
          "supportsLogProbs": true,
          "supportsMultipleImages": false,
          "supportsReasoning": false,
          "supportsReasoningEffort": false,
          "supportsResponseSchema": true,
          "supportsTeeAttestation": false,
          "supportsE2EE": false,
          "supportsVision": false,
          "supportsVideoInput": false,
          "supportsWebSearch": true,
          "supportsXSearch": false
        },
        "constraints": {
          "temperature": {
            "default": 0.8
          },
          "top_p": {
            "default": 0.9
          }
        },
        "description": "Compact and efficient model for quick responses and lighter workloads.",
        "name": "Llama 3.2 3B",
        "modelSource": "https://huggingface.co/meta-llama/Llama-3.2-3B",
        "offline": false,
        "privacy": "private",
        "pricing": {
          "input": {
            "usd": 0.15,
            "diem": 0.15
          },
          "output": {
            "usd": 0.6,
            "diem": 0.6
          }
        },
        "traits": [
          "fastest"
        ]
      },
      "object": "model",
      "owned_by": "venice.ai",
      "type": "text"
    }
  ],
  "object": "list",
  "type": "text"
}

Precios por nivel de calidad

Para los modelos de imagen que aceptan el parámetro opcional quality (actualmente gpt-image-2 y gpt-image-2-edit), la respuesta expone una matriz de precios por calidad en model_spec.pricing.quality. Cada clave de nivel superior es un nivel de resolución (1K, 2K, 4K) y cada clave anidada es un nivel de calidad (low, medium, high) con su propio precio usd y diem:
"pricing": {
  "resolutions": {
    "1K": { "usd": 0.27, "diem": 0.27 },
    "2K": { "usd": 0.51, "diem": 0.51 },
    "4K": { "usd": 0.84, "diem": 0.84 }
  },
  "quality": {
    "1K": {
      "low":    { "usd": 0.02, "diem": 0.02 },
      "medium": { "usd": 0.07, "diem": 0.07 },
      "high":   { "usd": 0.26, "diem": 0.26 }
    },
    "2K": {
      "low":    { "usd": 0.03, "diem": 0.03 },
      "medium": { "usd": 0.13, "diem": 0.13 },
      "high":   { "usd": 0.50, "diem": 0.50 }
    },
    "4K": {
      "low":    { "usd": 0.05, "diem": 0.05 },
      "medium": { "usd": 0.21, "diem": 0.21 },
      "high":   { "usd": 0.83, "diem": 0.83 }
    }
  }
}
pricing.resolutions es el esquema heredado por imagen que se mantiene por compatibilidad. pricing.quality es la matriz por (resolución, calidad) que se aplica siempre que el parámetro quality esté admitido. Ambos campos se mantienen en la respuesta para que los clientes puedan detectar el soporte de calidad y mostrar la matriz en sus propias interfaces.

Colección de Postman

Para ver más ejemplos, consulta esta Colección de Postman.

Autorizaciones

Authorization
string
header
requerido

Bearer authentication header of the form Bearer <token>, where <token> is your auth token.

Parámetros de consulta

type

Filter models by type. Use "all" to get all model types.

Opciones disponibles:
asr,
embedding,
image,
music,
text,
tts,
upscale,
inpaint,
video
Ejemplo:

"text"

Respuesta

OK

data
object[]
requerido

List of available models

object
enum<string>
requerido
Opciones disponibles:
list
type
requerido

Type of models returned.

Opciones disponibles:
asr,
embedding,
image,
music,
text,
tts,
upscale,
inpaint,
video
Ejemplo:

"text"