Passer au contenu principal
GET
/
models
/api/v1/models
curl --request GET \
  --url https://api.venice.ai/api/v1/models \
  --header 'Authorization: Bearer <token>'
{
  "data": [
    {
      "created": 1727966436,
      "id": "llama-3.2-3b",
      "model_spec": {
        "availableContextTokens": 131072,
        "capabilities": {
          "optimizedForCode": false,
          "quantization": "fp16",
          "supportsAudioInput": false,
          "supportsFunctionCalling": true,
          "supportsLogProbs": true,
          "supportsMultipleImages": false,
          "supportsReasoning": false,
          "supportsReasoningEffort": false,
          "supportsResponseSchema": true,
          "supportsTeeAttestation": false,
          "supportsE2EE": false,
          "supportsVision": false,
          "supportsVideoInput": false,
          "supportsWebSearch": true,
          "supportsXSearch": false
        },
        "constraints": {
          "temperature": {
            "default": 0.8
          },
          "top_p": {
            "default": 0.9
          }
        },
        "description": "Compact and efficient model for quick responses and lighter workloads.",
        "name": "Llama 3.2 3B",
        "modelSource": "https://huggingface.co/meta-llama/Llama-3.2-3B",
        "offline": false,
        "privacy": "private",
        "pricing": {
          "input": {
            "usd": 0.15,
            "diem": 0.15
          },
          "output": {
            "usd": 0.6,
            "diem": 0.6
          }
        },
        "traits": [
          "fastest"
        ]
      },
      "object": "model",
      "owned_by": "venice.ai",
      "type": "text"
    }
  ],
  "object": "list",
  "type": "text"
}

Tarification par niveau de qualité

Pour les modèles d’image qui acceptent le paramètre quality optionnel (actuellement gpt-image-2 et gpt-image-2-edit), la réponse expose une matrice de prix par qualité sous model_spec.pricing.quality. Chaque clé de premier niveau est un niveau de résolution (1K, 2K, 4K) et chaque clé imbriquée est un niveau de qualité (low, medium, high) avec son propre prix usd et diem :
"pricing": {
  "resolutions": {
    "1K": { "usd": 0.27, "diem": 0.27 },
    "2K": { "usd": 0.51, "diem": 0.51 },
    "4K": { "usd": 0.84, "diem": 0.84 }
  },
  "quality": {
    "1K": {
      "low":    { "usd": 0.02, "diem": 0.02 },
      "medium": { "usd": 0.07, "diem": 0.07 },
      "high":   { "usd": 0.26, "diem": 0.26 }
    },
    "2K": {
      "low":    { "usd": 0.03, "diem": 0.03 },
      "medium": { "usd": 0.13, "diem": 0.13 },
      "high":   { "usd": 0.50, "diem": 0.50 }
    },
    "4K": {
      "low":    { "usd": 0.05, "diem": 0.05 },
      "medium": { "usd": 0.21, "diem": 0.21 },
      "high":   { "usd": 0.83, "diem": 0.83 }
    }
  }
}
pricing.resolutions est la grille de prix par image héritée, conservée pour la compatibilité ascendante. pricing.quality est la matrice par (résolution, qualité) qui s’applique chaque fois que le paramètre quality est pris en charge. Les deux champs sont conservés dans la réponse afin que les clients puissent détecter la prise en charge de la qualité et exposer la matrice dans leurs propres interfaces.

Collection Postman

Pour des exemples supplémentaires, veuillez consulter cette collection Postman.

Autorisations

Authorization
string
header
requis

Bearer authentication header of the form Bearer <token>, where <token> is your auth token.

Paramètres de requête

type

Filter models by type. Use "all" to get all model types.

Options disponibles:
asr,
embedding,
image,
music,
text,
tts,
upscale,
inpaint,
video
Exemple:

"text"

Réponse

OK

data
object[]
requis

List of available models

object
enum<string>
requis
Options disponibles:
list
type
requis

Type of models returned.

Options disponibles:
asr,
embedding,
image,
music,
text,
tts,
upscale,
inpaint,
video
Exemple:

"text"