Vai al contenuto principale
L’API Venice esiste per dare agli sviluppatori accesso privato e senza restrizioni a modelli production-grade liberi da filtri nascosti o decisioni opache. Man mano che i modelli migliorano, occasionalmente ritiriamo quelli più vecchi a favore di alternative più intelligenti, veloci o capaci. Progettiamo queste transizioni per essere prevedibili e a basso attrito.

Deprecazione dei modelli

Sappiamo che le deprecazioni possono creare disagi. Per questo motivo cerchiamo di deprecare solo quando necessario e progettiamo funzionalità come tratti (traits) e modelli con marchio Venice per minimizzare le interruzioni. Possiamo deprecare un modello quando:
  • Un modello più recente offre un chiaro miglioramento per lo stesso caso d’uso
  • Il modello non soddisfa più i nostri standard di prestazioni o affidabilità
  • Registra costantemente un utilizzo basso e continuare a supportarlo frammenterebbe l’esperienza per tutti gli altri

Processo di deprecazione

Quando un modello rientra nei criteri di deprecazione, annunciamo la modifica con 30-60 giorni di preavviso. Gli avvisi di deprecazione vengono pubblicati nel changelog e nel nostro server Discord. Quando chiami un modello deprecato durante il periodo di preavviso, la risposta dell’API includerà un avviso di deprecazione. Durante il periodo di preavviso, il modello rimane disponibile, anche se in alcuni casi possiamo ridurre la capacità dell’infrastruttura. Forniamo sempre un sostituto consigliato e, quando necessario, offriamo indicazioni di migrazione per facilitare la transizione. Dopo la data di sunset, le richieste al modello verranno instradate automaticamente verso un modello di potenza di elaborazione simile allo stesso prezzo o a un prezzo inferiore. Se l’instradamento non è possibile per ragioni tecniche o di sicurezza, l’API restituirà una risposta 410 Gone. Se un modello deprecato è stato selezionato tramite un trait (come default_code, default_vision o fastest), quel trait verrà riassegnato a un sostituto compatibile. Non rimuoviamo mai i modelli in modo silenzioso né modifichiamo il comportamento senza versioning. Saprai sempre cosa è in esecuzione e come prepararti per ciò che verrà.
Aggiornamenti solo di prestazioni: possiamo distribuire miglioramenti che preservano il comportamento del modello migliorando prestazioni, latenza o efficienza in termini di costi. Questi aggiornamenti sono retrocompatibili e non richiedono alcuna azione da parte del cliente.
Consulta il Model Deprecation Tracker qui sotto. Per annunci precedenti, consulta il changelog e il nostro server Discord.

Come vengono selezionati i modelli per l’API Venice

Selezioniamo con cura quali modelli rendere disponibili in base a prestazioni, affidabilità ed esigenze reali degli sviluppatori. Per essere incluso, un modello deve dimostrare prestazioni elevate, comportarsi in modo coerente con gli endpoint compatibili OpenAI e offrire un chiaro miglioramento rispetto ad almeno uno dei modelli già supportati. I modelli che stiamo valutando possono essere rilasciati prima in beta per raccogliere feedback e validare le prestazioni su larga scala. Non esponiamo modelli ridondanti, non provati o non pronti per un uso costante in produzione. Il nostro obiettivo è mantenere l’API Venice pulita, capace e ottimizzata per ciò che gli sviluppatori costruiscono davvero. Scopri di più in Deprecazione dei modelli e Elenco attuale dei modelli.

Versioning e alias

Tutti i modelli Venice sono identificati da un ID univoco e permanente. Ad esempio: venice-uncensored zai-org-glm-4.7 zai-org-glm-5 qwen3-vl-235b-a22b Gli ID dei modelli sono stabili. Se c’è un breaking change, rilasceremo un nuovo ID di modello (ad esempio aggiungendo una versione come v2). Se non ci sono breaking change, possiamo aggiornare il modello esistente e comunicheremo le modifiche significative. Per fornire flessibilità, Venice mantiene anche alias simbolici, implementati tramite trait, che puntano al modello predefinito consigliato per un dato compito:
I trait offrono un’astrazione stabile per selezionare i modelli, dando al contempo a Venice la flessibilità di migliorare l’implementazione sottostante. Gli sviluppatori che preferiscono l’accesso automatico ai modelli più recenti consigliati possono fare affidamento sugli alias basati su trait. Per applicazioni che richiedono coerenza rigorosa e comportamento prevedibile, consigliamo di fare riferimento a ID di modello fissi.

Feedback

Puoi inviare il tuo feedback o richieste tramite il nostro portale Featurebase. Manteniamo un changelog pubblico, un roadmap tracker e una motivazione trasparente per aggiungere, aggiornare o rimuovere modelli, e incoraggiamo la partecipazione continua della community.

Model Deprecation Tracker

I seguenti modelli sono programmati per la deprecazione o sono stati recentemente deprecati. Consigliamo di migrare ai sostituti suggeriti prima della data di rimozione. I modelli rimangono elencati per 30 giorni dopo la loro data di rimozione.

Verificare lo stato di deprecazione tramite l’API

Puoi verificare se un modello è programmato per il ritiro chiamando l’endpoint List Models. I modelli con una data di ritiro includono un oggetto deprecation nel loro model_spec:
{
  "id": "some-model-id",
  "model_spec": {
    "name": "Some Model",
    "privacy": "private",
    "deprecation": {
      "date": "2025-03-01T00:00:00.000Z"
    }
  },
  "type": "text",
  "object": "model",
  "owned_by": "venice.ai"
}
L’oggetto deprecation appare solo quando un modello è programmato per il ritiro. Puoi controllare if (model.model_spec.deprecation) per sapere se un modello è in fase di ritiro e usare la data in formato ISO 8601 per avvisare gli utenti o pianificare le migrazioni.