Deprecazione dei modelli
Sappiamo che le deprecazioni possono creare disagi. Per questo motivo cerchiamo di deprecare solo quando necessario e progettiamo funzionalità come tratti (traits) e modelli con marchio Venice per minimizzare le interruzioni. Possiamo deprecare un modello quando:- Un modello più recente offre un chiaro miglioramento per lo stesso caso d’uso
- Il modello non soddisfa più i nostri standard di prestazioni o affidabilità
- Registra costantemente un utilizzo basso e continuare a supportarlo frammenterebbe l’esperienza per tutti gli altri
Processo di deprecazione
Quando un modello rientra nei criteri di deprecazione, annunciamo la modifica con 30-60 giorni di preavviso. Gli avvisi di deprecazione vengono pubblicati nel changelog e nel nostro server Discord. Quando chiami un modello deprecato durante il periodo di preavviso, la risposta dell’API includerà un avviso di deprecazione. Durante il periodo di preavviso, il modello rimane disponibile, anche se in alcuni casi possiamo ridurre la capacità dell’infrastruttura. Forniamo sempre un sostituto consigliato e, quando necessario, offriamo indicazioni di migrazione per facilitare la transizione. Dopo la data di sunset, le richieste al modello verranno instradate automaticamente verso un modello di potenza di elaborazione simile allo stesso prezzo o a un prezzo inferiore. Se l’instradamento non è possibile per ragioni tecniche o di sicurezza, l’API restituirà una risposta 410 Gone. Se un modello deprecato è stato selezionato tramite un trait (comedefault_code, default_vision o fastest), quel trait verrà riassegnato a un sostituto compatibile.
Non rimuoviamo mai i modelli in modo silenzioso né modifichiamo il comportamento senza versioning. Saprai sempre cosa è in esecuzione e come prepararti per ciò che verrà.
Aggiornamenti solo di prestazioni: possiamo distribuire miglioramenti che preservano il comportamento del modello migliorando prestazioni, latenza o efficienza in termini di costi. Questi aggiornamenti sono retrocompatibili e non richiedono alcuna azione da parte del cliente.
Come vengono selezionati i modelli per l’API Venice
Selezioniamo con cura quali modelli rendere disponibili in base a prestazioni, affidabilità ed esigenze reali degli sviluppatori. Per essere incluso, un modello deve dimostrare prestazioni elevate, comportarsi in modo coerente con gli endpoint compatibili OpenAI e offrire un chiaro miglioramento rispetto ad almeno uno dei modelli già supportati. I modelli che stiamo valutando possono essere rilasciati prima in beta per raccogliere feedback e validare le prestazioni su larga scala. Non esponiamo modelli ridondanti, non provati o non pronti per un uso costante in produzione. Il nostro obiettivo è mantenere l’API Venice pulita, capace e ottimizzata per ciò che gli sviluppatori costruiscono davvero. Scopri di più in Deprecazione dei modelli e Elenco attuale dei modelli.Versioning e alias
Tutti i modelli Venice sono identificati da un ID univoco e permanente. Ad esempio:venice-uncensored
zai-org-glm-4.7
zai-org-glm-5
qwen3-vl-235b-a22b
Gli ID dei modelli sono stabili. Se c’è un breaking change, rilasceremo un nuovo ID di modello (ad esempio aggiungendo una versione come v2). Se non ci sono breaking change, possiamo aggiornare il modello esistente e comunicheremo le modifiche significative.
Per fornire flessibilità, Venice mantiene anche alias simbolici, implementati tramite trait, che puntano al modello predefinito consigliato per un dato compito:
I trait offrono un’astrazione stabile per selezionare i modelli, dando al contempo a Venice la flessibilità di migliorare l’implementazione sottostante. Gli sviluppatori che preferiscono l’accesso automatico ai modelli più recenti consigliati possono fare affidamento sugli alias basati su trait.
Per applicazioni che richiedono coerenza rigorosa e comportamento prevedibile, consigliamo di fare riferimento a ID di modello fissi.
Feedback
Puoi inviare il tuo feedback o richieste tramite il nostro portale Featurebase. Manteniamo un changelog pubblico, un roadmap tracker e una motivazione trasparente per aggiungere, aggiornare o rimuovere modelli, e incoraggiamo la partecipazione continua della community.Model Deprecation Tracker
I seguenti modelli sono programmati per la deprecazione o sono stati recentemente deprecati. Consigliamo di migrare ai sostituti suggeriti prima della data di rimozione. I modelli rimangono elencati per 30 giorni dopo la loro data di rimozione.Verificare lo stato di deprecazione tramite l’API
Puoi verificare se un modello è programmato per il ritiro chiamando l’endpoint List Models. I modelli con una data di ritiro includono un oggettodeprecation nel loro model_spec:
deprecation appare solo quando un modello è programmato per il ritiro. Puoi controllare if (model.model_spec.deprecation) per sapere se un modello è in fase di ritiro e usare la data in formato ISO 8601 per avvisare gli utenti o pianificare le migrazioni.