Vai al contenuto principale
Venice AI è un sostituto drop-in per OpenAI. Stesso SDK, stesso codice — basta cambiare due righe. Ottieni inferenza privacy-first, modelli senza restrizioni e prezzi competitivi.

La migrazione in 2 righe

Python

# Prima (OpenAI)
from openai import OpenAI
client = OpenAI()

# Dopo (Venice) — cambia api_key e base_url
from openai import OpenAI
client = OpenAI(
    api_key="your-venice-api-key",          # ← Modifica 1
    base_url="https://api.venice.ai/api/v1"  # ← Modifica 2
)

Node.js

// Prima (OpenAI)
import OpenAI from 'openai';
const client = new OpenAI();

// Dopo (Venice)
import OpenAI from 'openai';
const client = new OpenAI({
  apiKey: 'your-venice-api-key',
  baseURL: 'https://api.venice.ai/api/v1',
});

cURL

# Prima
curl https://api.openai.com/v1/chat/completions ...

# Dopo — basta cambiare URL e chiave
curl https://api.venice.ai/api/v1/chat/completions ...

Variabili d’ambiente

# Prima
OPENAI_API_KEY=sk-...
OPENAI_BASE_URL=https://api.openai.com/v1

# Dopo
OPENAI_API_KEY=your-venice-api-key
OPENAI_BASE_URL=https://api.venice.ai/api/v1
Molte librerie e strumenti leggono automaticamente OPENAI_API_KEY e OPENAI_BASE_URL. Aggiornare solo queste variabili d’ambiente potrebbe essere tutto ciò di cui hai bisogno.

Mappatura dei modelli

Modello OpenAIEquivalente VeniceTipoPrezzo (Input/Output per 1M)
gpt-4ozai-org-glm-4.7 (Private)Text0.55/0.55 / 2.65
gpt-4oopenai-gpt-52 (Anonymized)Text2.19/2.19 / 17.50
gpt-4o-miniqwen3-4bText0.05/0.05 / 0.15
gpt-4-turbomistral-31-24bText0.50/0.50 / 2.00
o1 / o3qwen3-235b-a22b-thinking-2507 (Private)Reasoning0.45/0.45 / 3.50
o1 / o3grok-41-fast (Anonymized)Reasoning0.50/0.50 / 1.25
gpt-4-visionmistral-31-24b o qwen3-vl-235b-a22bVision0.50/0.50 / 2.00
text-embedding-3-smalltext-embedding-bge-m3Embeddings0.15/0.15 / 0.60
dall-e-3qwen-image (Private, $0.01) o flux-2-proImageDa $0.01
whispernvidia/parakeet-tdt-0.6b-v3STT$0.0001/sec
tts-1tts-kokoroTTS$3.50/1M chars

Compatibilità delle funzionalità

FunzionalitàOpenAIVeniceNote
Chat CompletionsCompletamente compatibile
StreamingFormato SSE identico
Function CallingStesso parametro tools
Structured OutputStesso response_format
VisionStesso formato dell’array di contenuto
EmbeddingsStessa API
Image GenerationCompatibile con OpenAI tramite /images/generations*
TTSCompatibile
STTCompatibile
Assistants APIUsa invece Characters o Minds
Batch APINon ancora disponibile
Fine-tuningNon disponibile
*Venice fornisce anche un endpoint compatibile con OpenAI in POST /images/generations per una migrazione più facile da DALL-E. Per l’API immagini nativa di Venice con opzioni aggiuntive, consulta Image Generate.

Funzionalità solo di Venice

Venice offre capacità che OpenAI non ha:

1. Web search integrata

response = client.chat.completions.create(
    model="venice-uncensored",
    messages=[{"role": "user", "content": "Latest AI news today"}],
    extra_body={
        "venice_parameters": {
            "enable_web_search": "auto"
        }
    }
)

2. Web scraping

response = client.chat.completions.create(
    model="venice-uncensored",
    messages=[{"role": "user", "content": "Summarize https://example.com/article"}],
    extra_body={
        "venice_parameters": {
            "enable_web_scraping": True
        }
    }
)

3. Personaggi (Persona AI)

response = client.chat.completions.create(
    model="venice-uncensored",
    messages=[{"role": "user", "content": "Tell me about yourself"}],
    extra_body={
        "venice_parameters": {
            "character_slug": "venice-ai"
        }
    }
)

4. Modelli senza restrizioni

I modelli privati di Venice non hanno filtri sui contenuti, rendendoli adatti a:
  • Scrittura creativa senza guardrail
  • Ricerca di sicurezza e red teaming
  • Analisi onesta senza pattern di rifiuto
  • Informazioni mediche/legali senza disclaimer

5. Generazione video

# Metti in coda un job di generazione video
import requests

response = requests.post(
    "https://api.venice.ai/api/v1/video/queue",
    headers={"Authorization": f"Bearer {api_key}", "Content-Type": "application/json"},
    json={
        "model": "wan-2.6-text-to-video",
        "prompt": "A serene lake at sunset with gentle waves",
        "resolution": "720p",
        "duration": 5,
    }
)
job_id = response.json()["id"]

Perché migrare?

Privacy

  • Zero data retention sui modelli privati — i tuoi prompt non vengono mai memorizzati
  • Nessun training sui tuoi dati — mai
  • OpenAI conserva i dati per 30 giorni e può usarli per ricerca sulla sicurezza

Costo

  • I modelli privati sono spesso più economici degli equivalenti OpenAI
  • qwen3-4b a $0,05/1M input è 10× più economico di gpt-4o-mini
  • venice-uncensored a 0,20/1Minputcontrogpt4oa0,20/1M input contro gpt-4o a 2,50/1M

Libertà

  • Nessun filtro sui contenuti sui modelli senza restrizioni
  • Nessuna sospensione di account per casi d’uso controversi
  • Nativo Web3 con opzioni di pagamento crypto
  • Staking DIEM per crediti giornalieri

Diversità dei modelli

  • Accesso a modelli di più provider (Qwen, Llama, Mistral, Gemma, Claude, GPT, Grok, ecc.)
  • Passa tra modelli privati e anonimizzati per richiesta
  • Nuovi modelli aggiunti regolarmente

Migrazione dei framework

La maggior parte dei framework AI funziona con Venice cambiando il base URL:
FrameworkModifica richiesta
LangChainbase_url in ChatOpenAI
Vercel AI SDKbaseURL in createOpenAI
CrewAIvariabile d’ambiente OPENAI_API_BASE
LlamaIndexapi_base in OpenAI
AutoGenbase_url nella configurazione
Haystackapi_base_url in OpenAIGenerator
Claude Codeflag --api-base o variabile d’ambiente
Cursorendpoint API personalizzato nelle impostazioni
Continue.devapiBase in config.json

Ottieni la tua API key

Genera una API key Venice e inizia a migrare in pochi minuti