A Venice AI é um substituto direto para a OpenAI. Mesmo SDK, mesmo código — basta alterar duas linhas. Obtenha inferência privacy-first, modelos sem censura e preços competitivos.
A migração em 2 linhas
Python
# Before (OpenAI)
from openai import OpenAI
client = OpenAI()
# After (Venice) — change api_key and base_url
from openai import OpenAI
client = OpenAI(
api_key = "your-venice-api-key" , # ← Change 1
base_url = "https://api.venice.ai/api/v1" # ← Change 2
)
Node.js
// Before (OpenAI)
import OpenAI from 'openai' ;
const client = new OpenAI ();
// After (Venice)
import OpenAI from 'openai' ;
const client = new OpenAI ({
apiKey: 'your-venice-api-key' ,
baseURL: 'https://api.venice.ai/api/v1' ,
});
cURL
# Before
curl https://api.openai.com/v1/chat/completions ...
# After — just change the URL and key
curl https://api.venice.ai/api/v1/chat/completions ...
Variáveis de ambiente
# Before
OPENAI_API_KEY = sk-...
OPENAI_BASE_URL = https://api.openai.com/v1
# After
OPENAI_API_KEY = your-venice-api-key
OPENAI_BASE_URL = https://api.venice.ai/api/v1
Muitas bibliotecas e ferramentas leem OPENAI_API_KEY e OPENAI_BASE_URL automaticamente. Apenas atualizar essas variáveis de ambiente pode ser tudo o que você precisa.
Mapeamento de modelos
Modelo OpenAI Equivalente Venice Tipo Preço (entrada/saída por 1M) gpt-4o zai-org-glm-4.7 (Private)Texto 0.55 / 0.55 / 0.55/ 2.65gpt-4o openai-gpt-52 (Anonymized)Texto 2.19 / 2.19 / 2.19/ 17.50gpt-4o-mini qwen3-4bTexto 0.05 / 0.05 / 0.05/ 0.15gpt-4-turbo mistral-31-24bTexto 0.50 / 0.50 / 0.50/ 2.00o1 / o3 qwen3-235b-a22b-thinking-2507 (Private)Raciocínio 0.45 / 0.45 / 0.45/ 3.50o1 / o3 grok-41-fast (Anonymized)Raciocínio 0.50 / 0.50 / 0.50/ 1.25gpt-4-vision mistral-31-24b ou qwen3-vl-235b-a22bVisão 0.50 / 0.50 / 0.50/ 2.00text-embedding-3-small text-embedding-bge-m3Embeddings 0.15 / 0.15 / 0.15/ 0.60dall-e-3 qwen-image (Private, $0.01) ou flux-2-proImagem A partir de $0.01 whisper nvidia/parakeet-tdt-0.6b-v3STT $0.0001/s tts-1 tts-kokoroTTS $3.50/1M caracteres
Compatibilidade de recursos
Recurso OpenAI Venice Notas Chat Completions ✅ ✅ Totalmente compatível Streaming ✅ ✅ Formato SSE idêntico Function Calling ✅ ✅ Mesmo parâmetro tools Structured Output ✅ ✅ Mesmo response_format Visão ✅ ✅ Mesmo formato de array de conteúdo Embeddings ✅ ✅ Mesma API Geração de imagem ✅ ✅ Compatível com OpenAI via /images/generations* TTS ✅ ✅ Compatível STT ✅ ✅ Compatível Assistants API ✅ ❌ Use Characters ou Minds no lugar Batch API ✅ ❌ Ainda não disponível Fine-tuning ✅ ❌ Não disponível
*A Venice também fornece um endpoint compatível com OpenAI em POST /images/generations para facilitar a migração do DALL-E. Para a API de imagem nativa da Venice com opções adicionais, veja Image Generate .
Recursos exclusivos da Venice
A Venice oferece capacidades que a OpenAI não tem:
1. Busca na web integrada
response = client.chat.completions.create(
model = "venice-uncensored" ,
messages = [{ "role" : "user" , "content" : "Latest AI news today" }],
extra_body = {
"venice_parameters" : {
"enable_web_search" : "auto"
}
}
)
2. Web scraping
response = client.chat.completions.create(
model = "venice-uncensored" ,
messages = [{ "role" : "user" , "content" : "Summarize https://example.com/article" }],
extra_body = {
"venice_parameters" : {
"enable_web_scraping" : True
}
}
)
3. Characters (personas de IA)
response = client.chat.completions.create(
model = "venice-uncensored" ,
messages = [{ "role" : "user" , "content" : "Tell me about yourself" }],
extra_body = {
"venice_parameters" : {
"character_slug" : "venice-ai"
}
}
)
4. Modelos sem censura
Os modelos privados da Venice não têm filtragem de conteúdo, tornando-os adequados para:
Escrita criativa sem barreiras
Pesquisa de segurança e red teaming
Análise honesta sem padrões de recusa
Informações médicas/legais sem disclaimers
5. Geração de vídeo
# Queue a video generation job
import requests
response = requests.post(
"https://api.venice.ai/api/v1/video/queue" ,
headers = { "Authorization" : f "Bearer { api_key } " , "Content-Type" : "application/json" },
json = {
"model" : "wan-2.6-text-to-video" ,
"prompt" : "A serene lake at sunset with gentle waves" ,
"resolution" : "720p" ,
"duration" : 5 ,
}
)
job_id = response.json()[ "id" ]
Por que migrar?
Privacidade
Retenção zero de dados em modelos privados — seus prompts nunca são armazenados
Nenhum treinamento com seus dados — nunca
A OpenAI retém dados por 30 dias e pode usá-los para pesquisa de segurança
Custo
Modelos privados são frequentemente mais baratos que os equivalentes da OpenAI
qwen3-4b a $0,05/1M de entrada é 10x mais barato que gpt-4o-mini
venice-uncensored a 0 , 20 / 1 M d e e n t r a d a v s . g p t − 4 o a 0,20/1M de entrada vs. gpt-4o a 0 , 20/1 M d ee n t r a d a v s . g pt − 4 o a 2,50/1M
Liberdade
Sem filtragem de conteúdo em modelos sem censura
Sem suspensões de conta por casos de uso controversos
Nativo Web3 com opções de pagamento em cripto
Stake de DIEM para créditos diários
Diversidade de modelos
Acesso a modelos de múltiplos provedores (Qwen, Llama, Mistral, Gemma, Claude, GPT, Grok, etc.)
Alterne entre modelos privados e anonimizados por requisição
Novos modelos adicionados regularmente
Migração de frameworks
A maioria dos frameworks de IA funciona com a Venice ao alterar a URL base:
Framework Mudança necessária LangChain base_url em ChatOpenAIVercel AI SDK baseURL em createOpenAICrewAI Variável de ambiente OPENAI_API_BASE LlamaIndex api_base em OpenAIAutoGen base_url na configuraçãoHaystack api_base_url em OpenAIGeneratorClaude Code Flag --api-base ou variável de ambiente Cursor Endpoint de API personalizado nas configurações Continue.dev apiBase em config.json
Obtenha sua chave de API Gere uma chave de API Venice e comece a migrar em minutos