Pular para o conteúdo principal
A Venice AI é um substituto direto para a OpenAI. Mesmo SDK, mesmo código — basta alterar duas linhas. Obtenha inferência privacy-first, modelos sem censura e preços competitivos.

A migração em 2 linhas

Python

# Before (OpenAI)
from openai import OpenAI
client = OpenAI()

# After (Venice) — change api_key and base_url
from openai import OpenAI
client = OpenAI(
    api_key="your-venice-api-key",          # ← Change 1
    base_url="https://api.venice.ai/api/v1"  # ← Change 2
)

Node.js

// Before (OpenAI)
import OpenAI from 'openai';
const client = new OpenAI();

// After (Venice)
import OpenAI from 'openai';
const client = new OpenAI({
  apiKey: 'your-venice-api-key',
  baseURL: 'https://api.venice.ai/api/v1',
});

cURL

# Before
curl https://api.openai.com/v1/chat/completions ...

# After — just change the URL and key
curl https://api.venice.ai/api/v1/chat/completions ...

Variáveis de ambiente

# Before
OPENAI_API_KEY=sk-...
OPENAI_BASE_URL=https://api.openai.com/v1

# After
OPENAI_API_KEY=your-venice-api-key
OPENAI_BASE_URL=https://api.venice.ai/api/v1
Muitas bibliotecas e ferramentas leem OPENAI_API_KEY e OPENAI_BASE_URL automaticamente. Apenas atualizar essas variáveis de ambiente pode ser tudo o que você precisa.

Mapeamento de modelos

Modelo OpenAIEquivalente VeniceTipoPreço (entrada/saída por 1M)
gpt-4ozai-org-glm-4.7 (Private)Texto0.55/0.55 / 2.65
gpt-4oopenai-gpt-52 (Anonymized)Texto2.19/2.19 / 17.50
gpt-4o-miniqwen3-4bTexto0.05/0.05 / 0.15
gpt-4-turbomistral-31-24bTexto0.50/0.50 / 2.00
o1 / o3qwen3-235b-a22b-thinking-2507 (Private)Raciocínio0.45/0.45 / 3.50
o1 / o3grok-41-fast (Anonymized)Raciocínio0.50/0.50 / 1.25
gpt-4-visionmistral-31-24b ou qwen3-vl-235b-a22bVisão0.50/0.50 / 2.00
text-embedding-3-smalltext-embedding-bge-m3Embeddings0.15/0.15 / 0.60
dall-e-3qwen-image (Private, $0.01) ou flux-2-proImagemA partir de $0.01
whispernvidia/parakeet-tdt-0.6b-v3STT$0.0001/s
tts-1tts-kokoroTTS$3.50/1M caracteres

Compatibilidade de recursos

RecursoOpenAIVeniceNotas
Chat CompletionsTotalmente compatível
StreamingFormato SSE idêntico
Function CallingMesmo parâmetro tools
Structured OutputMesmo response_format
VisãoMesmo formato de array de conteúdo
EmbeddingsMesma API
Geração de imagemCompatível com OpenAI via /images/generations*
TTSCompatível
STTCompatível
Assistants APIUse Characters ou Minds no lugar
Batch APIAinda não disponível
Fine-tuningNão disponível
*A Venice também fornece um endpoint compatível com OpenAI em POST /images/generations para facilitar a migração do DALL-E. Para a API de imagem nativa da Venice com opções adicionais, veja Image Generate.

Recursos exclusivos da Venice

A Venice oferece capacidades que a OpenAI não tem:

1. Busca na web integrada

response = client.chat.completions.create(
    model="venice-uncensored",
    messages=[{"role": "user", "content": "Latest AI news today"}],
    extra_body={
        "venice_parameters": {
            "enable_web_search": "auto"
        }
    }
)

2. Web scraping

response = client.chat.completions.create(
    model="venice-uncensored",
    messages=[{"role": "user", "content": "Summarize https://example.com/article"}],
    extra_body={
        "venice_parameters": {
            "enable_web_scraping": True
        }
    }
)

3. Characters (personas de IA)

response = client.chat.completions.create(
    model="venice-uncensored",
    messages=[{"role": "user", "content": "Tell me about yourself"}],
    extra_body={
        "venice_parameters": {
            "character_slug": "venice-ai"
        }
    }
)

4. Modelos sem censura

Os modelos privados da Venice não têm filtragem de conteúdo, tornando-os adequados para:
  • Escrita criativa sem barreiras
  • Pesquisa de segurança e red teaming
  • Análise honesta sem padrões de recusa
  • Informações médicas/legais sem disclaimers

5. Geração de vídeo

# Queue a video generation job
import requests

response = requests.post(
    "https://api.venice.ai/api/v1/video/queue",
    headers={"Authorization": f"Bearer {api_key}", "Content-Type": "application/json"},
    json={
        "model": "wan-2.6-text-to-video",
        "prompt": "A serene lake at sunset with gentle waves",
        "resolution": "720p",
        "duration": 5,
    }
)
job_id = response.json()["id"]

Por que migrar?

Privacidade

  • Retenção zero de dados em modelos privados — seus prompts nunca são armazenados
  • Nenhum treinamento com seus dados — nunca
  • A OpenAI retém dados por 30 dias e pode usá-los para pesquisa de segurança

Custo

  • Modelos privados são frequentemente mais baratos que os equivalentes da OpenAI
  • qwen3-4b a $0,05/1M de entrada é 10x mais barato que gpt-4o-mini
  • venice-uncensored a 0,20/1Mdeentradavs.gpt4oa0,20/1M de entrada vs. gpt-4o a 2,50/1M

Liberdade

  • Sem filtragem de conteúdo em modelos sem censura
  • Sem suspensões de conta por casos de uso controversos
  • Nativo Web3 com opções de pagamento em cripto
  • Stake de DIEM para créditos diários

Diversidade de modelos

  • Acesso a modelos de múltiplos provedores (Qwen, Llama, Mistral, Gemma, Claude, GPT, Grok, etc.)
  • Alterne entre modelos privados e anonimizados por requisição
  • Novos modelos adicionados regularmente

Migração de frameworks

A maioria dos frameworks de IA funciona com a Venice ao alterar a URL base:
FrameworkMudança necessária
LangChainbase_url em ChatOpenAI
Vercel AI SDKbaseURL em createOpenAI
CrewAIVariável de ambiente OPENAI_API_BASE
LlamaIndexapi_base em OpenAI
AutoGenbase_url na configuração
Haystackapi_base_url em OpenAIGenerator
Claude CodeFlag --api-base ou variável de ambiente
CursorEndpoint de API personalizado nas configurações
Continue.devapiBase em config.json

Obtenha sua chave de API

Gere uma chave de API Venice e comece a migrar em minutos