Zum Hauptinhalt springen
Venice AI ist ein Drop-in-Ersatz für OpenAI. Gleiches SDK, gleicher Code — ändern Sie einfach zwei Zeilen. Erhalten Sie datenschutzorientierte Inferenz, unzensierte Modelle und wettbewerbsfähige Preise.

Die 2-Zeilen-Migration

Python

# Vorher (OpenAI)
from openai import OpenAI
client = OpenAI()

# Nachher (Venice) — ändern Sie api_key und base_url
from openai import OpenAI
client = OpenAI(
    api_key="your-venice-api-key",          # ← Änderung 1
    base_url="https://api.venice.ai/api/v1"  # ← Änderung 2
)

Node.js

// Vorher (OpenAI)
import OpenAI from 'openai';
const client = new OpenAI();

// Nachher (Venice)
import OpenAI from 'openai';
const client = new OpenAI({
  apiKey: 'your-venice-api-key',
  baseURL: 'https://api.venice.ai/api/v1',
});

cURL

# Vorher
curl https://api.openai.com/v1/chat/completions ...

# Nachher — ändern Sie einfach die URL und den Schlüssel
curl https://api.venice.ai/api/v1/chat/completions ...

Umgebungsvariablen

# Vorher
OPENAI_API_KEY=sk-...
OPENAI_BASE_URL=https://api.openai.com/v1

# Nachher
OPENAI_API_KEY=your-venice-api-key
OPENAI_BASE_URL=https://api.venice.ai/api/v1
Viele Bibliotheken und Tools lesen OPENAI_API_KEY und OPENAI_BASE_URL automatisch. Manchmal reicht es schon, nur diese Umgebungsvariablen zu aktualisieren.

Modell-Mapping

OpenAI-ModellVenice-ÄquivalentTypPreise (Input/Output pro 1M)
gpt-4ozai-org-glm-4.7 (Private)Text0.55/0.55 / 2.65
gpt-4oopenai-gpt-52 (Anonymized)Text2.19/2.19 / 17.50
gpt-4o-miniqwen3-4bText0.05/0.05 / 0.15
gpt-4-turbomistral-31-24bText0.50/0.50 / 2.00
o1 / o3qwen3-235b-a22b-thinking-2507 (Private)Reasoning0.45/0.45 / 3.50
o1 / o3grok-41-fast (Anonymized)Reasoning0.50/0.50 / 1.25
gpt-4-visionmistral-31-24b oder qwen3-vl-235b-a22bVision0.50/0.50 / 2.00
text-embedding-3-smalltext-embedding-bge-m3Embeddings0.15/0.15 / 0.60
dall-e-3qwen-image (Private, $0.01) oder flux-2-proImageAb $0.01
whispernvidia/parakeet-tdt-0.6b-v3STT$0.0001/sec
tts-1tts-kokoroTTS$3.50/1M Zeichen

Funktionskompatibilität

FunktionOpenAIVeniceHinweise
Chat CompletionsVoll kompatibel
StreamingSSE-Format identisch
Function CallingGleicher tools-Parameter
Structured OutputGleiches response_format
VisionGleiches Content-Array-Format
EmbeddingsGleiche API
Image GenerationOpenAI-kompatibel über /images/generations*
TTSKompatibel
STTKompatibel
Assistants APIVerwenden Sie stattdessen Characters oder Minds
Batch APINoch nicht verfügbar
Fine-tuningNicht verfügbar
*Venice bietet zudem einen OpenAI-kompatiblen Endpoint unter POST /images/generations für eine einfachere Migration von DALL-E. Für die native Image-API von Venice mit zusätzlichen Optionen siehe Image Generate.

Venice-exklusive Funktionen

Venice bietet Funktionen, die OpenAI nicht hat:
response = client.chat.completions.create(
    model="venice-uncensored",
    messages=[{"role": "user", "content": "Latest AI news today"}],
    extra_body={
        "venice_parameters": {
            "enable_web_search": "auto"
        }
    }
)

2. Web Scraping

response = client.chat.completions.create(
    model="venice-uncensored",
    messages=[{"role": "user", "content": "Summarize https://example.com/article"}],
    extra_body={
        "venice_parameters": {
            "enable_web_scraping": True
        }
    }
)

3. Characters (KI-Personas)

response = client.chat.completions.create(
    model="venice-uncensored",
    messages=[{"role": "user", "content": "Tell me about yourself"}],
    extra_body={
        "venice_parameters": {
            "character_slug": "venice-ai"
        }
    }
)

4. Unzensierte Modelle

Die Private-Modelle von Venice haben keine Inhaltsfilterung, was sie geeignet macht für:
  • Kreatives Schreiben ohne Guardrails
  • Security-Forschung und Red Teaming
  • Ehrliche Analyse ohne Refusal-Muster
  • Medizinische/juristische Informationen ohne Disclaimer

5. Video-Generierung

# Queue a video generation job
import requests

response = requests.post(
    "https://api.venice.ai/api/v1/video/queue",
    headers={"Authorization": f"Bearer {api_key}", "Content-Type": "application/json"},
    json={
        "model": "wan-2.6-text-to-video",
        "prompt": "A serene lake at sunset with gentle waves",
        "resolution": "720p",
        "duration": 5,
    }
)
job_id = response.json()["id"]

Warum migrieren?

Datenschutz

  • Zero Data Retention bei Private-Modellen — Ihre Prompts werden niemals gespeichert
  • Kein Training auf Ihren Daten — niemals
  • OpenAI speichert Daten 30 Tage lang und kann sie für Sicherheitsforschung verwenden

Kosten

  • Private-Modelle sind oft günstiger als OpenAI-Äquivalente
  • qwen3-4b bei $0.05/1M Input ist 10× günstiger als gpt-4o-mini
  • venice-uncensored bei 0.20/1MInputvs.gpt4obei0.20/1M Input vs. gpt-4o bei 2.50/1M

Freiheit

  • Keine Inhaltsfilterung bei unzensierten Modellen
  • Keine Account-Sperrungen bei kontroversen Use Cases
  • Web3-nativ mit Krypto-Zahlungsoptionen
  • DIEM-Staking für tägliche Credits

Modellvielfalt

  • Zugriff auf Modelle mehrerer Anbieter (Qwen, Llama, Mistral, Gemma, Claude, GPT, Grok etc.)
  • Wechsel zwischen Private- und Anonymized-Modellen pro Anfrage
  • Regelmäßig neue Modelle

Framework-Migration

Die meisten KI-Frameworks funktionieren mit Venice, indem Sie die Base-URL ändern:
FrameworkErforderliche Änderung
LangChainbase_url in ChatOpenAI
Vercel AI SDKbaseURL in createOpenAI
CrewAIOPENAI_API_BASE Umgebungsvariable
LlamaIndexapi_base in OpenAI
AutoGenbase_url in der Konfiguration
Haystackapi_base_url in OpenAIGenerator
Claude Code--api-base-Flag oder Umgebungsvariable
CursorBenutzerdefinierter API-Endpoint in den Einstellungen
Continue.devapiBase in config.json

API-Schlüssel erhalten

Generieren Sie einen Venice-API-Schlüssel und starten Sie die Migration in wenigen Minuten