实现合理用户隐私的唯一方法是从一开始就不收集这些信息。从工程角度来看这更难做到,但我们相信这是正确的方法。Venice API 采用与 Venice 平台相同的后端隐私架构:请求通过加密连接经由 Venice 代理转发,对于常规推理 Venice 不存储或记录 prompt 和响应内容,每个所选模型在运行时层加入四种隐私模式之一:Anonymous、Private、TEE 或 E2EE。

隐私架构
Venice 代理是每种隐私模式的共享基础。请求通过 HTTPS/TLS 经由 Venice 转发,Venice 不存储 prompt 或响应内容。所选模型上的隐私模式决定了后续在提供商或模型运行时层会发生什么。 Venice 以四种模式呈现模型隐私。它们在相同的代理基础上构建,并逐步添加更强的保护,从向提供商隐藏身份,到将 prompt 端到端加密至已验证的 enclave。隐私保护级别递增
/models 端点会告诉您每个模型的隐私级别。标记为 anonymized 的模型是 Anonymous 模型,标记为 private 的是 Private 模型。TEE 和 E2EE 在模型的 capabilities 中单独显示,例如 supportsTeeAttestation 和 supportsE2EE。
有关实现细节,请参阅 TEE 与 E2EE 模型指南。
TEE 与 E2EE
TEE 和 E2EE 模型在 Venice 默认的不保留内容的方法之上,添加了加密和硬件支持的控制。何时使用 TEE
您希望模型在已认证的硬件 enclave 内运行,但您的客户端可以通过正常 API 请求发送明文 prompt。
何时使用 E2EE
您希望 prompt 在离开您的客户端之前就被加密,并且只在已验证的 TEE 内被解密。
/chat/completions 配合具备 E2EE 能力的模型。您的客户端必须获取认证、验证 nonce 和 enclave 证据、加密 user 和 system 消息、发送 X-Venice-TEE-* 请求头、流式接收响应,并验证/解密响应内容。
E2EE 还会禁用在 enclave 外需要明文的功能,例如 web 搜索、记忆、摘要、部分工具流以及其他服务端处理。
选择模型
在发送请求前,使用/models 查看每个模型支持的隐私保护。
每个模型都有两个相关字段:
model_spec.privacy告诉您模型的基线隐私模式:anonymized:Venice 向提供商隐藏您的身份,但提供商仍可能看到 prompt。private:Venice 通过零数据保留的基础设施路由请求。
model_spec.capabilities告诉您模型是否支持更强的保护:supportsTeeAttestation:模型可在可验证的可信执行环境中运行。supportsE2EE:模型可接受客户端加密的 prompt,并且仅在 TEE 内解密。
private 以获得零数据保留;选择 tee: true 以获得硬件支持的隔离;当您需要 prompt 在离开客户端前被加密时,选择 e2ee: true。