Text Parser
Extracts text from a document file. Supports PDF, DOCX, PPTX, XLSX, and plain text formats. Upload a file via multipart/form-data.
Privacy: Text parsing runs entirely in-memory on Venice’s infrastructure with zero data retention. Documents are processed and immediately discarded — no content is stored or logged.
Authentication: This endpoint accepts either a Bearer API key or a SIGN-IN-WITH-X header for x402 wallet-based authentication. The legacy X-Sign-In-With-X header is also accepted during migration. When using x402, a 402 Payment Required response indicates insufficient balance and includes top-up instructions.
file. Los formatos admitidos incluyen PDF, DOCX, XLSX y archivos de texto plano (hasta 25 MB).
Establece response_format en json (predeterminado) para obtener una salida estructurada con el texto extraído y el número de tokens, o en text para obtener el texto extraído sin procesar.
Privacidad: el parseo de texto se ejecuta íntegramente en memoria en la infraestructura de Venice con cero retención de datos. Tus documentos se procesan y se descartan inmediatamente: no se almacena ni se registra ningún contenido.
Precio: 0,01 $ por solicitud.
Ejemplo (cURL)
Autorizaciones
Bearer authentication header of the form Bearer <token>, where <token> is your auth token.
Cuerpo
The document file to parse. Supported formats: PDF, DOCX, PPTX, XLSX, and plain text files. Maximum size: 25MB.
The format of the response output. "json" returns structured JSON with text and token count, "text" returns only the extracted text.
json, text