텍스트 파서
Extracts text from a document file. Supports PDF, DOCX, PPTX, XLSX, and plain text formats. Upload a file via multipart/form-data.
Privacy: Text parsing runs entirely in-memory on Venice’s infrastructure with zero data retention. Documents are processed and immediately discarded — no content is stored or logged.
Authentication: This endpoint accepts either a Bearer API key or a SIGN-IN-WITH-X header for x402 wallet-based authentication. The legacy X-Sign-In-With-X header is also accepted during migration. When using x402, a 402 Payment Required response indicates insufficient balance and includes top-up instructions.
file 필드를 사용하여 multipart/form-data로 문서 파일을 업로드하세요. 지원되는 형식에는 PDF, DOCX, XLSX 및 일반 텍스트 파일(최대 25MB)이 포함됩니다.
추출된 텍스트와 토큰 수가 포함된 구조화된 출력을 원하면 response_format을 json(기본값)으로 설정하고, 원시 추출 텍스트를 원하면 text로 설정하세요.
개인정보 보호: 텍스트 파싱은 Venice 인프라에서 메모리 내에서만 실행되며 데이터 보존이 없습니다. 문서는 처리된 후 즉시 폐기되며, 콘텐츠는 저장되거나 기록되지 않습니다.
가격: 요청당 $0.01.
예제 (cURL)
인증
Bearer authentication header of the form Bearer <token>, where <token> is your auth token.
본문
The document file to parse. Supported formats: PDF, DOCX, PPTX, XLSX, and plain text files. Maximum size: 25MB.
The format of the response output. "json" returns structured JSON with text and token count, "text" returns only the extracted text.
json, text