Passer au contenu principal
POST
/
augment
/
text-parser
/api/v1/augment/text-parser
curl --request POST \
  --url https://api.venice.ai/api/v1/augment/text-parser \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: multipart/form-data' \
  --form file='@example-file' \
  --form response_format=json
{
  "text": "<string>",
  "tokens": 123
}
Cette API est expérimentale. Le format de la requête et de la réponse peut changer sans préavis.
Téléversez un fichier document via multipart/form-data en utilisant le champ file. Les formats pris en charge incluent PDF, DOCX, XLSX et texte brut (jusqu’à 25 Mo). Définissez response_format sur json (par défaut) pour une sortie structurée avec le texte extrait et le nombre de tokens, ou sur text pour le texte brut extrait. Confidentialité : L’analyse de texte s’exécute entièrement en mémoire sur l’infrastructure de Venice avec zéro rétention de données. Vos documents sont traités puis immédiatement supprimés — aucun contenu n’est stocké ni enregistré. Tarification : 0,01 $ par requête.

Exemple (cURL)

curl -X POST https://api.venice.ai/api/v1/augment/text-parser \
  -H "Authorization: Bearer $VENICE_API_KEY" \
  -F "[email protected]" \
  -F "response_format=json"

Autorisations

Authorization
string
header
requis

Bearer authentication header of the form Bearer <token>, where <token> is your auth token.

Corps

multipart/form-data
file
file
requis

The document file to parse. Supported formats: PDF, DOCX, PPTX, XLSX, and plain text files. Maximum size: 25MB.

response_format
enum<string>
défaut:json

The format of the response output. "json" returns structured JSON with text and token count, "text" returns only the extracted text.

Options disponibles:
json,
text

Réponse

Text extraction completed successfully

Text parser response containing extracted text and token count.

text
string
requis

The extracted text content from the document.

tokens
number
requis

The token count of the extracted text.