Vai al contenuto principale
Loading models…

Categorie di modelli

Generazione di brani: crea brani completi con testo e supporto vocale opzionali
  • ACE-Step 1.5, ElevenLabs Music, MiniMax Music 2.0
Musica ed effetti sonori: genera musica strumentale o effetti sonori da prompt testuali
  • Stable Audio 2.5
Effetti sonori: sintetizza effetti audio e suoni ambientali da prompt testuali
  • ElevenLabs Sound Effects, MMAudio V2
ElevenLabs Music è l’unico modello che supporta force_instrumental per generare musica senza voci.
La generazione audio utilizza un sistema di coda asincrono. Consulta l’API Audio Queue per avviare la generazione e l’API Audio Retrieve per recuperare i risultati.

Prezzi

I prezzi variano in base al modello:
  • Per generazione: prezzo fisso per clip audio (MiniMax Music 2.0, Stable Audio 2.5)
  • Per fascia di durata: il prezzo scala con la fascia di durata (ElevenLabs Music, ACE-Step 1.5)
  • Per secondo: prezzo basato sulla durata dell’output (ElevenLabs Sound Effects, MMAudio V2)
Per preventivi precisi prima della generazione, usa l’API Audio Quote.

Prezzi per fascia di durata

I modelli con prezzi a fasce di durata accettano qualsiasi duration_seconds nell’intervallo min_durationmax_duration del modello. Il prezzo è determinato dalla fascia in cui rientra la durata richiesta. Gli intervalli di fascia sono restituiti nella risposta di /models sotto pricing.durations, con min_seconds e max_seconds per ogni fascia. Ad esempio, ElevenLabs Music accetta 3–600 secondi (fino a 10 minuti) a $0,75 al minuto, arrotondato per eccesso al minuto:
Intervallo di durataChiave fasciaPrezzo base
3–60s60$0,75
61–120s120$1,50
121–180s180$2,25
181–240s240$3,00
241–300s300$3,75
301–360s360$4,50
361–420s420$5,25
421–480s480$6,00
481–540s540$6,75
541–600s600$7,50
Questi sono prezzi base al netto del markup. Usa l’API Audio Quote per ottenere il prezzo esatto che ti verrà addebitato.

Parametri chiave

ParametroDescrizione
promptDescrizione testuale dell’audio da generare
lyrics_promptTesto della canzone per i modelli vocali (richiesto quando il modello ha lyrics_required=true)
duration_secondsLunghezza dell’output in secondi
force_instrumentalGenera senza voci (dove supportato)