Inference Embeddings Rerank Images Speech Guard
EN DE ES

IA Speech-to-Text &
Text-to-Speech,
costruito per l'Europa.

Sede in Germania 100% residenza dati nell'UE

Transcribe audio and generate speech on European GPUs.
Open-source models with custom voice cloning.
Your voice data never leaves the EU.

Crea un account gratuito 5 min/mese gratis
// modelli + prezzi

Modelli vocali

Eseguiamo le famiglie di modelli Qwen3 ASR e TTS per il riconoscimento e la sintesi vocale. Multilingue, pesi aperti e ottimizzati per carichi di lavoro di produzione. Clonazione voce personalizzata inclusa.

Tutti i modelli funzionano su chip Blackwell moderni o più recenti per prestazioni ideali. Piano gratuito incluso su tutti i modelli.


Speech-to-Text
Qwen3-ASR-0.6B
Trascrizione veloce e leggera. Ideale per carichi ad alto throughput o in tempo reale.
0,006 € / minute In arrivo
Parameters0.6B
TaskSpeech-to-Text
LanguagesMultilingual
Pricing0,006 € / min
Qwen3-ASR-1.7B
Maggiore precisione per audio complesso. Ideale per riunioni, chiamate e ambienti rumorosi.
0,01 € / minute In arrivo
Parameters1.7B
TaskSpeech-to-Text
LanguagesMultilingual
Pricing0,01 € / min

Text-to-Speech
Qwen3-TTS-0.6B
Sintesi vocale veloce con intonazione naturale. Ideale per notifiche e contenuti brevi.
0,015 € / 1K characters In arrivo
Parameters0.6B
TaskText-to-Speech
Custom VoiceYes
Pricing0,015 € / 1K chars
Qwen3-TTS-1.7B
Sintesi di qualità premium. Voce espressiva e naturale per audiolibri, assistenti e contenuti rivolti al cliente.
0,020 € / 1K characters In arrivo
Parameters1.7B
TaskText-to-Speech
Custom VoiceYes
Pricing0,020 € / 1K chars
Piano gratuito
5 min di trascrizione e sintesi/mese Nessuna carta di credito
Clonazione voce personalizzata
Create una voce sintetica che suoni come un parlante specifico. Fornite un breve riferimento audio e il modello TTS genererà nuovo parlato con quella voce. Ideale per voci di marca, assistenti virtuali o contenuti personalizzati.
Funziona con entrambi i modelli TTS. Nessun fine-tuning necessario. Incluso senza costi aggiuntivi in ogni chiamata API TTS.
  1. 1. Caricate un breve campione audio (10+ secondi consigliati)
  2. 2. Fate riferimento alla voce nelle vostre chiamate API TTS
  3. 3. Generate parlato con quella voce da qualsiasi testo
Tutti i dati vocali rimangono sull'infrastruttura UE. Nessun dato vocale viene memorizzato dopo l'elaborazione a meno che non creiate esplicitamente un profilo vocale salvato.
// cosa potete costruire

Casi d'uso

Speech APIs enable a wide range of applications. From transcription pipelines to voice-enabled products.

Trascrizione riunioni e chiamate
Trascrivete riunioni, chiamate e interviste in tempo reale o da registrazioni. Supporto multilingue per team europei che lavorano in più lingue.
Assistenti vocali e chatbot
Combinate speech-to-text e text-to-speech per assistenti IA completamente abilitati alla voce. Elaborate il parlato dell'utente, generate una risposta e pronunciatela.
Narrazione di contenuti
Trasformate articoli, documentazione o contenuti e-learning in audio dal suono naturale. Usate voci personalizzate per un'identità di marca coerente.
Accessibilità
Rendete la vostra applicazione accessibile con text-to-speech per utenti ipovedenti e speech-to-text per utenti non udenti. Conforme al GDPR per impostazione predefinita.
// per i team che hanno bisogno di più
Serve di più? Il piano Business copre tutti i prodotti Nodion.ai: Inference, Embeddings, Images, Speech e altro. 500 €/mese, capacità GPU dedicata, 99.5% SLA.
Vedi piano Business →
// per iniziare

Documentazione API

L'API vocale segue il formato dell'API Audio di OpenAI. Usate gli stessi endpoint e SDK che già conoscete.

# Base URL
https://api.nodion.ai/v1

Speech-to-Text

# Transcribe audio
curl https://api.nodion.ai/v1/audio/transcriptions \
  -H "Authorization: Bearer $NODION_API_KEY" \
  -F file=@meeting.mp3 \
  -F model=qwen/qwen3-asr-1.7b

Text-to-Speech

# Generate speech
curl https://api.nodion.ai/v1/audio/speech \
  -H "Authorization: Bearer $NODION_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen3-tts-1.7b",
    "input": "Welcome to Nodion, your European AI platform."
  }' \
  --output speech.mp3

Supporta: /v1/audio/transcriptions, /v1/audio/speech. Voce personalizzata tramite il parametro voice. Molteplici formati audio.

// perché è importante
GDPR nativo. I dati vocali sono dati biometrici ai sensi del GDPR. La nostra infrastruttura garantisce che non lascino mai l'UE. Nessun transatlantic transatlantico. Nessun rischio di decisioni di adeguatezza.
Energia verde nordica. Cluster GPU in Svezia e Finlandia funzionano con energia rinnovabile. Il clima freddo significa raffreddamento naturale, meno spreco energetico, impronta più piccola.
Nessuna dipendenza dagli USA. Azienda tedesca. Server nell'UE. Modelli open source. Sovranità completa senza dipendenza da hyperscaler.
Solo open source. Ogni modello che serviamo è completamente aperto. Potete ispezionare i pesi, comprendere l'architettura e verificare i risultati.
OpenAI-compatible API. Drop-in replacement. Cambiate il vostro URL base e starete elaborando voce su infrastruttura europea sovrana.

Pronti per iniziare?

5 minuti di trascrizione e sintesi al mese. Nessuna carta di credito richiesta.

Crea un account gratuito