What speech models does Nodion.ai offer?

Nodion.ai offre la famiglia Qwen3 ASR per speech-to-text (0.6B e 1.7B parametri) e la famiglia Qwen3 TTS per text-to-speech (0.6B e 1.7B parametri), inclusa la clonazione voce personalizzata. Tutti i modelli sono open source.

Is the Nodion.ai Speech API GDPR-compliant?

Yes. Like all Nodion.ai services, the Speech API runs entirely on EU-based GPU infrastructure in Sweden and Finland. No data leaves the EU. Operated by Nodion GmbH, a German company. This is especially important for voice data, which is biometric data under GDPR.

What is custom voice cloning?

Custom voice cloning allows you to create a synthetic voice that sounds like a specific speaker. Upload a short audio reference and the model will generate speech in that voice. All voice data stays on EU infrastructure.

What languages are supported?

Qwen3 ASR and TTS models support multiple languages including English, German, French, Spanish, Chinese, Japanese, Korean, and many more. Ideal for multilingual European businesses.

Inference Embeddings Rerank Images Speech Guard

IA Speech-to-Text &
Text-to-Speech,
costruito per l'Europa.

Sede in Germania 100% residenza dati nell'UE

Transcribe audio and generate speech on European GPUs.
Open-source models with custom voice cloning.
Your voice data never leaves the EU.

Crea un account gratuito 5 min/mese gratis

// modelli + prezzi

Modelli vocali

Eseguiamo le famiglie di modelli Qwen3 ASR e TTS per il riconoscimento e la sintesi vocale. Multilingue, pesi aperti e ottimizzati per carichi di lavoro di produzione. Clonazione voce personalizzata inclusa.

Tutti i modelli funzionano su chip Blackwell moderni o più recenti per prestazioni ideali. Piano gratuito incluso su tutti i modelli.

Qwen

Speech-to-Text

Qwen3-ASR-0.6B

Trascrizione veloce e leggera. Ideale per carichi ad alto throughput o in tempo reale.

0,006 € / minute In arrivo

Parameters0.6B

TaskSpeech-to-Text

LanguagesMultilingual

Pricing0,006 € / min

Qwen3-ASR-1.7B

Maggiore precisione per audio complesso. Ideale per riunioni, chiamate e ambienti rumorosi.

0,01 € / minute In arrivo

Parameters1.7B

TaskSpeech-to-Text

LanguagesMultilingual

Pricing0,01 € / min

Text-to-Speech

Qwen3-TTS-0.6B

Sintesi vocale veloce con intonazione naturale. Ideale per notifiche e contenuti brevi.

0,015 € / 1K characters In arrivo

Parameters0.6B

TaskText-to-Speech

Custom VoiceYes

Pricing0,015 € / 1K chars

Qwen3-TTS-1.7B

Sintesi di qualità premium. Voce espressiva e naturale per audiolibri, assistenti e contenuti rivolti al cliente.

0,020 € / 1K characters In arrivo

Parameters1.7B

TaskText-to-Speech

Custom VoiceYes

Pricing0,020 € / 1K chars

Piano gratuito

5 min di trascrizione e sintesi/mese Nessuna carta di credito

Clonazione voce personalizzata

Create una voce sintetica che suoni come un parlante specifico. Fornite un breve riferimento audio e il modello TTS genererà nuovo parlato con quella voce. Ideale per voci di marca, assistenti virtuali o contenuti personalizzati.

Funziona con entrambi i modelli TTS. Nessun fine-tuning necessario. Incluso senza costi aggiuntivi in ogni chiamata API TTS.

1. Caricate un breve campione audio (10+ secondi consigliati)
2. Fate riferimento alla voce nelle vostre chiamate API TTS
3. Generate parlato con quella voce da qualsiasi testo

Tutti i dati vocali rimangono sull'infrastruttura UE. Nessun dato vocale viene memorizzato dopo l'elaborazione a meno che non creiate esplicitamente un profilo vocale salvato.

// cosa potete costruire

Casi d'uso

Speech APIs enable a wide range of applications. From transcription pipelines to voice-enabled products.

Trascrizione riunioni e chiamate

Trascrivete riunioni, chiamate e interviste in tempo reale o da registrazioni. Supporto multilingue per team europei che lavorano in più lingue.

Assistenti vocali e chatbot

Combinate speech-to-text e text-to-speech per assistenti IA completamente abilitati alla voce. Elaborate il parlato dell'utente, generate una risposta e pronunciatela.

Narrazione di contenuti

Trasformate articoli, documentazione o contenuti e-learning in audio dal suono naturale. Usate voci personalizzate per un'identità di marca coerente.

Accessibilità

Rendete la vostra applicazione accessibile con text-to-speech per utenti ipovedenti e speech-to-text per utenti non udenti. Conforme al GDPR per impostazione predefinita.

// per i team che hanno bisogno di più

Serve di più? Il piano Business copre tutti i prodotti Nodion.ai: Inference, Embeddings, Images, Speech e altro. 500 €/mese, capacità GPU dedicata, 99.5% SLA.

Vedi piano Business →

// per iniziare

Documentazione API

L'API vocale segue il formato dell'API Audio di OpenAI. Usate gli stessi endpoint e SDK che già conoscete.

            # Base URL

            https://api.nodion.ai/v1

Speech-to-Text

            # Transcribe audio

            curl https://api.nodion.ai/v1/audio/transcriptions \

              -H "Authorization: Bearer $NODION_API_KEY" \

              -F file=@meeting.mp3 \

              -F model=qwen/qwen3-asr-1.7b

Text-to-Speech

            # Generate speech

            curl https://api.nodion.ai/v1/audio/speech \

              -H "Authorization: Bearer $NODION_API_KEY" \

              -H "Content-Type: application/json" \

              -d '{

                "model": "qwen/qwen3-tts-1.7b",

                "input": "Welcome to Nodion, your European AI platform."

              }' \

              --output speech.mp3

Supporta: /v1/audio/transcriptions, /v1/audio/speech. Voce personalizzata tramite il parametro voice. Molteplici formati audio.

// perché è importante

GDPR nativo. I dati vocali sono dati biometrici ai sensi del GDPR. La nostra infrastruttura garantisce che non lascino mai l'UE. Nessun transatlantic transatlantico. Nessun rischio di decisioni di adeguatezza.

Energia verde nordica. Cluster GPU in Svezia e Finlandia funzionano con energia rinnovabile. Il clima freddo significa raffreddamento naturale, meno spreco energetico, impronta più piccola.

Nessuna dipendenza dagli USA. Azienda tedesca. Server nell'UE. Modelli open source. Sovranità completa senza dipendenza da hyperscaler.

Solo open source. Ogni modello che serviamo è completamente aperto. Potete ispezionare i pesi, comprendere l'architettura e verificare i risultati.

OpenAI-compatible API. Drop-in replacement. Cambiate il vostro URL base e starete elaborando voce su infrastruttura europea sovrana.

Pronti per iniziare?

5 minuti di trascrizione e sintesi al mese. Nessuna carta di credito richiesta.

Crea un account gratuito

IA Speech-to-Text &Text-to-Speech,costruito per l'Europa.

Modelli vocali

Casi d'uso

Documentazione API

Speech-to-Text

Text-to-Speech

Pronti per iniziare?

IA Speech-to-Text &
Text-to-Speech,
costruito per l'Europa.