Inference Embeddings Rerank Images Speech Guard
EN DE ES

Embeddings IA,
costruiti per l'Europa.

Sede in Germania 100% residenza dati nell'UE

Turn text into vector embeddings on European GPUs.
Power semantic search, RAG, and classification
without your data leaving the EU.

Crea un account gratuito 100K token/mese gratis
// modelli + prezzi

Modelli di Embedding

Eseguiamo la famiglia Qwen3 Embedding, i modelli #1 nella classifica multilingue MTEB. Pesi completamente aperti, 100+ lingue supportate, fino a 32K di lunghezza del contesto. Dimensioni di output flessibili for any use case.

Tutti i modelli funzionano su chip Blackwell moderni o più recenti per prestazioni ideali. Prezzi per milione di token. Piano gratuito incluso su tutti i modelli.

64.3
Qwen3-Embedding-0.6B
Fast, lightweight embeddings. Ideal for high-throughput workloads.
Input: 0,02 € / 1M tokens In arrivo
Parameters0.6B
Context32K tokens
Dimensionsup to 1024
Languages100+
Qwen3-Embd-0.6B
64.3
text-embd-3-lg
58.9
Cohere multi v3
61.1
Gemini Embedding
68.4
69.5
Qwen3-Embedding-4B
Balanced performance and efficiency. Great for production RAG.
Input: 0,06 € / 1M tokens In arrivo
Parameters4B
Context32K tokens
Dimensionsup to 2560
Languages100+
Qwen3-Embd-4B
69.5
text-embd-3-lg
58.9
Cohere multi v3
61.1
Gemini Embedding
68.4
70.6
Qwen3-Embedding-8B
#1 on MTEB multilingual. Maximum quality for critical retrieval.
Input: 0,10 € / 1M tokens In arrivo
Parameters8B
Context32K tokens
Dimensionsup to 4096
Languages100+
Qwen3-Embd-8B
70.6
text-embd-3-lg
58.9
Cohere multi v3
61.1
Gemini Embedding
68.4
Piano gratuito
100K token/mese Tutti i modelli 10 req/min Nessuna carta di credito
// cosa potete costruire

Casi d'uso

Text embeddings are the foundation of modern AI applications. Generate vector representations of text for a wide range of tasks.

Semantic Search
Find relevant documents by meaning, not just keywords. Build search that understands intent across 100+ languages.
Retrieval-Augmented Generation (RAG)
Ground your LLM responses in your own data. Embed documents, retrieve context, generate accurate answers.
Classification & Clustering
Categorize support tickets, group similar content, detect duplicates. Let embeddings do the heavy lifting.
Multilingual Matching
Match content across languages without translation. Ideal for European businesses operating in multiple markets.
// per i team che hanno bisogno di più
Serve di più? Il piano Business copre tutti i prodotti Nodion.ai: Inference, Embeddings e altro. 500 €/month, 50M tokens, dedicated GPU capacity, 99.5% SLA.
Vedi piano Business →
// per iniziare

Documentazione API

The Embeddings API is fully compatible with the OpenAI Embeddings API. Point any OpenAI SDK at our base URL and start generating embeddings.

# Base URL
https://api.nodion.ai/v1
# Example: curl
curl https://api.nodion.ai/v1/embeddings \
  -H "Authorization: Bearer $NODION_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen3-embedding-0.6b",
    "input": "Sovereign AI infrastructure for Europe"
  }'

Supports: /v1/embeddings, /v1/models. Flexible output dimensions via the dimensions parameter.

// perché è importante
GDPR nativo. Non è una casella di conformità, è così che è costruita l'infrastruttura. Nessun dato lascia l'UE. Nessun trasferimento transatlantico. Nessun rischio di decisioni di adeguatezza.
Energia verde nordica. Cluster GPU in Svezia e Finlandia funzionano con energia rinnovabile. Il clima freddo significa raffreddamento naturale, meno spreco energetico, impronta più piccola.
Nessuna dipendenza dagli USA. Azienda tedesca. Server nell'UE. Modelli open source. Sovranità completa senza dipendenza da hyperscaler.
Solo open source. Ogni modello che serviamo è completamente aperto. Potete ispezionare i pesi, comprendere l'architettura e verificare i risultati.
OpenAI-compatible API. Drop-in replacement. Change your base URL and you're running on sovereign European infrastructure.

Pronti per iniziare?

100K token gratuiti al mese. Nessuna carta di credito richiesta. All models inclusi.

Crea un account gratuito