Inference Embeddings Rerank Images Speech Guard
EN DE ES

Reranking IA,
costruito per l'Europa.

Sede in Germania 100% residenza dati nell'UE

Ri-valutate e classificate i documenti con precisione cross-encoder su GPU europee. Migliorate l'accuratezza della vostra pipeline RAG senza che i vostri dati lascino l'UE.

Crea un account gratuito 100K token/mese gratis
// modelli + prezzi

Modelli Reranker

Eseguiamo la famiglia Qwen3 Reranker: modelli cross-encoder instruction-aware che valutano la rilevanza query-documento con alta precisione. 100+ lingue, 32K di contesto. Perfetti come seconda fase dopo la ricerca con embeddings.

Tutti i modelli funzionano su chip Blackwell moderni o più recenti per prestazioni ideali. Prezzi per milione di token. Piano gratuito incluso su tutti i modelli.

65.8
Qwen3-Reranker-0.6B
Reranking veloce e leggero. Ideale per pipeline RAG ad alto throughput.
Input: 0,02 € / 1M tokens In arrivo
Parameters0.6B
Context32K tokens
Languages100+
Scoringyes/no logits
Qwen3-Reranker-0.6B
65.8
Cohere Rerank v3
67.1
bge-reranker-v2
62.4
Jina Reranker v2
63.8
72.1
Qwen3-Reranker-4B
Miglior equilibrio tra velocità e accuratezza. Pronto per la produzione RAG.
Input: 0,06 € / 1M tokens In arrivo
Parameters4B
Context32K tokens
Languages100+
Scoringyes/no logits
Qwen3-Reranker-4B
72.1
Cohere Rerank v3
67.1
bge-reranker-v2
62.4
Jina Reranker v2
63.8
72.9
Qwen3-Reranker-8B
Massima qualità di reranking per carichi di recupero critici.
Input: 0,10 € / 1M tokens In arrivo
Parameters8B
Context32K tokens
Languages100+
Scoringyes/no logits
Qwen3-Reranker-8B
72.9
Cohere Rerank v3
67.1
bge-reranker-v2
62.4
Jina Reranker v2
63.8
Piano gratuito
100K token/mese Tutti i modelli 10 req/min Nessuna carta di credito
// cosa potete costruire

Casi d'uso

Il reranking è il livello di precisione nei moderni sistemi di recupero. Aggiungete un reranker dopo la ricerca con embeddings per migliorare drasticamente la rilevanza.

Ottimizzazione Pipeline RAG
Recuperate 20 candidati con gli embeddings, ri-classificate ai primi 5. Il vostro LLM riceve solo il contesto più rilevante, producendo risposte migliori con meno rumore.
Ricerca Aziendale
Migliorate l'accuratezza della ricerca per basi di conoscenza interne, documenti legali e portali di supporto. Lo scoring cross-encoder comprende le sfumature che la ricerca per parole chiave e vettoriale non coglie.
Recupero Multilingue
Ri-classificate documenti in diverse lingue senza traduzione. Interrogate in tedesco, trovate documenti in inglese, valutate per rilevanza. Ideale per carichi di lavoro multilingue europei.
E-Commerce & Raccomandazioni
Ri-valutate i risultati di ricerca dei prodotti per vera rilevanza rispetto alla query. Migliorate la conversione mostrando i prodotti giusti, non solo quelli simili.
// per i team che hanno bisogno di più
Serve di più? Il piano Business copre tutti i prodotti Nodion.ai: Inference, Embeddings e altro. 500 €/mese, 50M token, capacità GPU dedicata, SLA 99,5%.
Vedi piano Business →
// per iniziare

Documentazione API

L'API di Reranking utilizza un semplice endpoint di scoring. Inviate una query e un elenco di documenti, ricevete i punteggi di rilevanza.

# Base URL
https://api.nodion.ai/v1
# Example: curl
curl https://api.nodion.ai/v1/rerank \
  -H "Authorization: Bearer $NODION_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen3-reranker-0.6b",
    "query": "How do I cancel my subscription?",
    "documents": [
      "To cancel, go to Settings > Billing > Cancel Plan.",
      "Our pricing starts at 10 EUR per month.",
      "You can upgrade your plan at any time."
    ],
    "top_n": 2
  }'

Restituisce punteggi di rilevanza (0-1) per ogni documento. Supporta il reranking instruction-aware tramite il parametro instruction.

// perché è importante
GDPR nativo. Non è una casella di conformità, è così che è costruita l'infrastruttura. Nessun dato lascia l'UE. Nessun trasferimento transatlantico. Nessun rischio di decisioni di adeguatezza.
Energia verde nordica. Cluster GPU in Svezia e Finlandia funzionano con energia rinnovabile. Il clima freddo significa raffreddamento naturale, meno spreco energetico, impronta più piccola.
Nessuna dipendenza dagli USA. Azienda tedesca. Server nell'UE. Modelli open source. Sovranità completa senza dipendenza da hyperscaler.
Solo open source. Ogni modello che serviamo è completamente aperto. Potete ispezionare i pesi, comprendere l'architettura e verificare i risultati.
API compatibile con OpenAI. Sostituzione diretta. Cambiate il vostro base URL e state già funzionando su infrastruttura europea sovrana.

Pronti per iniziare?

100K token gratuiti al mese. Nessuna carta di credito richiesta. Tutti i modelli inclusi.

Crea un account gratuito