Reranking is a second-stage retrieval step that re-scores documents against a query using a cross-encoder model. It significantly improves precision over embedding-only search by evaluating query-document pairs directly.

Is the Nodion.ai Reranking API GDPR-compliant?

Yes. Like all Nodion.ai services, the Reranking API runs entirely on EU-based GPU infrastructure in Sweden and Finland. No data leaves the EU. Operated by Nodion GmbH, a German company.

How does reranking improve RAG?

In a RAG pipeline, embedding search retrieves a broad set of candidates quickly. A reranker then scores each candidate against the query with higher accuracy, selecting only the most relevant chunks for the LLM. This reduces noise and improves answer quality.

What reranking models does Nodion.ai offer?

Nodion.ai offers the Qwen3 Reranker model family in three sizes: 0.6B, 4B, and 8B. All models support 32K context, 100+ languages, and instruction-aware reranking. The models predict relevance scores between 0 and 1 for query-document pairs.

Inference Embeddings Rerank Images Speech Guard

Reranking IA,
costruito per l'Europa.

Sede in Germania 100% residenza dati nell'UE

Ri-valutate e classificate i documenti con precisione cross-encoder su GPU europee. Migliorate l'accuratezza della vostra pipeline RAG senza che i vostri dati lascino l'UE.

Crea un account gratuito 100K token/mese gratis

// modelli + prezzi

Modelli Reranker

Eseguiamo la famiglia Qwen3 Reranker: modelli cross-encoder instruction-aware che valutano la rilevanza query-documento con alta precisione. 100+ lingue, 32K di contesto. Perfetti come seconda fase dopo la ricerca con embeddings.

Tutti i modelli funzionano su chip Blackwell moderni o più recenti per prestazioni ideali. Prezzi per milione di token. Piano gratuito incluso su tutti i modelli.

Qwen

65.8

Qwen3-Reranker-0.6B

Reranking veloce e leggero. Ideale per pipeline RAG ad alto throughput.

Input: 0,02 € / 1M tokens In arrivo

Parameters0.6B

Context32K tokens

Languages100+

Scoringyes/no logits

Qwen3-Reranker-0.6B

65.8

Cohere Rerank v3

67.1

bge-reranker-v2

62.4

Jina Reranker v2

63.8

72.1

Qwen3-Reranker-4B

Miglior equilibrio tra velocità e accuratezza. Pronto per la produzione RAG.

Input: 0,06 € / 1M tokens In arrivo

Parameters4B

Context32K tokens

Languages100+

Scoringyes/no logits

Qwen3-Reranker-4B

72.1

Cohere Rerank v3

67.1

bge-reranker-v2

62.4

Jina Reranker v2

63.8

72.9

Qwen3-Reranker-8B

Massima qualità di reranking per carichi di recupero critici.

Input: 0,10 € / 1M tokens In arrivo

Parameters8B

Context32K tokens

Languages100+

Scoringyes/no logits

Qwen3-Reranker-8B

72.9

Cohere Rerank v3

67.1

bge-reranker-v2

62.4

Jina Reranker v2

63.8

Piano gratuito

100K token/mese Tutti i modelli 10 req/min Nessuna carta di credito

// cosa potete costruire

Casi d'uso

Il reranking è il livello di precisione nei moderni sistemi di recupero. Aggiungete un reranker dopo la ricerca con embeddings per migliorare drasticamente la rilevanza.

Ottimizzazione Pipeline RAG

Recuperate 20 candidati con gli embeddings, ri-classificate ai primi 5. Il vostro LLM riceve solo il contesto più rilevante, producendo risposte migliori con meno rumore.

Ricerca Aziendale

Migliorate l'accuratezza della ricerca per basi di conoscenza interne, documenti legali e portali di supporto. Lo scoring cross-encoder comprende le sfumature che la ricerca per parole chiave e vettoriale non coglie.

Recupero Multilingue

Ri-classificate documenti in diverse lingue senza traduzione. Interrogate in tedesco, trovate documenti in inglese, valutate per rilevanza. Ideale per carichi di lavoro multilingue europei.

E-Commerce & Raccomandazioni

Ri-valutate i risultati di ricerca dei prodotti per vera rilevanza rispetto alla query. Migliorate la conversione mostrando i prodotti giusti, non solo quelli simili.

// per i team che hanno bisogno di più

Serve di più? Il piano Business copre tutti i prodotti Nodion.ai: Inference, Embeddings e altro. 500 €/mese, 50M token, capacità GPU dedicata, SLA 99,5%.

Vedi piano Business →

// per iniziare

Documentazione API

L'API di Reranking utilizza un semplice endpoint di scoring. Inviate una query e un elenco di documenti, ricevete i punteggi di rilevanza.

            # Base URL

            https://api.nodion.ai/v1

            # Example: curl

            curl https://api.nodion.ai/v1/rerank \

              -H "Authorization: Bearer $NODION_API_KEY" \

              -H "Content-Type: application/json" \

              -d '{

                "model": "qwen/qwen3-reranker-0.6b",

                "query": "How do I cancel my subscription?",

                "documents": [

                  "To cancel, go to Settings > Billing > Cancel Plan.",

                  "Our pricing starts at 10 EUR per month.",

                  "You can upgrade your plan at any time."

                ],

                "top_n": 2

              }'

Restituisce punteggi di rilevanza (0-1) per ogni documento. Supporta il reranking instruction-aware tramite il parametro instruction.

// perché è importante

GDPR nativo. Non è una casella di conformità, è così che è costruita l'infrastruttura. Nessun dato lascia l'UE. Nessun trasferimento transatlantico. Nessun rischio di decisioni di adeguatezza.

Energia verde nordica. Cluster GPU in Svezia e Finlandia funzionano con energia rinnovabile. Il clima freddo significa raffreddamento naturale, meno spreco energetico, impronta più piccola.

Nessuna dipendenza dagli USA. Azienda tedesca. Server nell'UE. Modelli open source. Sovranità completa senza dipendenza da hyperscaler.

Solo open source. Ogni modello che serviamo è completamente aperto. Potete ispezionare i pesi, comprendere l'architettura e verificare i risultati.

API compatibile con OpenAI. Sostituzione diretta. Cambiate il vostro base URL e state già funzionando su infrastruttura europea sovrana.

Pronti per iniziare?

100K token gratuiti al mese. Nessuna carta di credito richiesta. Tutti i modelli inclusi.

Crea un account gratuito

Reranking IA,costruito per l'Europa.

Modelli Reranker

Casi d'uso

Documentazione API

Pronti per iniziare?

Reranking IA,
costruito per l'Europa.