Reranking ist ein zweistufiger Retrieval-Schritt, der Dokumente anhand einer Anfrage mit einem Cross-Encoder-Modell neu bewertet. Es verbessert die Präzision gegenüber reiner Embedding-Suche erheblich, indem Anfrage-Dokument-Paare direkt ausgewertet werden.

Ist die Nodion.ai Reranking API DSGVO-konform?

Ja. Wie alle Nodion.ai-Dienste läuft die Reranking API vollständig auf EU-basierter GPU-Infrastruktur in Schweden und Finnland. Keine Daten verlassen die EU. Betrieben von der Nodion GmbH, einem deutschen Unternehmen.

Wie verbessert Reranking RAG?

In einer RAG-Pipeline ruft die Embedding-Suche schnell eine breite Menge an Kandidaten ab. Ein Reranker bewertet dann jeden Kandidaten mit höherer Genauigkeit gegen die Anfrage und wählt nur die relevantesten Abschnitte für das LLM aus. Das reduziert Rauschen und verbessert die Antwortqualität.

Welche Reranking-Modelle bietet Nodion.ai an?

Nodion.ai bietet die Qwen3 Reranker-Modellfamilie in drei Größen: 0.6B, 4B und 8B. Alle Modelle unterstützen 32K Kontext, 100+ Sprachen und instruktionsbasiertes Reranking. Die Modelle sagen Relevanzwerte zwischen 0 und 1 für Anfrage-Dokument-Paare vorher.

Inference Embeddings Rerank Images Speech Guard

Souveränes KI-Reranking,
entwickelt für Europa.

Hauptsitz Deutschland 100% EU-Datenresidenz

Bewerten und sortieren Sie Dokumente mit Cross-Encoder-Präzision auf europäischen GPUs. Steigern Sie die Genauigkeit Ihrer RAG-Pipeline, ohne dass Ihre Daten die EU verlassen.

Kostenloses Konto erstellen 100K Tokens/Monat kostenlos

// Modelle + Preise

Reranker-Modelle

Wir betreiben die Qwen3 Reranker-Familie: instruktionsbasierte Cross-Encoder-Modelle, die Anfrage-Dokument-Relevanz mit hoher Präzision bewerten. 100+ Sprachen, 32K Kontext. Perfekt als zweite Stufe nach der Embedding-Suche.

Alle Modelle laufen auf modernen Blackwell- oder neueren Chips für optimale Leistung. Preise pro Million Tokens. Free Tier bei allen Modellen inklusive.

Qwen

65.8

Qwen3-Reranker-0.6B

Schnelles, leichtgewichtiges Reranking. Ideal für RAG-Pipelines mit hohem Durchsatz.

Input: 0,02 € / 1M tokens Coming soon

Parameter0.6B

Kontext32K tokens

Sprachen100+

Bewertungyes/no logits

Qwen3-Reranker-0.6B

65.8

Cohere Rerank v3

67.1

bge-reranker-v2

62.4

Jina Reranker v2

63.8

72.1

Qwen3-Reranker-4B

Beste Balance aus Geschwindigkeit und Genauigkeit. Produktionsreif für RAG.

Input: 0,06 € / 1M tokens Coming soon

Parameter4B

Kontext32K tokens

Sprachen100+

Bewertungyes/no logits

Qwen3-Reranker-4B

72.1

Cohere Rerank v3

67.1

bge-reranker-v2

62.4

Jina Reranker v2

63.8

72.9

Qwen3-Reranker-8B

Maximale Reranking-Qualität für kritische Retrieval-Workloads.

Input: 0,10 € / 1M tokens Coming soon

Parameter8B

Kontext32K tokens

Sprachen100+

Bewertungyes/no logits

Qwen3-Reranker-8B

72.9

Cohere Rerank v3

67.1

bge-reranker-v2

62.4

Jina Reranker v2

63.8

Free Tier

100K Tokens/Monat Alle Modelle 10 req/min Keine Kreditkarte nötig

// was Sie damit bauen können

Anwendungsfälle

Reranking ist die Präzisionsschicht in modernen Retrieval-Systemen. Fügen Sie einen Reranker nach der Embedding-Suche hinzu, um die Relevanz drastisch zu verbessern.

RAG-Pipeline-Optimierung

Rufen Sie 20 Kandidaten mit Embeddings ab, reranken Sie auf die Top 5. Ihr LLM erhält nur den relevantesten Kontext und liefert bessere Antworten mit weniger Rauschen.

Unternehmenssuche

Steigern Sie die Suchgenauigkeit für interne Wissensdatenbanken, Rechtsdokumente und Support-Portale. Cross-Encoder-Bewertung erkennt Nuancen, die Keyword- und Vektorsuche übersehen.

Mehrsprachiges Retrieval

Reranken Sie Dokumente sprachübergreifend ohne Übersetzung. Anfrage auf Deutsch, englische Dokumente abgleichen, nach Relevanz bewerten. Ideal für europäische mehrsprachige Workloads.

E-Commerce & Empfehlungen

Bewerten Sie Produktsuchergebnisse nach tatsächlicher Relevanz zur Anfrage neu. Verbessern Sie die Conversion, indem Sie die richtigen Produkte anzeigen, nicht nur ähnliche.

// für Teams, die mehr brauchen

Mehr benötigt? Der Business-Tarif deckt alle Nodion.ai-Produkte ab: Inference, Embeddings und mehr. 500 €/Monat, 50M Tokens, dedizierte GPU-Kapazität, 99,5 % SLA.

Business-Tarif ansehen →

// Erste Schritte

API-Dokumentation

Die Reranking API verwendet einen einfachen Scoring-Endpunkt. Senden Sie eine Anfrage und eine Liste von Dokumenten, erhalten Sie Relevanzwerte zurück.

            # Base URL

            https://api.nodion.ai/v1

            # Beispiel: curl

            curl https://api.nodion.ai/v1/rerank \

              -H "Authorization: Bearer $NODION_API_KEY" \

              -H "Content-Type: application/json" \

              -d '{

                "model": "qwen/qwen3-reranker-0.6b",

                "query": "How do I cancel my subscription?",

                "documents": [

                  "To cancel, go to Settings > Billing > Cancel Plan.",

                  "Our pricing starts at 10 EUR per month.",

                  "You can upgrade your plan at any time."

                ],

                "top_n": 2

              }'

Gibt Relevanzwerte (0-1) für jedes Dokument zurück. Unterstützt instruktionsbasiertes Reranking über den instruction-Parameter.

// warum das wichtig ist

DSGVO-nativ. Kein Compliance-Häkchen, sondern Architekturprinzip. Keine Daten verlassen die EU. Keine transatlantischen Transfers. Keine Angemessenheitsbeschluss-Risiken.

Nordische grüne Energie. GPU-Cluster in Schweden und Finnland laufen mit erneuerbarer Energie. Kaltes Klima bedeutet natürliche Kühlung, weniger Energieverschwendung, kleinerer Fußabdruck.

Keine US-Abhängigkeit. Deutsches Unternehmen. EU-Server. Open-Source-Modelle. Volle Souveränität ohne Hyperscaler-Abhängigkeit.

Nur Open Source. Jedes Modell, das wir betreiben, ist vollständig offen. Sie können die Gewichte einsehen, die Architektur verstehen und die Ausgaben überprüfen.

OpenAI-kompatible API. Drop-in-Ersatz. Ändern Sie Ihre Base-URL und Sie laufen auf souveräner europäischer Infrastruktur.

Bereit loszulegen?

100K kostenlose Tokens pro Monat. Keine Kreditkarte erforderlich. Alle Modelle inklusive.

Kostenloses Konto erstellen

Souveränes KI-Reranking,entwickelt für Europa.

Reranker-Modelle

Anwendungsfälle

API-Dokumentation

Bereit loszulegen?

Souveränes KI-Reranking,
entwickelt für Europa.