Inference Embeddings Rerank Images Speech Guard
EN ES IT

Souveränes KI-Reranking,
entwickelt für Europa.

Hauptsitz Deutschland 100% EU-Datenresidenz

Bewerten und sortieren Sie Dokumente mit Cross-Encoder-Präzision auf europäischen GPUs. Steigern Sie die Genauigkeit Ihrer RAG-Pipeline, ohne dass Ihre Daten die EU verlassen.

Kostenloses Konto erstellen 100K Tokens/Monat kostenlos
// Modelle + Preise

Reranker-Modelle

Wir betreiben die Qwen3 Reranker-Familie: instruktionsbasierte Cross-Encoder-Modelle, die Anfrage-Dokument-Relevanz mit hoher Präzision bewerten. 100+ Sprachen, 32K Kontext. Perfekt als zweite Stufe nach der Embedding-Suche.

Alle Modelle laufen auf modernen Blackwell- oder neueren Chips für optimale Leistung. Preise pro Million Tokens. Free Tier bei allen Modellen inklusive.

65.8
Qwen3-Reranker-0.6B
Schnelles, leichtgewichtiges Reranking. Ideal für RAG-Pipelines mit hohem Durchsatz.
Input: 0,02 € / 1M tokens Coming soon
Parameter0.6B
Kontext32K tokens
Sprachen100+
Bewertungyes/no logits
Qwen3-Reranker-0.6B
65.8
Cohere Rerank v3
67.1
bge-reranker-v2
62.4
Jina Reranker v2
63.8
72.1
Qwen3-Reranker-4B
Beste Balance aus Geschwindigkeit und Genauigkeit. Produktionsreif für RAG.
Input: 0,06 € / 1M tokens Coming soon
Parameter4B
Kontext32K tokens
Sprachen100+
Bewertungyes/no logits
Qwen3-Reranker-4B
72.1
Cohere Rerank v3
67.1
bge-reranker-v2
62.4
Jina Reranker v2
63.8
72.9
Qwen3-Reranker-8B
Maximale Reranking-Qualität für kritische Retrieval-Workloads.
Input: 0,10 € / 1M tokens Coming soon
Parameter8B
Kontext32K tokens
Sprachen100+
Bewertungyes/no logits
Qwen3-Reranker-8B
72.9
Cohere Rerank v3
67.1
bge-reranker-v2
62.4
Jina Reranker v2
63.8
Free Tier
100K Tokens/Monat Alle Modelle 10 req/min Keine Kreditkarte nötig
// was Sie damit bauen können

Anwendungsfälle

Reranking ist die Präzisionsschicht in modernen Retrieval-Systemen. Fügen Sie einen Reranker nach der Embedding-Suche hinzu, um die Relevanz drastisch zu verbessern.

RAG-Pipeline-Optimierung
Rufen Sie 20 Kandidaten mit Embeddings ab, reranken Sie auf die Top 5. Ihr LLM erhält nur den relevantesten Kontext und liefert bessere Antworten mit weniger Rauschen.
Unternehmenssuche
Steigern Sie die Suchgenauigkeit für interne Wissensdatenbanken, Rechtsdokumente und Support-Portale. Cross-Encoder-Bewertung erkennt Nuancen, die Keyword- und Vektorsuche übersehen.
Mehrsprachiges Retrieval
Reranken Sie Dokumente sprachübergreifend ohne Übersetzung. Anfrage auf Deutsch, englische Dokumente abgleichen, nach Relevanz bewerten. Ideal für europäische mehrsprachige Workloads.
E-Commerce & Empfehlungen
Bewerten Sie Produktsuchergebnisse nach tatsächlicher Relevanz zur Anfrage neu. Verbessern Sie die Conversion, indem Sie die richtigen Produkte anzeigen, nicht nur ähnliche.
// für Teams, die mehr brauchen
Mehr benötigt? Der Business-Tarif deckt alle Nodion.ai-Produkte ab: Inference, Embeddings und mehr. 500 €/Monat, 50M Tokens, dedizierte GPU-Kapazität, 99,5 % SLA.
Business-Tarif ansehen →
// Erste Schritte

API-Dokumentation

Die Reranking API verwendet einen einfachen Scoring-Endpunkt. Senden Sie eine Anfrage und eine Liste von Dokumenten, erhalten Sie Relevanzwerte zurück.

# Base URL
https://api.nodion.ai/v1
# Beispiel: curl
curl https://api.nodion.ai/v1/rerank \
  -H "Authorization: Bearer $NODION_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen3-reranker-0.6b",
    "query": "How do I cancel my subscription?",
    "documents": [
      "To cancel, go to Settings > Billing > Cancel Plan.",
      "Our pricing starts at 10 EUR per month.",
      "You can upgrade your plan at any time."
    ],
    "top_n": 2
  }'

Gibt Relevanzwerte (0-1) für jedes Dokument zurück. Unterstützt instruktionsbasiertes Reranking über den instruction-Parameter.

// warum das wichtig ist
DSGVO-nativ. Kein Compliance-Häkchen, sondern Architekturprinzip. Keine Daten verlassen die EU. Keine transatlantischen Transfers. Keine Angemessenheitsbeschluss-Risiken.
Nordische grüne Energie. GPU-Cluster in Schweden und Finnland laufen mit erneuerbarer Energie. Kaltes Klima bedeutet natürliche Kühlung, weniger Energieverschwendung, kleinerer Fußabdruck.
Keine US-Abhängigkeit. Deutsches Unternehmen. EU-Server. Open-Source-Modelle. Volle Souveränität ohne Hyperscaler-Abhängigkeit.
Nur Open Source. Jedes Modell, das wir betreiben, ist vollständig offen. Sie können die Gewichte einsehen, die Architektur verstehen und die Ausgaben überprüfen.
OpenAI-kompatible API. Drop-in-Ersatz. Ändern Sie Ihre Base-URL und Sie laufen auf souveräner europäischer Infrastruktur.

Bereit loszulegen?

100K kostenlose Tokens pro Monat. Keine Kreditkarte erforderlich. Alle Modelle inklusive.

Kostenloses Konto erstellen