Inference Embeddings Rerank Images Speech Guard
EN DE IT

Reranking IA soberano,
hecho para Europa.

Sede en Alemania 100% residencia de datos en la UE

Repuntúe y clasifique documentos con precisión cross-encoder en GPUs europeas. Mejore la precisión de su pipeline RAG sin que sus datos salgan de la UE.

Crear cuenta gratuita 100K tokens/mes gratis
// modelos + precios

Modelos de Reranker

Ejecutamos la familia Qwen3 Reranker: modelos cross-encoder con instrucciones que puntúan la relevancia consulta-documento con alta precisión. 100+ idiomas, 32K de contexto. Perfecto como segunda etapa tras la búsqueda por embeddings.

Todos los modelos funcionan en chips Blackwell modernos o más recientes para un rendimiento ideal. Precios por millón de tokens. Plan gratuito incluido en todos los modelos.

65.8
Qwen3-Reranker-0.6B
Fast, lightweight reranking. Ideal for high-throughput RAG pipelines.
Input: 0,02 € / 1M tokens Próximamente
Parameters0.6B
Context32K tokens
Languages100+
Scoringyes/no logits
Qwen3-Reranker-0.6B
65.8
Cohere Rerank v3
67.1
bge-reranker-v2
62.4
Jina Reranker v2
63.8
72.1
Qwen3-Reranker-4B
Best balance of speed and accuracy. Production-ready for RAG.
Input: 0,06 € / 1M tokens Próximamente
Parameters4B
Context32K tokens
Languages100+
Scoringyes/no logits
Qwen3-Reranker-4B
72.1
Cohere Rerank v3
67.1
bge-reranker-v2
62.4
Jina Reranker v2
63.8
72.9
Qwen3-Reranker-8B
Maximum reranking quality for critical retrieval workloads.
Input: 0,10 € / 1M tokens Próximamente
Parameters8B
Context32K tokens
Languages100+
Scoringyes/no logits
Qwen3-Reranker-8B
72.9
Cohere Rerank v3
67.1
bge-reranker-v2
62.4
Jina Reranker v2
63.8
Plan gratuito
100K tokens/mes Todos los modelos 10 req/min Sin tarjeta de crédito
// qué puede construir

Casos de uso

El reranking es la capa de precisión en los sistemas de recuperación modernos. Añada un reranker tras la búsqueda por embeddings para mejorar drásticamente la relevancia.

Optimización de pipelines RAG
Recupere 20 candidatos con embeddings, reordene hasta los 5 mejores. Su LLM recibe solo el contexto más relevante, produciendo mejores respuestas con menos ruido.
Búsqueda empresarial
Mejore la precisión de búsqueda en bases de conocimiento internas, documentos legales y portales de soporte. La puntuación cross-encoder entiende matices que la búsqueda por palabras clave y vectores no captura.
Recuperación multilingüe
Reordene documentos entre idiomas sin traducción. Consulte en alemán, encuentre documentos en inglés, puntúe por relevancia. Ideal para cargas de trabajo multilingües europeas.
E-Commerce & Recomendaciones
Repuntúe los resultados de búsqueda de productos por relevancia real respecto a la consulta. Mejore la conversión mostrando los productos correctos, no solo los similares.
// para equipos que necesitan más
¿Necesita más? El plan Business cubre todos los productos Nodion.ai: Inference, Embeddings y más. 500 €/mes, 50M tokens, capacidad GPU dedicada, 99.5% SLA.
Ver plan Business →
// primeros pasos

Documentación API

La API de Reranking utiliza un endpoint de puntuación simple. Envíe una consulta y una lista de documentos, reciba puntuaciones de relevancia.

# Base URL
https://api.nodion.ai/v1
# Example: curl
curl https://api.nodion.ai/v1/rerank \
  -H "Authorization: Bearer $NODION_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen3-reranker-0.6b",
    "query": "How do I cancel my subscription?",
    "documents": [
      "To cancel, go to Settings > Billing > Cancel Plan.",
      "Our pricing starts at 10 EUR per month.",
      "You can upgrade your plan at any time."
    ],
    "top_n": 2
  }'

Returns relevance scores (0-1) for each document. Supports instruction-aware reranking via the instruction parameter.

// por qué es importante
GDPR nativo. No es una casilla de cumplimiento, es cómo está construida la infraestructura. Ningún dato sale de la UE. Sin transferencias transatlánticas. Sin riesgos de decisiones de adecuación.
Energía verde nórdica. Clústeres GPU en Suecia y Finlandia funcionan con energía renovable. El clima frío significa refrigeración natural, menos desperdicio energético, menor huella.
Sin dependencia de EE.UU. Empresa alemana. Servidores en la UE. Modelos open source. Soberanía total sin dependencia de hyperscalers.
Solo open source. Cada modelo que servimos es completamente abierto. Puede inspeccionar los pesos, entender la arquitectura y auditar los resultados.
API compatible con OpenAI. Reemplazo directo. Cambie su URL base y estará ejecutando sobre infraestructura europea soberana.

¿Listo para empezar?

100K tokens gratuitos al mes. Sin tarjeta de crédito. Todos los modelos incluidos.

Crear cuenta gratuita