UIUIAPI AI调用代码示例
  1. 🔄 重排序(Rerank)
UIUIAPI AI调用代码示例
  • UIUIAPI聚合平台AI api调用说明
  • 💬 聊天(Chat)
    • OpenAI 对话格式(Chat Completions)
    • OpenAI 响应格式(Responses)
    • OpenAI 对话格式(Python)
    • Anthropic 对话格式(Messages)
    • Anthropic 对话格式(Python)
    • Deepseek reasoning 对话格式(类Chat Completions)
    • Google Gemini 对话格式(Generate Content)
  • 🔤 嵌入(Embeddings)
    • OpenAI 嵌入格式(Embeddings)
  • 🔄 重排序(Rerank)
    • Jina AI 重排序格式(Rerank)
    • Cohere 重排序格式(Rerank)
    • Xinference 重排序格式(Rerank)
  • ⚡ 实时对话(Realtime)
    • OpenAI 实时对话接口
  • 🖼️ 图像(Image)
    • OpenAI 图像格式(Dall·E)
    • Midjourney 图像格式(Midjourney Proxy/Midjourney Proxy Plus)
    • GPT-4o生图格式
    • GPT 编图格式
  • 🔊 音频(Audio)
    • OpenAI 音频格式
  • 🎵 音乐(Music)
    • Suno 音乐格式(Music)
  • 🤖AI在线工具
    • UIUIChat在线助手使用教程
  1. 🔄 重排序(Rerank)

Cohere 重排序格式(Rerank)

重要提示
cohere 的 Rerank 模型接口和 Jina的Rerank模型接口格式 是一样的。
官方文档
Cohere Rerank

📝 简介#

给定查询和文本列表,重排序API将根据与查询的相关性对文本进行排序。每个文本都会被分配一个相关性分数,从而产生一个有序的数组结果。此功能特别适用于搜索和检索应用,可以优化文档的排序,帮助用户更快找到相关信息。

💡 请求示例#

基础重排序请求 ✅#

响应示例:

使用结构化数据 ✅#

响应示例:

📮 请求#

端点#

根据与查询的相关性对文本列表进行重新排序。

鉴权方法#

在请求头中包含以下内容进行 API 密钥认证:
其中 $UIUIAPI_API_KEY 是您的 API 密钥。

请求头参数#

X-Client-Name#

类型:字符串
必需:否
说明:发起请求的项目名称。

请求体参数#

model#

类型:字符串
必需:是
说明:要使用的模型标识符,例如 rerank-v3.5。

query#

类型:字符串
必需:是
说明:搜索查询文本。这是用户输入的问题或查询内容。

documents#

类型:字符串数组
必需:是
说明:将与查询进行比较的文本列表。为获得最佳性能,建议单个请求中不要发送超过1,000个文档。
注意事项:
长文档将自动截断为 max_tokens_per_doc 指定的值
结构化数据应格式化为YAML字符串以获得最佳性能

top_n#

类型:整数
必需:否
说明:限制返回的重排结果数量。如果不指定,将返回所有重排结果。

max_tokens_per_doc#

类型:整数
必需:否
默认值:4096
说明:长文档将自动截断为指定的令牌数量。

📥 响应#

成功响应#

返回一个包含排序后文档列表的对象。

results#

类型:对象数组
说明:排序后的文档列表,按相关性降序排列
属性:
index: 整数,对应于原始文档列表中文档的索引
relevance_score: 浮点数,相关性分数范围为[0, 1]。接近1的分数表示与查询高度相关,接近0的分数表示相关性较低

id#

类型:字符串
说明:请求的唯一标识符

meta#

类型:对象
说明:包含关于请求的元数据
属性:
api_version: 对象,包含API版本信息
version: 字符串,API版本号
is_deprecated: 布尔值,是否已弃用
is_experimental: 布尔值,是否为实验性功能
billed_units: 对象,包含计费信息
search_units: 浮点数,计费的搜索单位数
tokens: 对象,包含令牌使用统计
input_tokens: 浮点数,作为模型输入的令牌数
output_tokens: 浮点数,模型产生的令牌数

warnings#

类型:字符串数组
必需:否
说明:API返回的警告信息

错误响应#

当请求出现问题时,API可能返回以下HTTP状态码及相应错误:
400 Bad Request: 请求格式或参数错误
401 Unauthorized: 未提供有效的API密钥
403 Forbidden: 没有权限访问此资源
404 Not Found: 请求的资源不存在
422 Unprocessable Entity: 请求格式正确但包含语义错误
429 Too Many Requests: 请求频率超过限制
500 Internal Server Error: 服务器内部错误
503 Service Unavailable: 服务暂时不可用

🌟 最佳实践#

文档准备建议#

1.
文档长度:每个文档保持简洁明了,避免过长。长文档会被自动截断。
2.
结构化数据:将结构化数据格式化为YAML字符串,以获得最佳性能。例如:
title: 产品名称 price: 9999元 features: - 特性1 - 特性2
3.
文档数量:单次请求中不要超过1,000个文档,以获得最佳性能。

查询优化#

1.
明确具体:制定明确、具体的查询,以获得更准确的排序结果。
2.
避免模糊查询:尽量避免过于模糊或通用的查询词,这可能导致相关性分数差异不明显。

理解相关性分数#

相关性分数是归一化到[0, 1]范围内的值:
接近1的分数表示与查询高度相关
接近0的分数表示相关性低
注意:不能简单地认为分数0.9的文档比分数0.45的文档相关性高2倍。相关性分数是一个相对指标,用于排序,而非绝对比较。
​
修改于 2025-05-17 14:05:26
上一页
Jina AI 重排序格式(Rerank)
下一页
Xinference 重排序格式(Rerank)
Built with