针对大语言模型(LLM)在零样本重排序任务中存在的标签语义理解不足、关系建模模糊和计算成本过高的问题,提出基于层次过滤与标签语义扩展的重排序方法HFLS(Hierarchical Filtering and Label Semantics)。该方法构建多级标签语义扩展路...针对大语言模型(LLM)在零样本重排序任务中存在的标签语义理解不足、关系建模模糊和计算成本过高的问题,提出基于层次过滤与标签语义扩展的重排序方法HFLS(Hierarchical Filtering and Label Semantics)。该方法构建多级标签语义扩展路径,并设计“关键词匹配→语义关联→领域知识整合”的递进式提示策略引导LLM实现深度相关性推理;同时,引入分层过滤机制,在降低计算复杂度的同时保留高潜力候选文档。实验结果表明:在TRECDL2019等7个基准数据集上,HFLS相较于Pointwise.qg、Pointwise.yes_no和Pointwise.3Label等Pointwise方法的NDCG@10(归一化折损累积增益)指标分别平均提升了21.92%、13.43%和8.59%;而在推理效率方面,HFLS的单个查询处理时延较Listwise方法、Pairwise方法和Setwise方法分别降低了91.06%、68.87%和33.54%。展开更多
文摘针对大语言模型(LLM)在零样本重排序任务中存在的标签语义理解不足、关系建模模糊和计算成本过高的问题,提出基于层次过滤与标签语义扩展的重排序方法HFLS(Hierarchical Filtering and Label Semantics)。该方法构建多级标签语义扩展路径,并设计“关键词匹配→语义关联→领域知识整合”的递进式提示策略引导LLM实现深度相关性推理;同时,引入分层过滤机制,在降低计算复杂度的同时保留高潜力候选文档。实验结果表明:在TRECDL2019等7个基准数据集上,HFLS相较于Pointwise.qg、Pointwise.yes_no和Pointwise.3Label等Pointwise方法的NDCG@10(归一化折损累积增益)指标分别平均提升了21.92%、13.43%和8.59%;而在推理效率方面,HFLS的单个查询处理时延较Listwise方法、Pairwise方法和Setwise方法分别降低了91.06%、68.87%和33.54%。